国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

HBase數(shù)據(jù)遷移(阿里云到騰訊云實戰(zhàn))

這篇具有很好參考價值的文章主要介紹了HBase數(shù)據(jù)遷移(阿里云到騰訊云實戰(zhàn))。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

背景:需要把阿里云的客戶數(shù)據(jù)遷移到騰訊云環(huán)境;騰訊云環(huán)境已經(jīng)部分新客戶的數(shù)據(jù)。

為了保證遷移到騰訊云的歷史客戶,依然能訪問到他們的歷史數(shù)據(jù);需要注意遷移后不能覆蓋騰訊云環(huán)境的表數(shù)據(jù)(即增量遷移),同時要求不能停表停服務(wù)。

方案選型:

1.distcp 需要停表停服務(wù);

2.Import/Export 比較穩(wěn)妥,先下載文件,后傳到騰訊云環(huán)境;

3.snapshot 速度快,需要目標(biāo)集群沒有該表;

4.從歸檔的歷史數(shù)據(jù)通過代碼寫入,工作量大;

5.replication 方式,只能實現(xiàn)主集群變更,實時同步給目標(biāo)集群;

實施:

1.將阿里云環(huán)境的user表最近兩年的版本號為1的數(shù)據(jù)下載為壓縮文件;

nohup hbase org.apache.hadoop.hbase.mapreduce.Export \
-D mapreduce.output.fileoutputformat.compress=true \
-D mapreduce.output.fileoutputformat.compress.codec=org.apache.hadoop.io.compress.GzipCodec \
-D mapreduce.output.fileoutputformat.compress.type=BLOCK \
-Ddfs.client.socket-timeout=240000000 \
-Dipc.client.connect.timeout=40000000 \
-Dmapreduce.task.timeout=1800000 \
-D hbase.client.scanner.caching=20000 \
-D hbase.export.scanner.batch=2000 \
-D hbase.export.scanner.caching=20000 \
-D mapreduce.map.memory.mb=1024 \
-D mapreduce.reduce.memory.mb=1024 \
-D yarn.app.mapreduce.am.resource.mb=1024 \
user /data/hbaseExportBak/user/user_2022-07-07/ 1 1622476800000 1657209600000 &> /var/lib/hadoop-hdfs/2022-07-07.log &

?2.將下載的文件distcp導(dǎo)入到騰訊云的hdfs集群;

3.將數(shù)據(jù)直接導(dǎo)入到騰訊云的灰度環(huán)境,此時報 memorystore 被寫滿的錯誤f,同時hbase發(fā)生告警,原因是寫的數(shù)據(jù)太多,直接刷滿了memorystore;因此,不建議,直接這樣寫入hbase;

hbase org.apache.hadoop.hbase.mapreduce.Import \
-Ddfs.client.socket-timeout=240000000 \
-Dipc.client.connect.timeout=40000000 \
-Dmapreduce.task.timeout=1800000 \
-D mapreduce.map.memory.mb=5120 \
-D mapreduce.reduce.memory.mb=5120 \
-Dmapreduce.task.timeout=1800000 \
-D yarn.app.mapreduce.am.resource.mb=5120 \
user /data/hbaseExportBak/user/user_2021-07-07/

4.增加參數(shù) -Dimport.bulk.output ,采用bulkload方式導(dǎo)入,先將export出來的數(shù)據(jù),轉(zhuǎn)為HFile文件,然后批量寫入hbase;

?hbase org.apache.hadoop.hbase.mapreduce.Import \
-D hadoop.tmp.dir=/data/hbase-tmp/ \
-Ddfs.client.socket-timeout=240000000 \
-Dipc.client.connect.timeout=40000000 \
-Dmapreduce.task.timeout=1800000 \
-D mapreduce.map.memory.mb=5120 \
-D mapreduce.reduce.memory.mb=5120 \
-Dmapreduce.task.timeout=1800000 \
-D yarn.app.mapreduce.am.resource.mb=5120 \
-Dimport.bulk.output=/data/hbaseExportBak/user/userHFile/user_2022/ \
user /data/hbaseExportBak/user/2022-07-07/

操作往往不是那么順利的,在進行上述操作時出現(xiàn)本地磁盤寫滿的問題,因為hbase hadoop.tmp.dir 參數(shù)是運維搭建時是默認(rèn)的;這樣會起一個mr拉取hdfs的數(shù)據(jù),默認(rèn)先下載到本地磁盤目錄,然后在本地轉(zhuǎn)換完成再傳到import.bulk.output 對應(yīng)的目錄,然后再清空本地寫入的數(shù)據(jù);因此,你需要選擇一個允許大量數(shù)據(jù)的文件目錄;或者手動添加參數(shù)修改?hadoop.tmp.dir 目錄為hdfs的目錄,這樣就不會占用本地的磁盤;

5.將轉(zhuǎn)換為HFile文件的目錄(/data/hbaseExportBak/user/userHFile/user_2022/)bulkload導(dǎo)入到hbase ;

hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles \
-Dhbase.mapreduce.bulkload.max.hfiles.perRegion.perFamily=102400 \
/data/hbaseExportBak/user/userHFile/user_2021/ user

?文章來源地址http://www.zghlxwxcb.cn/news/detail-617363.html

到了這里,關(guān)于HBase數(shù)據(jù)遷移(阿里云到騰訊云實戰(zhàn))的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 記一次Hbase2.1.x歷史數(shù)據(jù)數(shù)據(jù)遷移方案
  • 【項目實戰(zhàn)】Dbeaver使用Apache Phoenix來實現(xiàn)連接Hbase的詳細(xì)指引

    DBeaver是一款開源的數(shù)據(jù)庫管理工具,可以連接多種類型的數(shù)據(jù)庫,包括Apache Phoenix和Hbase。通過DBeaver連接Hbase表,可以更方便地進行數(shù)據(jù)管理和查詢。 注意:該教程適用于:遠(yuǎn)程連接Linux上的Hadoop集群,因此本步驟是不需要在本地再下載hadoop的環(huán)境,所以,很多內(nèi)容都可以直

    2024年02月05日
    瀏覽(26)
  • HBase 復(fù)制、備份、遷移

    HBase 復(fù)制、備份、遷移

    分享1 阿里云 BDS-HBase 《HBase高效一鍵遷移的設(shè)計與實踐.pdf》 https://developer.aliyun.com/live/730 https://developer.aliyun.com/article/704972 https://developer.aliyun.com/article/704977 https://blog.csdn.net/u013411339/article/details/101185699 分享2 騰訊FIT HBase金融大數(shù)據(jù)乾坤大挪移 https://www.jianshu.com/p/cb4a645dd66a HB

    2024年01月17日
    瀏覽(14)
  • HBASE集群主節(jié)點遷移割接手動操作步驟

    HBASE集群主節(jié)點指的是包含zk、nn、HM和rm服務(wù)的節(jié)點,一般這類服務(wù)都是一起復(fù)用在同一批節(jié)點上,我把這一類節(jié)點統(tǒng)稱為HBASE集群主節(jié)點。 本文中使用了rsync、pssh等工具,這類是開源的,自己可以下載安裝。還有一類是我自己寫的環(huán)境變量,xcgraceful_stopRegionserver是用于優(yōu)雅的

    2024年02月07日
    瀏覽(21)
  • 【FusionInsight 遷移】HBase從C50遷移到6.5.1(01)遷移概述

    項目上最近全新部署了FusionInsight HD 6.5.1大數(shù)據(jù)集群,并且希望將老集群FusinInsight HD C50的所有業(yè)務(wù)都遷移到新集群上。由于在老集群C50上的HDFS、HBase中存在有大量的業(yè)務(wù)數(shù)據(jù),因此將業(yè)務(wù)從C50遷移到6.5.1的過程中,就需要將C50上的業(yè)務(wù)數(shù)據(jù)同步遷移到新集群6.5.1上。 遷移方向

    2024年02月07日
    瀏覽(19)
  • HBase內(nèi)容分享(十):超大表遷移、備份、還原、同步演練手冊:全量快照 + 實時同步不停機遷移

    HBase內(nèi)容分享(十):超大表遷移、備份、還原、同步演練手冊:全量快照 + 實時同步不停機遷移

    目錄 1. 背景介紹 2. 知識儲備 3. 方案介紹 4. 環(huán)境說明 5. 演練操作 6. 資源清理 7. 已知錯誤 本文介紹的演練操作源于某真實案例,用戶有一個 80 TB 的 HBase 數(shù)據(jù)庫,其中有一張超大表,數(shù)據(jù)量約為 50 TB,在一次遷移任務(wù)中,用戶需要將該 HBase 數(shù)據(jù)庫遷移到 Amazon EMR 上。 本文將

    2024年01月16日
    瀏覽(20)
  • 【FusionInsight 遷移】HBase從C50遷移到6.5.1(03)6.5.1上準(zhǔn)備Loader

    在FusionInsight HD集群的HBase數(shù)據(jù)遷移過程中,需要通過Loader將老集群FusinInsight C50上獲取HBase的數(shù)據(jù)加載到新集群FusionInsight 6.5.1,因此需要在新集群FusionInsight 6.5.1中添加Loader以及具有相應(yīng)權(quán)限的用戶loaderUser。 本文主要介紹如何在新集群FusionInsight 6.5.1中創(chuàng)建loaderUser用戶以及如何

    2024年02月09日
    瀏覽(22)
  • 【FusionInsight 遷移】HBase從C50遷移到6.5.1(02)C50上準(zhǔn)備FTP Server

    【FusionInsight 遷移】HBase從C50遷移到6.5.1(02)C50上準(zhǔn)備FTP Server

    在FusionInsight HD集群的HBase數(shù)據(jù)遷移過程中,需要通過FTP-Server從老集群FusinInsight C50上獲取HBase的數(shù)據(jù),因此需要在老集群FusinInsight C50中添加FTP-Server以及具有相應(yīng)權(quán)限的用戶ftpUser。 本文主要介紹如何在老集群FusinInsight C50中創(chuàng)建ftpUser用戶以及如何添加配置FTP-Server。 使用admin用

    2024年02月09日
    瀏覽(16)
  • 【HBase入門與實戰(zhàn)】一文搞懂HBase!

    【HBase入門與實戰(zhàn)】一文搞懂HBase!

    HBase的引入、定義和特點 NoSQL數(shù)據(jù)庫的概念和與關(guān)系型數(shù)據(jù)庫的區(qū)別 HBase的物理架構(gòu)和邏輯架構(gòu) HBase Shell的基本命令使用 HBase的應(yīng)用場景 常見的NoSQL數(shù)據(jù)庫:包括Redis和HBase,這些數(shù)據(jù)庫在處理大規(guī)模數(shù)據(jù)集時,相比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,提供了更高的靈活性和擴展性。 微服務(wù)

    2024年03月26日
    瀏覽(72)
  • 騰訊云國際站代充-阿里云ECS怎么一鍵遷移到騰訊云cvm?

    騰訊云國際站代充-阿里云ECS怎么一鍵遷移到騰訊云cvm?

    今天主要來介紹一下如何通過阿里云國際ECS控制臺一鍵遷移至騰訊云國際CVM。騰訊云國際站云服務(wù)器CVM提供全面廣泛的服務(wù)內(nèi)容。無-需-綁-定PayPal,代-充-值騰訊云國際站、阿里云國際站、AWS亞馬遜云、GCP谷歌云,官方授權(quán)經(jīng)銷商!靠譜!T-G 飛機 @unirech_dingding 一鍵遷移是在線

    2024年02月13日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包