国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【Hadoop-OBS-Hive】利用華為云存儲(chǔ)對(duì)象 OBS 作為兩個(gè)集群的中間棧 load 文件到 Hive

這篇具有很好參考價(jià)值的文章主要介紹了【Hadoop-OBS-Hive】利用華為云存儲(chǔ)對(duì)象 OBS 作為兩個(gè)集群的中間棧 load 文件到 Hive。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

本次需求:想將一個(gè)集群上的 csv 文件 load 到另一個(gè)集群的 Hive 表中,由于兩個(gè)集群的網(wǎng)絡(luò)不通,所以利用華為云存儲(chǔ)對(duì)象 OBS 作為中間棧,從而實(shí)現(xiàn)。

1)壓縮文件

服務(wù)器A上 /home/test/ 目錄下找到測(cè)試文件進(jìn)行壓縮,實(shí)際生產(chǎn)中不排除單個(gè)文件很大,導(dǎo)致上傳至存儲(chǔ)對(duì)象速度慢,所以壓縮后效率更高。

zip -r /home/test/20231127/test_20231127.zip test_20231127.csv

2)上傳文件到 OBS 存儲(chǔ)對(duì)象

上傳壓縮文件到 obs,這里我們已經(jīng)安裝了obsutil-Liunx工具,如果沒(méi)有安裝的話要安裝。

安裝地址:https://support.huaweicloud.com/utiltg-obs/obs_11_0003.html

/opt/obsutil/obsutil cp /home/test/20231127/test_20231127.zip obs://obs-tes/model_test/

3)crontab 定時(shí)壓縮上傳

實(shí)際生產(chǎn)中可以定時(shí)進(jìn)行壓縮上傳。

4)從 obs 上拉取下來(lái)文件后解壓縮

obs://obs-test/model_test/test_20231127.zip cp /data/test/
unzip -d /data/test/ /data/test/test_20231127.zip

5)判斷對(duì)應(yīng)文件是否存在

拉下來(lái)后最好在腳本中自動(dòng)進(jìn)行判斷文件是否存在,如果有異常的情況可以幫助我們盡快發(fā)現(xiàn)異常。

if [ -f /data/cdp/test_20231127.csv ]; then
    echo "該文件存在"
else
    echo "該文件不存在"
fi

6)上傳至 HDFS 并 load 到 Hive

完整腳本如下:文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-784324.html

/opt/obsutil/obsutil config -i=****************** -k=**************************** -e=huaweiyun.cloud.com
echo 123 | kinit hive
sh /opt/obsutil/config.sh
/opt/obsutil/obsutil cp obs://obs-test/model_test/test_20231127.zip /data/test/test_20231127.zip
if [ -e /data/test/test_20231127.zip ]; then
    echo "文件下載完成"
    unzip -o -d /data/test/ /data/test/test_20231127.zip
    echo "解壓縮完成"
    hdfs dfs -put -f /data/test/test_20231127.csv /tmp/test
    echo "上傳hdfs完成"
	hive -e "load data inpath '/tmp/test/test_20231127.csv' overwrite into table test.test_table"
    echo "load完成"
else
    echo "該文件不存在"
    break
fi

到了這里,關(guān)于【Hadoop-OBS-Hive】利用華為云存儲(chǔ)對(duì)象 OBS 作為兩個(gè)集群的中間棧 load 文件到 Hive的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Hadoop 集群中使用 S3(對(duì)象存儲(chǔ))文件系統(tǒng)

    Hadoop 集群中使用 S3(對(duì)象存儲(chǔ))文件系統(tǒng)

    Hadoop 自帶 S3 依賴,位置如下: 但是這些依賴包默認(rèn)不在 hadoop classpath 下面??梢允褂靡韵聝煞N方法引入這兩個(gè)包: 修改hadoop的core-site.xml文件: s3的配置模板(記得修改成自己的 secret key 與 access key ) 更改完畢并重啟集群后 測(cè)試hdfs dfs -ls s3a://hive0614/ 等命令操作 S3 中的文件

    2024年02月06日
    瀏覽(30)
  • 利用Hadoop處理離線數(shù)據(jù):Hive和Spark離線數(shù)據(jù)處理實(shí)現(xiàn)

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 引言 隨著大數(shù)據(jù)時(shí)代的到來(lái),越來(lái)越多的數(shù)據(jù)產(chǎn)生于各種業(yè)務(wù)系統(tǒng)。這些數(shù)據(jù)往往需要在離線環(huán)境中進(jìn)行處理,以降低數(shù)據(jù)處理的時(shí)間和成本。Hadoop作為目前最為流行的分布式計(jì)算框架,提供了強(qiáng)大的離線數(shù)據(jù)處理能力。Hive和Spark作為Hadoop生

    2024年02月11日
    瀏覽(56)
  • 利用HTML5存儲(chǔ)對(duì)象:localStorage和sessionStorage解析

    前端朋友們,你是否曾為如何在用戶的瀏覽器中存儲(chǔ)數(shù)據(jù)而感到困擾?你是否想過(guò),如果可以在用戶的瀏覽器中存儲(chǔ)一些數(shù)據(jù),那么我們的應(yīng)用程序?qū)?huì)變得多么強(qiáng)大?如果你的答案是肯定的,那么本文將為你解鎖一種新的能力——使用HTML5的localStorage和sessionStorage。 HTML5引入

    2024年02月05日
    瀏覽(17)
  • 華為云OBS權(quán)限控制

    OBS權(quán)限控制理論上來(lái)講有3種,IAM權(quán)限、桶策略、桶/對(duì)象ACLs 參考:https://support.huaweicloud.com/perms-cfg-obs/obs_40_0001.html 桶策略是針對(duì)某個(gè)桶配置的,因此更聚焦于“此桶”的個(gè)性化操作權(quán)限。桶策略里可以配置桶動(dòng)作和對(duì)象動(dòng)作。 桶ACLs/對(duì)象ACLs是將常用的桶策略進(jìn)行了一定的聚

    2024年02月13日
    瀏覽(18)
  • OBS 遷移--華為云

    OBS 遷移--華為云

    一、創(chuàng)建遷移i任務(wù) 1. 登錄管理控制臺(tái)。 2. 單擊管理控制臺(tái)左上角的? 在下拉框中選擇區(qū)域。 3. 單擊“ 服務(wù)列表 ”,選擇“ 遷移 對(duì)象存儲(chǔ)遷移服務(wù) OMS ”,進(jìn)入“ 對(duì)象存儲(chǔ)遷移服務(wù) ”頁(yè)面。 4. 單擊頁(yè)面右上角“ 創(chuàng)建遷移任務(wù) ”。 5. 仔細(xì)閱讀彈出的服務(wù)聲明,勾選“ 同

    2024年02月15日
    瀏覽(14)
  • 利用OBS和手機(jī)攝像頭錄課(錄屏/錄像)時(shí)的方法與參數(shù)設(shè)置

    利用OBS和手機(jī)攝像頭錄課(錄屏/錄像)時(shí)的方法與參數(shù)設(shè)置

    目錄 1. OBS下載地址 2. OBS錄屏設(shè)置 2.1 使用向?qū)гO(shè)置做全局設(shè)置 2.2 詳細(xì)設(shè)置 2.2.1 視頻設(shè)置 2.2.2 音頻設(shè)置 2.2.3 輸出設(shè)置 2.2.4 快捷鍵設(shè)置 3. 麥克風(fēng)降噪設(shè)置 4. 使用OBS錄屏功能 5. 用手機(jī)作為網(wǎng)絡(luò)攝像頭采集圖像 5.1 配置手機(jī)攝像頭 5.2 為OBS中設(shè)置手機(jī)IP攝像頭 6. 本文的OBS參數(shù)設(shè)

    2024年02月11日
    瀏覽(31)
  • vue+el-upload(封裝華為云OBS上傳文件)前端直傳

    vue+el-upload(封裝華為云OBS上傳文件)前端直傳

    注釋:代碼中###是需要填寫自己東西的 以上代碼為封裝的組件代碼,需要引入父組件后調(diào)用配置 下面圖為組件調(diào)用,注冊(cè)跟引入就不用我多說(shuō)了吧,不會(huì)的自行百度 注:華為云前端直接上傳的話會(huì)出現(xiàn)跨域報(bào)錯(cuò),把華為云OBS CORS跨域規(guī)則設(shè)置一下 我設(shè)置的規(guī)則全部打開(kāi)了

    2024年02月05日
    瀏覽(113)
  • 使用rclone工具實(shí)現(xiàn)華為云OBS至AWS S3數(shù)據(jù)遷移同步

    使用rclone工具實(shí)現(xiàn)華為云OBS至AWS S3數(shù)據(jù)遷移同步

    ????????項(xiàng)目需要將華為云的OBS對(duì)象存儲(chǔ)服務(wù)的存儲(chǔ)桶bucket的內(nèi)容遷移復(fù)制到AWS云的S3存儲(chǔ)桶中,AWS中暫無(wú)實(shí)現(xiàn)改需求的云服務(wù),所以采用開(kāi)源的第三方軟件rclone來(lái)實(shí)現(xiàn)。 ? ? ? ? rclone可以使用在linux操作系統(tǒng)中,是一種命令行形式的工具。 華為云OBS: 1. 已從統(tǒng)一身份認(rèn)

    2024年02月02日
    瀏覽(53)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包