国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎

這篇具有很好參考價(jià)值的文章主要介紹了DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

1.?問題描述

DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值(NULL)存到HDFS中時(shí),默認(rèn)是存儲(chǔ)為空字符串(‘’)。

2.?原因分析

HFDS Writer并未提供nullFormat參數(shù):也就是用戶并不能自定義null值寫到HFDS文件中的存儲(chǔ)格式。默認(rèn)情況下,HFDS Writer會(huì)將null值存儲(chǔ)為空字符串(‘’),而Hive默認(rèn)的null值存儲(chǔ)格式為\N。所以后期將DataX同步的文件導(dǎo)入Hive表就會(huì)出現(xiàn)問題。

3.?解決方案

處理方案有2個(gè):

1. 修改源碼。修改DataX?HDFS?Writer的源碼,增加自定義null值存儲(chǔ)格式的邏輯,將空字符串存儲(chǔ)為\N,這樣hive在建表時(shí)就不用指定格式了。

DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎,大數(shù)據(jù),mysql,hdfs,datax

以上已orc文件寫入為例,同理可以應(yīng)用到textfile格式的處理。

DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎,大數(shù)據(jù),mysql,hdfs,datax

?以上左邊你可以對(duì)其寫死,所有的NULL均轉(zhuǎn)為\\N ,或者像我這邊傳進(jìn)來nullFormat使得NULL作為空還是空字符串取決于你這邊設(shè)置值。

可參考記Datax3.0解決MySQL抽數(shù)到HDFSNULL變?yōu)榭兆址膯栴}_datax nullformat_譚正強(qiáng)的博客-CSDN博客

2. 在Hive中建表時(shí)指定null值存儲(chǔ)格式為空字符串(''),添加: NULL DEFINED AS ‘’

例如:

DROP TABLE IF EXISTS base_province;
CREATE EXTERNAL TABLE base_province
(
    `id`         STRING COMMENT '編號(hào)',
    `name`       STRING COMMENT '省份名稱',
    `region_id`  STRING COMMENT '地區(qū)ID',
    `area_code`  STRING COMMENT '地區(qū)編碼',
    `iso_code`   STRING COMMENT '舊版ISO-3166-2編碼,供可視化使用',
    `iso_3166_2` STRING COMMENT '新版IOS-3166-2編碼,供可視化使用'
) COMMENT '省份表'
    ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
    NULL DEFINED AS ''
    LOCATION '/base_province/';

4.?運(yùn)行結(jié)果

DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎,大數(shù)據(jù),mysql,hdfs,datax

5. 參考文章

  1. http://t.csdn.cn/WmEEW
  2. hive 空值的處理
  3. DataX使用、同步MySQL數(shù)據(jù)到HDFS案例_datax mysql同步到hdfs_Redamancy_06的博客-CSDN博客

?文章來源地址http://www.zghlxwxcb.cn/news/detail-651607.html

到了這里,關(guān)于DataX將MySQL數(shù)據(jù)同步到HDFS中時(shí),空值不處理可以嗎的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • DataX實(shí)現(xiàn)Mysql與ElasticSearch(ES)數(shù)據(jù)同步

    DataX實(shí)現(xiàn)Mysql與ElasticSearch(ES)數(shù)據(jù)同步

    jdk1.8及以上 python2 查看是否安裝成功 查看python版本號(hào),判斷是否安裝成功 在datax/job下,json格式,具體內(nèi)容及主要配置含義如下 mysqlreader為讀取mysql數(shù)據(jù)部分,配置mysql相關(guān)信息 username,password為數(shù)據(jù)庫賬號(hào)密碼 querySql:需要查詢數(shù)據(jù)的sql,也可通過colums指定需要查找的字段(

    2024年02月05日
    瀏覽(24)
  • 使用python腳本生成datax-json腳本(一次性操作多張表),并使用datax將業(yè)務(wù)數(shù)據(jù)從mysql采集到hdfs

    廢話不多說,上代碼(因?yàn)檫@個(gè)代碼是從別的地方復(fù)制后修改的,有許多冗余的地方,但是不影響運(yùn)行--從mysql將數(shù)據(jù)導(dǎo)入到hdfs):? 接下來是通過shell腳本,使用datax將數(shù)據(jù)從mysql?采集到hdfs (下面是一個(gè)離線數(shù)倉項(xiàng)目的demo): 當(dāng)然我們也可以使用sqoop,shell腳本如下: ? 業(yè)務(wù)數(shù)

    2024年02月15日
    瀏覽(92)
  • 阿里巴巴開源DataX全量同步多個(gè)MySQL數(shù)據(jù)庫

    阿里巴巴開源DataX全量同步多個(gè)MySQL數(shù)據(jù)庫

    上次 寫了阿里巴巴高效的離線數(shù)據(jù)同步工具DataX: https://mp.weixin.qq.com/s/_ZXqA3H__Kwk-9O-9dKyOQ 安裝DataX這個(gè)開源工具,并且同步備份了幾張數(shù)據(jù)表。但是發(fā)現(xiàn)一個(gè)問題,就是每張表都需要單獨(dú)寫一個(gè) job。如果數(shù)據(jù)表有幾百張是不是要寫幾百個(gè),這個(gè)不太現(xiàn)實(shí)了。 正當(dāng)一籌莫展之際

    2024年02月02日
    瀏覽(40)
  • DolphinScheduler 調(diào)度 DataX 實(shí)現(xiàn) MySQL To ElasticSearch 增量數(shù)據(jù)同步實(shí)踐

    DolphinScheduler 調(diào)度 DataX 實(shí)現(xiàn) MySQL To ElasticSearch 增量數(shù)據(jù)同步實(shí)踐

    基于SQL查詢的 CDC(Change Data Capture): 離線調(diào)度查詢作業(yè),批處理。把一張表同步到其他系統(tǒng),每次通過查詢?nèi)カ@取表中最新的數(shù)據(jù)。也就是我們說的基于SQL查詢抽取; 無法保障數(shù)據(jù)一致性,查的過程中有可能數(shù)據(jù)已經(jīng)發(fā)生了多次變更; 不保障實(shí)時(shí)性,基于離線調(diào)度存在天然的

    2024年02月03日
    瀏覽(24)
  • DataX mysql同步到mysql

    DataX mysql同步到mysql

    創(chuàng)建數(shù)據(jù)源 配置數(shù)據(jù)庫相關(guān)信息 創(chuàng)建執(zhí)行器 配置執(zhí)行器執(zhí)行地址相關(guān)信息 1.1 SQL語句 (querySql) 在json文件中此部分配置就是 querySql 在有些業(yè)務(wù)場景下,where這一配置項(xiàng)不足以描述所篩選的條件,用戶可以通過該配置型來自定義篩選SQL。當(dāng)用戶配置了這一項(xiàng)之后,DataX系統(tǒng)就

    2024年02月09日
    瀏覽(18)
  • Datax同步MySQL到ES

    Datax同步MySQL到ES

    建表語句 插入數(shù)據(jù) 建立索引語句 我這里使用Kibana工具連接ES進(jìn)行操作的,也可以使用Postman進(jìn)行操作 Kibana操作語句 Postman操作語句 地址輸入 Json文本輸入 當(dāng)出現(xiàn)以下信息代表創(chuàng)建索引成功 參數(shù)介紹 reader:datax的source(來源)端 reader.cloumn::讀取mysql的字段名 reader.connection.jdbcU

    2024年02月13日
    瀏覽(18)
  • 【Mysql - 空值處理 】

    【Mysql - 空值處理 】

    MySQL中,空值通常用于表示缺失或未定義的值。處理空值的關(guān)鍵在于理解空值與其他值之間的關(guān)系,以及如何使用不同的SQL函數(shù)來處理和轉(zhuǎn)換空值。 主頁傳送門:?? 傳送 MySQL使用 SQL SELECT 命令及 WHERE 子句來讀取數(shù)據(jù)表中的數(shù)據(jù),但是當(dāng)提供的查詢條件字段為 NULL 時(shí),該命令可

    2024年02月16日
    瀏覽(32)
  • DataX-阿里開源離線同步工具在Windows上實(shí)現(xiàn)Sqlserver到Mysql全量同步和增量同步

    DataX-阿里開源離線同步工具在Windows上實(shí)現(xiàn)Sqlserver到Mysql全量同步和增量同步

    Kettle-開源的ETL工具集-實(shí)現(xiàn)SqlServer到Mysql表的數(shù)據(jù)同步并部署在Windows服務(wù)器上: Kettle-開源的ETL工具集-實(shí)現(xiàn)SqlServer到Mysql表的數(shù)據(jù)同步并部署在Windows服務(wù)器上_etl實(shí)現(xiàn)sqlserver報(bào)表服務(wù)器_霸道流氓氣質(zhì)的博客-CSDN博客 上面講過Kettle的使用,下面記錄下阿里開源異構(gòu)數(shù)據(jù)源同步工具

    2024年02月08日
    瀏覽(27)
  • 【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】使用阿里云開源離線同步工具DataX 實(shí)現(xiàn)數(shù)據(jù)同步

    【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】使用阿里云開源離線同步工具DataX 實(shí)現(xiàn)數(shù)據(jù)同步

    【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】阿里云開源離線同步工具Datax概述? 【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】阿里云開源離線同步工具Datax快速入門? ?【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】阿里云開源離線同步工具Datax類圖 【大數(shù)據(jù)進(jìn)階第三階段之Datax學(xué)習(xí)筆記】使

    2024年01月24日
    瀏覽(31)
  • 數(shù)據(jù)同步工具—DataX—Web部署使用

    數(shù)據(jù)同步工具—DataX—Web部署使用

    以前了解datax,感覺對(duì)易用性不大好,目前發(fā)現(xiàn)已經(jīng)圖形配置工具。簡單整理一下。 Datax 的使用過程中,我們會(huì)發(fā)現(xiàn),不管是利用 java 調(diào)用以及 python 命令啟動(dòng)的方式,我們都無法進(jìn)行任務(wù)的管理,并且每次執(zhí)行任務(wù)前,我們 都需要編輯 Json 配置文件,這是比較繁瑣的,隨著業(yè)

    2024年02月05日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包