前言
大數(shù)據(jù)與 RDBMS
之間的數(shù)據(jù)導(dǎo)入和導(dǎo)出都是企業(yè)日常數(shù)據(jù)處理中常見(jiàn)的一環(huán),該環(huán)節(jié)一般稱(chēng)為 e-t-l
即 extract-transform-load
。市面上可用的 etl
工具和框架很多,如來(lái)自于傳統(tǒng)數(shù)倉(cāng)和 BI
圈的 kettle/informatica/datastage
, 來(lái)自于 hadoop
生態(tài)圈的 sqoop/datax
,抑或使用計(jì)算引擎 spark/presto/flink
直接編寫(xiě)代碼完成 etl
作業(yè)。
在這里跟大家分享一次使用 datax
從 hive
導(dǎo)出數(shù)據(jù)到 oracle
的作業(yè)的時(shí)候,出現(xiàn)了兩邊數(shù)據(jù)的編碼集不一致導(dǎo)致的亂碼問(wèn)題,希望對(duì)大家遇到相同的問(wèn)題時(shí)有所幫忙。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-646941.html
問(wèn)題背景
最近接到業(yè)務(wù)人員反饋導(dǎo)出 oracle
數(shù)據(jù)庫(kù)中的數(shù)據(jù)和 hive
中的數(shù)據(jù)不一致,hive
中明明是 "? " ,但是導(dǎo)出到 Oracle
后卻變成了 “?”,于是,當(dāng)我看到這個(gè)問(wèn)題的時(shí)候,我的頭腦里也出現(xiàn)了很多問(wèn)號(hào)?
思考片刻后,于是找到 DBA
詢(xún)問(wèn) oracle
數(shù)據(jù)庫(kù)的編碼集是什么,回答是 ZHS16GBK
,而 hive 中的編碼集是 UTF-8
,這就很明了了,確定是編碼集不一致導(dǎo)致的亂碼問(wèn)題了。
那么如何文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-646941.html
到了這里,關(guān)于成功解決DataX從Hive導(dǎo)出Oracle的數(shù)據(jù)亂碼問(wèn)題!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!