国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

sqoop(DataX)-MySQL導(dǎo)入HIVE時(shí)間格問題

這篇具有很好參考價(jià)值的文章主要介紹了sqoop(DataX)-MySQL導(dǎo)入HIVE時(shí)間格問題。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

問題1:

用公司的大數(shù)據(jù)平臺(tái)(DataX)導(dǎo)數(shù),已經(jīng)開發(fā)上線一個(gè)多月的一批報(bào)表,突然有同事說有個(gè)報(bào)表數(shù)據(jù)不準(zhǔn)。出在時(shí)間字段上。
分析:
1、先看了原數(shù)據(jù)MySQL字段類型為datetime,目標(biāo)字段為timestamp類型;
2、經(jīng)發(fā)現(xiàn)所有時(shí)間的差距都是8小時(shí),懷疑是因?yàn)闀r(shí)區(qū)轉(zhuǎn)換的原因;
3、對(duì)比其他表,看看是大范圍現(xiàn)象還是特殊情況,發(fā)現(xiàn)其他的同樣情況字段的一樣沒有問題,也有改變?yōu)閟tring字段類型的也沒有問題;

測(cè)試

MySQL 數(shù)據(jù)信息

MySQL表名:test
MySQL字段類型如下:

field_name type
id int
name varchar
creat_day_time datetime
create_day date
create_time time
create_time_stamp timestamp
-----測(cè)試數(shù)據(jù)如下
id    name               create_day_time         create_day   create_time   create_time_stamp
1	  xiaoming           2023-04-10 14:20:42     2023-04-10   14:20:42      2023-04-10 14:20:42
2     xiaohong           2023-04-21 14:21:02     2023-04-21   14:21:02      2023-04-21 14:21:02

HIVE數(shù)據(jù)信息

hive中用 text 文件格式存儲(chǔ)
hive 表名:test_text

field_name type
id int
name string
creat_day_time string
create_day string
create_time string
create_time_stamp string
-----hive 表中的數(shù)據(jù):
id    name               create_day_time         create_day   create_time   create_time_stamp
1	  xiaoming           2023-04-10 14:20:42     2023-04-10   14:20:42      2023-04-10 14:20:42
2     xiaohong           2023-04-21 14:21:02     2023-04-21   14:21:02      2023-04-21 14:21:02

與mysql表里面數(shù)據(jù)一致;

hive中用 parquet(orc) 列式文件格式存儲(chǔ)

hive表名:test_parquet
導(dǎo)入hive命令:

field_name type
id int
name string
creat_day_time string
create_day string
create_time string
create_time_stamp string
-----hive 表中的數(shù)據(jù):
id    name               create_day_time         create_day      create_time   create_time_stamp
1	  xiaoming           1681107642000           1681056000000   22842000      1681107642000
2     xiaohong           1682058062000           1682006400000   22862000      1682058062000

結(jié)論:
1、sqoop(DataX) 導(dǎo) mysql 到 hive以text文件格式存儲(chǔ)時(shí),mysql時(shí)間類型:datetime,date,time,timestamp 會(huì)被轉(zhuǎn)成 hive 的 string 類型,值保存格式化后的時(shí)間字符串
2、sqoop(DataX) 導(dǎo) mysql 到 hive以parquet(orc)l列式文件格式存儲(chǔ)時(shí),mysql時(shí)間類型:datetime,date,time,timestamp 會(huì)被轉(zhuǎn)成 hive的相應(yīng)類型,值保存時(shí)間戳

解決方法

hive表存儲(chǔ)格式為:行式存儲(chǔ)(text)格式,hive表相應(yīng)字段(mysql里面datetime字段)設(shè)置為string類型;

問題2:

mysql表中字段類型是tinyint(1),同步到hive中,也會(huì)顯示出布爾類型,就是true和false。

官網(wǎng)解釋如下:
Mysql中存在tinyint(1)時(shí),在數(shù)據(jù)導(dǎo)入到HDFS時(shí),該字段默認(rèn)會(huì)被轉(zhuǎn)化為boolean數(shù)據(jù)類型,導(dǎo)致數(shù)據(jù)內(nèi)容丟失(都變?yōu)镹ULL)。

解決方法

1、可以在mysql中在建立一張表,將新建立的表修改為int類型,之后在進(jìn)行同步。

2、修改sqoop的同步腳本。
解決方案:
在–connect參數(shù)后的jdbc連接上添加參數(shù):tinyInt1isBit=false
注意:
若有多個(gè)參數(shù),需要使用雙引號(hào)將整個(gè)參數(shù)值括起來文章來源地址http://www.zghlxwxcb.cn/news/detail-781582.html

如:–connect " jdbc:mysql://ip:3306/db?serverTimezone=Asia/Shanghai&tinyInt1isBit=false "

到了這里,關(guān)于sqoop(DataX)-MySQL導(dǎo)入HIVE時(shí)間格問題的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 使用DataX實(shí)現(xiàn)mysql與hive數(shù)據(jù)互相導(dǎo)入導(dǎo)出
一、概論

    使用DataX實(shí)現(xiàn)mysql與hive數(shù)據(jù)互相導(dǎo)入導(dǎo)出 一、概論

    ???????? DataX 是 阿里巴巴開源 的一個(gè)異構(gòu)數(shù)據(jù)源離線同步工具,致力于實(shí)現(xiàn)包括關(guān)系型數(shù)據(jù)庫(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等 各種異構(gòu)數(shù)據(jù)源之間穩(wěn)定高效的數(shù)據(jù)同步 功能。 ???????? 為了解決異構(gòu)數(shù)據(jù)源同步問題,DataX 將復(fù)雜的 網(wǎng)狀 的同步鏈路變成了

    2024年02月14日
    瀏覽(22)
  • MySQL中的業(yè)務(wù)數(shù)據(jù)該如何正確導(dǎo)入到Hive中 - Sqoop

    MySQL中的業(yè)務(wù)數(shù)據(jù)該如何正確導(dǎo)入到Hive中 - Sqoop

    水善利萬物而不爭(zhēng),處眾人之所惡,故幾于道?? ? 1. 使用Sqoop腳本將MySQL中的數(shù)據(jù)遷移到HDFS ? 2. 在Hive中建立與之對(duì)應(yīng)的表 ? 3. 將HDFS中的數(shù)據(jù)load到 Hive 數(shù)倉的ODS層的表中 1 . 使用Sqoop 將 MySQL中的數(shù)據(jù)導(dǎo)入到HDFS上 使用示例: mysql_to_hdfs.sh all 2021-02-01 導(dǎo)出的數(shù)據(jù)用lzo壓縮,并

    2024年02月11日
    瀏覽(17)
  • 【Sqoop】MySQL表導(dǎo)入Hive

    用 Sqoop 將 MySQL 指定數(shù)據(jù)庫指定的表導(dǎo)入Hive 的指定數(shù)據(jù)庫

    2024年02月03日
    瀏覽(21)
  • 基于Hive的天氣情況大數(shù)據(jù)分析系統(tǒng)(通過hive進(jìn)行大數(shù)據(jù)分析將分析的數(shù)據(jù)通過sqoop導(dǎo)入到mysql,通過Django基于mysql的數(shù)據(jù)做可視化)

    基于Hive的天氣情況大數(shù)據(jù)分析系統(tǒng)(通過hive進(jìn)行大數(shù)據(jù)分析將分析的數(shù)據(jù)通過sqoop導(dǎo)入到mysql,通過Django基于mysql的數(shù)據(jù)做可視化)

    Hive介紹: Hive是建立在Hadoop之上的數(shù)據(jù)倉庫基礎(chǔ)架構(gòu),它提供了類似于SQL的語言(HQL),可以對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行查詢和分析。通過Hive,我們可以在分布式存儲(chǔ)系統(tǒng)中進(jìn)行復(fù)雜的數(shù)據(jù)處理和分析。 Sqoop簡(jiǎn)介: Sqoop是一個(gè)用于在Apache Hadoop和關(guān)系型數(shù)據(jù)庫之間傳輸數(shù)據(jù)的工具。

    2024年04月13日
    瀏覽(21)
  • Sqoop【實(shí)踐 01】Sqoop1最新版 MySQL與HDFS\Hive\HBase 核心導(dǎo)入導(dǎo)出案例分享+多個(gè)WRAN及Exception問題處理(一篇即可學(xué)會(huì)在日常工作中使用Sqoop)

    1?? 查看所有命令【 sqoop help 】 2?? 查看某條命令的具體使用方法【 sqoop help COMMAND 】 查詢MySQL所有數(shù)據(jù)庫,通常用于 Sqoop 與 MySQL 連通測(cè)試: 【具體參數(shù)可以使用 sqoop help list-databases 查看】實(shí)例: 結(jié)果: 【2個(gè)】WARN處理: 查詢指定數(shù)據(jù)庫中所有數(shù)據(jù)表,這里要注意一下

    2024年03月18日
    瀏覽(27)
  • 【Spark數(shù)倉項(xiàng)目】需求八:MySQL的DataX全量導(dǎo)入和增量導(dǎo)入Hive

    【Spark數(shù)倉項(xiàng)目】需求八:MySQL的DataX全量導(dǎo)入和增量導(dǎo)入Hive 本需求將模擬從MySQL中向Hive數(shù)倉中導(dǎo)入數(shù)據(jù),數(shù)據(jù)以時(shí)間分區(qū)。測(cè)試兩種導(dǎo)入場(chǎng)景,一種是將數(shù)據(jù)全量導(dǎo)入,即包含所有時(shí)間分區(qū);另一種是每天運(yùn)行調(diào)度,僅導(dǎo)入當(dāng)天時(shí)間分區(qū)中的用戶數(shù)據(jù)。 mysql表建表語句:

    2024年02月03日
    瀏覽(21)
  • Sqoop數(shù)據(jù)導(dǎo)入到Hive表的最佳實(shí)踐

    Sqoop數(shù)據(jù)導(dǎo)入到Hive表的最佳實(shí)踐

    將數(shù)據(jù)從關(guān)系型數(shù)據(jù)庫導(dǎo)入到Hive表是大數(shù)據(jù)領(lǐng)域中的常見任務(wù)之一,Sqoop是一個(gè)強(qiáng)大的工具,可以幫助實(shí)現(xiàn)這一目標(biāo)。本文將提供Sqoop數(shù)據(jù)導(dǎo)入到Hive表的最佳實(shí)踐,包括詳細(xì)的步驟、示例代碼和最佳建議,以確保數(shù)據(jù)導(dǎo)入過程的高效性和可維護(hù)性。 Sqoop是一個(gè)開源工具,用于

    2024年01月23日
    瀏覽(24)
  • 教你使用Sqoop一次性將mysql中的十張表導(dǎo)入到hive中

    教你使用Sqoop一次性將mysql中的十張表導(dǎo)入到hive中

    ???? 個(gè)人主頁:csdn春和 ???? 推薦專欄:更多專欄盡在主頁! ?JavaWeb專欄(從入門到實(shí)戰(zhàn)超詳細(xì)?。。。??SSM專欄 (更新中) ???? 本期文章:Sqoop一次性將mysql中的十張表同步到hive中 如果對(duì)您有幫助還請(qǐng)三連支持,定會(huì)一 一回訪! 前言:這是一篇實(shí)驗(yàn)隨記文章

    2023年04月15日
    瀏覽(97)
  • 使用sqoop從Hive導(dǎo)出數(shù)據(jù)到MySQL

    使用sqoop從Hive導(dǎo)出數(shù)據(jù)到MySQL

    1、啟動(dòng)hadoop:start-all.sh。 2、啟動(dòng)mysql:support-files/mysql.server start。 3、啟動(dòng)hive:hive。 4、在hive中創(chuàng)建表。 (學(xué)生信息:學(xué)號(hào)xh,姓名xm)xsxx: create table bigdata03.xsxx ( xh String, xm String ) row format delimited fields terminated by \\\',\\\'stored as textfile; (課程信息:課程號(hào)kch,學(xué)號(hào)xh,課程名稱

    2024年02月11日
    瀏覽(24)
  • 大數(shù)據(jù)bug-sqoop(二:sqoop同步mysql數(shù)據(jù)到hive進(jìn)行字段限制。)

    新增加三個(gè)參數(shù) –query “${sql}” 這個(gè)參數(shù)添加對(duì)應(yīng)表的sql語句。注意結(jié)尾必須添加 $CONDITIONS ,必須添加where 條件,如果沒有where條件,寫成where 1=1。案例如下: \\\"select id,key_id,key_type,\\\'\\\' as encryption_cert_chain,device_type,account_id_hash,user_identifier,user_id,request_id,device_id,vehicle_id,vehicl

    2024年02月12日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包