国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺

這篇具有很好參考價值的文章主要介紹了二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、目的

在用Flume把Kafka的數(shù)據(jù)采集寫入Hive的ODS層表的HDFS文件路徑后,發(fā)現(xiàn)HDFS文件中沒問題,但是ODS層表中字段的數(shù)據(jù)卻有問題,字段中的JSON數(shù)據(jù)不全

二、Hive處理JSON數(shù)據(jù)方式

(一)將Flume采集Kafka的JSON數(shù)據(jù)以字符串的方式整個寫入Hive表中,然后再用get_json_object或json_tuple進行解析

1、ODS層建靜態(tài)分區(qū)外部表,F(xiàn)lume直接寫入ODS層表的HDFS路徑下

create external table  if not exists  ods_evaluation(
   evaluation_json  string
)
comment '評價數(shù)據(jù)外部表——靜態(tài)分區(qū)'
partitioned by (day string)
stored as SequenceFile
;

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

2、用get_json_object進行解析

select
        get_json_object(evaluation_json,'$.deviceNo')        device_no,
        get_json_object(evaluation_json,'$.createTime')      create_time,
        get_json_object(evaluation_json,'$.cycle')           cycle,
        get_json_object(evaluation_json,'$.laneNum')         lane_num,
        get_json_object(evaluation_json,'$.evaluationList')   evaluation_list
from hurys_dc_ods.ods_evaluation
;

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

(二)在導入Hive表之前將JSON數(shù)據(jù)已拆分好,需要使用JsonSerDe

create  external  table  if not exists ods_track(
     device_no    string     comment '設備編號',
     create_time  timestamp  comment '創(chuàng)建時間',
     track_data   string     comment '軌跡數(shù)據(jù)集合(包含多個目標點)'
)
comment '軌跡數(shù)據(jù)表——靜態(tài)分區(qū)'
partitioned by (day  date)
row format serde  'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
"separatorChar" = ",",
"quoteChar" = "\"",
"escapeChar" = "\\"
)
tblproperties("skip.header.line.count"="1") ; 

注意:使用JsonSerDe時,每行必須是一個完整的JSON,一個JSON不能跨越多行,否則不能使用JsonSerDe

三、ODS層原有建表SQL

create external table  if not exists  ods_evaluation(
   evaluation_json  string
)
comment '評價數(shù)據(jù)外部表——靜態(tài)分區(qū)'
partitioned by (day string)
row format delimited fields terminated by '\x001'
lines terminated by '\n'
stored as SequenceFile
;

四、HDFS文件中的數(shù)據(jù)

HDFS文件中JSON數(shù)據(jù)完整,數(shù)據(jù)沒問題

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

五、報錯詳情

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

查看表數(shù)據(jù)時發(fā)現(xiàn)evaluation_json字段的數(shù)據(jù)不完整

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

六、解決方法

(一)重新建表,建表語句中刪除其中兩行

--row format delimited fields terminated by '\x001'
--lines terminated by '\n'

(二)新建表SQL

create external table  if not exists  ods_evaluation(
   evaluation_json  string
)
comment '評價數(shù)據(jù)外部表——靜態(tài)分區(qū)'
partitioned by (day string)
stored as SequenceFile
;

七、查詢新表中evaluation_json字段的數(shù)據(jù)

數(shù)據(jù)解析成功!

二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺,Hive,hive,flume,hadoop

又解決了一個問題,賓果!文章來源地址http://www.zghlxwxcb.cn/news/detail-776275.html

到了這里,關于二百一十、Hive——Flume采集的JSON數(shù)據(jù)文件寫入Hive的ODS層表后字段的數(shù)據(jù)殘缺的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • 一百一十三、DBeaver——從hive同步數(shù)據(jù)到clickhouse

    一百一十三、DBeaver——從hive同步數(shù)據(jù)到clickhouse

    目標:把hive的DM層結果數(shù)據(jù)導出到clickhouse數(shù)據(jù)庫,試了kettle、sqoop等多種方法都報錯,尤其是kettle,搞了大半天發(fā)現(xiàn)還是不行。結果目前就只能用DBeaver同步數(shù)據(jù)。 準備工作:hive和clickhouse中都建好表 第一步,右擊clickhouse中的表,選擇導入數(shù)據(jù) 第二步,在源類型和格式中,由

    2024年02月13日
    瀏覽(26)
  • 一百一十一、Hive——從HDFS到Hive的數(shù)據(jù)導入(靜態(tài)分區(qū)、動態(tài)分區(qū))

    一百一十一、Hive——從HDFS到Hive的數(shù)據(jù)導入(靜態(tài)分區(qū)、動態(tài)分區(qū))

    分區(qū)表實際上就是對應一個 HDFS 文件系統(tǒng)上的獨立的文件夾, Hive 中的分區(qū)就是分目錄 ,把一個大的數(shù)據(jù)集根據(jù)業(yè)務需要分割成小的數(shù)據(jù)集。 在查詢時通過 where 子句中的表達式選擇查詢所需要的指定的分區(qū),這樣的查詢效率 會提高很多,所以我們需要把常常用在where 語句中

    2024年02月12日
    瀏覽(86)
  • 二百一十八、Hadoop——Hadoop啟動報錯Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)

    二百一十八、Hadoop——Hadoop啟動報錯Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)

    在完成Flume拓撲結構之聚合的開發(fā)案例,啟動了hurys23服務器早已安裝好的Hadoop,結果居然報錯了 hurys23: Permission denied ( publickey,gssapi-keyex,gssapi-with-mic,password ). 啟動Hadoop發(fā)現(xiàn)報錯后,jps查看一下,發(fā)現(xiàn)之啟動了ResourceManager服務 [root@hurys23 ~]# jps 4096 ResourceManager 4823 Jps 根據(jù)報錯提

    2024年02月02日
    瀏覽(16)
  • 第一百一十九回 如何通過藍牙設備讀寫數(shù)據(jù)

    我們在上一章回中介紹了如何獲取藍牙狀態(tài)相關的內(nèi)容,本章回中將介紹 如何通過藍牙設備讀寫數(shù)據(jù) 。閑話休提,讓我們一起Talk Flutter吧。 通過藍牙設備讀寫數(shù)據(jù)有兩種方法: 一種是讀寫Characteristics; 一種是讀寫Descriptor. 我們在本章回中介紹的讀寫數(shù)據(jù)本質(zhì)上是讀寫 Cha

    2024年02月12日
    瀏覽(18)
  • JAVA面試題分享五百一十一:Spring Boot基于WebUploader實現(xiàn)超大文件上傳和斷點續(xù)傳

    JAVA面試題分享五百一十一:Spring Boot基于WebUploader實現(xiàn)超大文件上傳和斷點續(xù)傳

    目錄 前言 目標 實現(xiàn)思路 大文件分片 合并分片 斷點續(xù)傳 代碼實現(xiàn) 1、webuploader組件中,分片上傳怎么開啟? 2、webuploader組件中,文件的md5值如何計算? 3、webuploader組件中,分片文件的md5值如何計算? 4、webuploader組件中,分片上傳的的請求在哪里觸發(fā)? 5、前端、后端如何校

    2024年02月19日
    瀏覽(28)
  • 第一百一十八回 如何獲取藍牙連接狀態(tài)

    我們在上一章回中介紹了如何連接藍牙設備相關的內(nèi)容,本章回中將介紹如何獲取藍牙連接狀態(tài).閑話休提,讓我們一起Talk Flutter吧。 我們在上一章回中介紹如何連接藍牙設備,但是如何知道藍牙設備是否連接成功呢?這就需要我們?nèi)カ@取藍牙設備的連接狀態(tài),通過藍牙設備

    2024年02月12日
    瀏覽(23)
  • Android之關機/重啟/recovery模式(一百一十五)

    1.方式一:App調(diào)用系統(tǒng)api 2.方式二:setprop 注意:在init的reboot.c中, ? ? ? ? ? adb reboot -p命令其實就是調(diào)用的setprop命令開關機的。? 3.方式三:

    2024年02月14日
    瀏覽(28)
  • 第一百一十二回 flutter_screenutil包

    我們在上一章回中介紹了屏幕適配相關的內(nèi)容,本章回中將介紹 flutter_screenutil 包,該包主要用來實現(xiàn)屏幕適配.閑話休提,讓我們一起Talk Flutter吧。 我們在本章回中介紹的包是 flutter_screenutil ,它主要用來做屏幕和字體大小的適配,它的實現(xiàn)原理和我們在上一章回中介紹的屏幕

    2024年02月13日
    瀏覽(17)
  • Emacs之改造最快文本搜索工具ripgrep(一百一十九)

    Emacs之改造最快文本搜索工具ripgrep(一百一十九)

    簡介: CSDN博客專家,專注Android/Linux系統(tǒng),分享多mic語音方案、音視頻、編解碼等技術,與大家一起成長! 優(yōu)質(zhì)專欄: Audio工程師進階系列 【 原創(chuàng)干貨持續(xù)更新中…… 】?? 人生格言: 人生從來沒有捷徑,只有行動才是治療恐懼和懶惰的唯一良藥. 更多原創(chuàng),歡迎關注:An

    2024年02月15日
    瀏覽(21)
  • Emacs之實現(xiàn)跨程序選中自動復制功能(一百一十八)

    Emacs之實現(xiàn)跨程序選中自動復制功能(一百一十八)

    簡介: CSDN博客專家,專注Android/Linux系統(tǒng),分享多mic語音方案、音視頻、編解碼等技術,與大家一起成長! 優(yōu)質(zhì)專欄: Audio工程師進階系列 【 原創(chuàng)干貨持續(xù)更新中…… 】?? 人生格言: 人生從來沒有捷徑,只有行動才是治療恐懼和懶惰的唯一良藥. 更多原創(chuàng),歡迎關注:An

    2024年02月15日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包