国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Hive和Impala的行列轉(zhuǎn)換

這篇具有很好參考價(jià)值的文章主要介紹了Hive和Impala的行列轉(zhuǎn)換。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Hive

explode+lateral
group by+collect_list

一、列轉(zhuǎn)行 (對(duì)某列拆分,形成新列)
使用函數(shù):lateral view explode(split(column, ‘,’)) num
eg: 如表:t_row_to_column_tmp 數(shù)據(jù)如下,對(duì)tag列進(jìn)行拆分
impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,tag,tag_new
  from t_row_to_column_tmp
lateral view explode(split(tag, ',')) num as tag_new
where id=212022894;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop
二、行轉(zhuǎn)列 (根據(jù)主鍵,對(duì)某列進(jìn)行合并)
使用函數(shù):concat_ws(‘,’,collect_set(column))
說(shuō)明:collect_list 不去重,collect_set 去重。 column 的數(shù)據(jù)類(lèi)型要求是 string
eg:如表:t_column_to_row ,根據(jù)id,對(duì)tag_new 進(jìn)行合并
impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,
         concat_ws(',',collect_set(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,
         concat_ws(',',collect_list(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

Impala

Impala 不支持 hive COLLECT_SET函數(shù)的方式,使用GROUP_CONCAT函數(shù)+SPLIT_PART函數(shù)替代

## IMPALA
SELECT SCORE,SPLIT_PART(GROUP_CONCAT(NAME),',',1) FROM TEST.STUDENT GROUP BY SCORE 
## HIVE
SELECT SCORE,COLLECT_SET(NAME)[0] FROM TEST.STUDENT GROUP BY SCORE

例子:

select 
	a.zhusulvguan,group_concat(b.peopleid,',') ,group_concat(b.peopleid2,',')
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where 
group by a.zhusulvguan

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select 
	a.zhusulvguan,concat(group_concat(b.peopleid,','),',',group_concat(b.peopleid2,',')) peopleidall
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where group by a.zhusulvguan

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-517485.html

總結(jié):
①group_concat(column[,char])函數(shù):把同組中指定的column放到一行中[通過(guò)char連接],并且去重(列名去重,值不去重)。
②既然是同組數(shù)據(jù)的操作,那么group_concat()就要配合group by使用。特別的,group by 分組依據(jù)并不強(qiáng)制要求和group_concat(column)指定的column相同(個(gè)數(shù),字段名)。
③concat(column1,‘cahr’,column2):column1和column2的值通過(guò)cahr連接后合并

到了這里,關(guān)于Hive和Impala的行列轉(zhuǎn)換的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Impala時(shí)間轉(zhuǎn)換to_date、to_timestamp

    在時(shí)間的運(yùn)算上,也常常使用到日期格式的轉(zhuǎn)換,如日期字符串轉(zhuǎn)為日期型,日期轉(zhuǎn)為格式化字符串,是兩種常見(jiàn)的需求;另外也有需要將時(shí)間轉(zhuǎn)為時(shí)間戳的場(chǎng)景等等; 時(shí)間數(shù)據(jù)的轉(zhuǎn)換上,主要用 to_date、to_timestamp ,即可滿(mǎn)足日期字符串轉(zhuǎn)為日期型的需求; from_timestamp、fr

    2023年04月25日
    瀏覽(19)
  • 1、通過(guò)億級(jí)數(shù)據(jù)量在hive和impala中查詢(xún)比較text、orc和parquet性能表現(xiàn)(二)

    1、通過(guò)億級(jí)數(shù)據(jù)量在hive和impala中查詢(xún)比較text、orc和parquet性能表現(xiàn)(二)

    本文通過(guò)在hdfs中三種不同數(shù)據(jù)格式文件存儲(chǔ)相同數(shù)量的數(shù)據(jù),通過(guò)hive和impala兩種客戶(hù)端查詢(xún)進(jìn)行比較。 本文前提:熟悉hadoop、hive和impala、kafka、flink等,并且其環(huán)境都可正常使用。(在后續(xù)的專(zhuān)欄中都會(huì)將對(duì)應(yīng)的內(nèi)容補(bǔ)全,目前已經(jīng)完成了zookeeper和hadoop的部分。) 本文分為

    2024年02月12日
    瀏覽(24)
  • 成功解決Impala中修改parquet表的字段類(lèi)型問(wèn)題

    最近有個(gè)小伙伴在開(kāi)發(fā)中遇到了 Impala 中修改 Parquet 表的字段類(lèi)型問(wèn)題,于是開(kāi)啟了問(wèn)題解決之路。 這個(gè)小伙伴在 Impala 中對(duì) Hive 的表進(jìn)行了刪除、修改字段類(lèi)型等操作,等這些操作后去 Impala 去查詢(xún)?cè)摫淼臅r(shí)候,出現(xiàn)了如下的問(wèn)題: 問(wèn)題1: 問(wèn)題2:

    2024年02月16日
    瀏覽(29)
  • 【dbeaver】win環(huán)境的kerberos認(rèn)證和Clouders/cdh集群中Kerberos認(rèn)證使用Dbeaver連接Hive、Impala和Phoenix

    【dbeaver】win環(huán)境的kerberos認(rèn)證和Clouders/cdh集群中Kerberos認(rèn)證使用Dbeaver連接Hive、Impala和Phoenix

    1.1 下載安裝MIT KERBEROS客戶(hù)端 MIT KERBEROS 下載較新的版本即可。 下載之后一路默認(rèn)安裝即可。 注意:不要修改軟件安裝位置。 修改系統(tǒng)環(huán)境變量中的Path。將剛剛的安裝路徑置頂。(不置頂,也要比 %JAVA_HOME%bin 和 anaconda 相關(guān)的高) 使用CMD命令確認(rèn)下: 1.2 修改 krb5.conf 文件并

    2024年02月02日
    瀏覽(25)
  • 【大數(shù)據(jù)入門(mén)核心技術(shù)-Impala】(一)Impala簡(jiǎn)介

    目錄 一、Impala介紹 二、Impala優(yōu)勢(shì) 三、Impala主要功能 ????????Impala是Cloudera公司主導(dǎo)開(kāi)發(fā)的新型查詢(xún)系統(tǒng),它提供SQL語(yǔ)義,能查詢(xún)存儲(chǔ)在Hadoop的HDFS和HBase中的PB級(jí)大數(shù)據(jù)。已有的Hive系統(tǒng)雖然也提供了SQL語(yǔ)義,但由于Hive底層執(zhí)行使用的是MapReduce引擎,仍然是一個(gè)批處理過(guò)程

    2024年02月16日
    瀏覽(23)
  • Impala與Docker:如何在容器化環(huán)境中優(yōu)化Impala性能

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 容器技術(shù)作為云計(jì)算領(lǐng)域的新興技術(shù),越來(lái)越受到各行各業(yè)的青睞。容器技術(shù)的出現(xiàn)使得應(yīng)用軟件可以輕松部署、擴(kuò)展和管理;由于容器隔離了應(yīng)用程序的運(yùn)行環(huán)境,使得其具有更高的資源利用率;同時(shí)也方便實(shí)現(xiàn)多任務(wù)并行處理,提升了系統(tǒng)

    2024年02月07日
    瀏覽(22)
  • 大數(shù)據(jù)之 impala教程

    大數(shù)據(jù)之 impala教程

    一、什么是Impala? Impala是用于處理存儲(chǔ)在Hadoop集群中的大量數(shù)據(jù)的MPP(大規(guī)模并行處理)SQL查詢(xún)引擎。 它是一個(gè)用C ++和Java編寫(xiě)的開(kāi)源軟件。 與其他Hadoop的SQL引擎相比,它提供了高性能和低延遲。 換句話(huà)說(shuō),Impala是性能最高的SQL引擎(提供類(lèi)似RDBMS的體驗(yàn)),它提供了訪問(wèn)

    2024年02月15日
    瀏覽(26)
  • impala元數(shù)據(jù)自動(dòng)刷新

    impala元數(shù)據(jù)自動(dòng)刷新

    一.操作步驟 進(jìn)入CM界面 Hive 配置 搜索 啟用數(shù)據(jù)庫(kù)中的存儲(chǔ)通知(英文界面搜索:Enable Stored Notifications in Database),并且勾選,注意一定要勾選,配置后面的配置不生效。數(shù)據(jù)庫(kù)通知的保留時(shí)間默認(rèn)為2天,意味著如果事件通知沒(méi)有更新超過(guò)2天事件將會(huì)丟失 二.hive配置參數(shù) hive

    2024年01月20日
    瀏覽(24)
  • Impala計(jì)算日期差datediff

    在數(shù)據(jù)庫(kù)查詢(xún)上,除了獲取當(dāng)前日期、進(jìn)行日期加減外,常見(jiàn)的還有計(jì)算兩個(gè)日期之后的日期差,為一些指標(biāo)的計(jì)算提供時(shí)間基礎(chǔ); Impala中常用的日期差函數(shù) datediff ,就是用來(lái)計(jì)算兩個(gè)日期之間的間隔; 使用方式如下: 類(lèi)似日期差的計(jì)算中,還有其他計(jì)算時(shí)間差的函數(shù),如

    2024年02月11日
    瀏覽(19)
  • Impala:大數(shù)據(jù)交互查詢(xún)工具

    Impala是由Cloudera公司開(kāi)發(fā)的一款開(kāi)源的大數(shù)據(jù)交互查詢(xún)工具,能夠?qū)Υ鎯?chǔ)在HDFS、HBase上的數(shù)據(jù)進(jìn)行快速的交互式SQL查詢(xún)。Impala可以實(shí)現(xiàn)對(duì)PB級(jí)別的數(shù)據(jù)的實(shí)時(shí)分析,其查詢(xún)速度比基于MapReduce的Hive高出3到90倍。Impala使用了類(lèi)似于傳統(tǒng)的MPP數(shù)據(jù)庫(kù)技術(shù),避免了MapReduce引擎的啟動(dòng)開(kāi)

    2023年04月14日
    瀏覽(17)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包