国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<p id="9xs9y"><ins id="9xs9y"></ins></p>

Hive和Impala的行列轉(zhuǎn)換

2年前作者：KeepHadoop分類(lèi)：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Hive和Impala的行列轉(zhuǎn)換。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Hive

explode+lateral
group by+collect_list
一、列轉(zhuǎn)行 (對(duì)某列拆分，形成新列)
使用函數(shù)：lateral view explode(split(column, ‘,’)) num
eg: 如表：t_row_to_column_tmp 數(shù)據(jù)如下，對(duì)tag列進(jìn)行拆分
impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,tag,tag_new
  from t_row_to_column_tmp
lateral view explode(split(tag, ',')) num as tag_new
where id=212022894;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop
二、行轉(zhuǎn)列 (根據(jù)主鍵，對(duì)某列進(jìn)行合并)
使用函數(shù)：concat_ws(‘,’,collect_set(column))
說(shuō)明：collect_list 不去重，collect_set 去重。 column 的數(shù)據(jù)類(lèi)型要求是 string
eg：如表：t_column_to_row ，根據(jù)id，對(duì)tag_new 進(jìn)行合并
impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,
         concat_ws(',',collect_set(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select id,
         concat_ws(',',collect_list(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

Impala

Impala 不支持 hive COLLECT_SET函數(shù)的方式，使用GROUP_CONCAT函數(shù)+SPLIT_PART函數(shù)替代

## IMPALA
SELECT SCORE,SPLIT_PART(GROUP_CONCAT(NAME),',',1) FROM TEST.STUDENT GROUP BY SCORE 
## HIVE
SELECT SCORE,COLLECT_SET(NAME)[0] FROM TEST.STUDENT GROUP BY SCORE

例子：

select 
	a.zhusulvguan,group_concat(b.peopleid,',') ,group_concat(b.peopleid2,',')
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where 
group by a.zhusulvguan

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop

select 
	a.zhusulvguan,concat(group_concat(b.peopleid,','),',',group_concat(b.peopleid2,',')) peopleidall
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where group by a.zhusulvguan

impala 列轉(zhuǎn)行,Hadoop零碎問(wèn)題點(diǎn),hive,數(shù)據(jù)庫(kù),hadoop 文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-517485.html

總結(jié)：
①group_concat（column[,char]）函數(shù)：把同組中指定的column放到一行中[通過(guò)char連接]，并且去重（列名去重，值不去重）。
②既然是同組數(shù)據(jù)的操作，那么group_concat()就要配合group by使用。特別的，group by 分組依據(jù)并不強(qiáng)制要求和group_concat(column)指定的column相同（個(gè)數(shù)，字段名）。
③concat(column1,‘cahr’,column2)：column1和column2的值通過(guò)cahr連接后合并

到了這里，關(guān)于Hive和Impala的行列轉(zhuǎn)換的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Impala時(shí)間轉(zhuǎn)換to_date、to_timestamp
在時(shí)間的運(yùn)算上，也常常使用到日期格式的轉(zhuǎn)換，如日期字符串轉(zhuǎn)為日期型，日期轉(zhuǎn)為格式化字符串，是兩種常見(jiàn)的需求；另外也有需要將時(shí)間轉(zhuǎn)為時(shí)間戳的場(chǎng)景等等；時(shí)間數(shù)據(jù)的轉(zhuǎn)換上，主要用 to_date、to_timestamp ，即可滿(mǎn)足日期字符串轉(zhuǎn)為日期型的需求； from_timestamp、fr
2023年04月25日
瀏覽(19)
1、通過(guò)億級(jí)數(shù)據(jù)量在hive和impala中查詢(xún)比較text、orc和parquet性能表現(xiàn)（二）
本文通過(guò)在hdfs中三種不同數(shù)據(jù)格式文件存儲(chǔ)相同數(shù)量的數(shù)據(jù)，通過(guò)hive和impala兩種客戶(hù)端查詢(xún)進(jìn)行比較。本文前提：熟悉hadoop、hive和impala、kafka、flink等，并且其環(huán)境都可正常使用。（在后續(xù)的專(zhuān)欄中都會(huì)將對(duì)應(yīng)的內(nèi)容補(bǔ)全，目前已經(jīng)完成了zookeeper和hadoop的部分。）本文分為
2024年02月12日
瀏覽(24)
成功解決Impala中修改parquet表的字段類(lèi)型問(wèn)題
最近有個(gè)小伙伴在開(kāi)發(fā)中遇到了 Impala 中修改 Parquet 表的字段類(lèi)型問(wèn)題，于是開(kāi)啟了問(wèn)題解決之路。這個(gè)小伙伴在 Impala 中對(duì) Hive 的表進(jìn)行了刪除、修改字段類(lèi)型等操作，等這些操作后去 Impala 去查詢(xún)?cè)摫淼臅r(shí)候，出現(xiàn)了如下的問(wèn)題：問(wèn)題1：問(wèn)題2：
2024年02月16日
瀏覽(29)
【dbeaver】win環(huán)境的kerberos認(rèn)證和Clouders/cdh集群中Kerberos認(rèn)證使用Dbeaver連接Hive、Impala和Phoenix
1.1 下載安裝MIT KERBEROS客戶(hù)端 MIT KERBEROS 下載較新的版本即可。下載之后一路默認(rèn)安裝即可。注意：不要修改軟件安裝位置。修改系統(tǒng)環(huán)境變量中的Path。將剛剛的安裝路徑置頂。（不置頂，也要比 %JAVA_HOME%bin 和 anaconda 相關(guān)的高）使用CMD命令確認(rèn)下： 1.2 修改 krb5.conf 文件并
2024年02月02日
瀏覽(25)
【大數(shù)據(jù)入門(mén)核心技術(shù)-Impala】（一）Impala簡(jiǎn)介
目錄一、Impala介紹二、Impala優(yōu)勢(shì) 三、Impala主要功能 ????????Impala是Cloudera公司主導(dǎo)開(kāi)發(fā)的新型查詢(xún)系統(tǒng)，它提供SQL語(yǔ)義，能查詢(xún)存儲(chǔ)在Hadoop的HDFS和HBase中的PB級(jí)大數(shù)據(jù)。已有的Hive系統(tǒng)雖然也提供了SQL語(yǔ)義，但由于Hive底層執(zhí)行使用的是MapReduce引擎，仍然是一個(gè)批處理過(guò)程
2024年02月16日
瀏覽(23)
Impala與Docker：如何在容器化環(huán)境中優(yōu)化Impala性能
作者：禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) 容器技術(shù)作為云計(jì)算領(lǐng)域的新興技術(shù)，越來(lái)越受到各行各業(yè)的青睞。容器技術(shù)的出現(xiàn)使得應(yīng)用軟件可以輕松部署、擴(kuò)展和管理；由于容器隔離了應(yīng)用程序的運(yùn)行環(huán)境，使得其具有更高的資源利用率；同時(shí)也方便實(shí)現(xiàn)多任務(wù)并行處理，提升了系統(tǒng)
2024年02月07日
瀏覽(22)
大數(shù)據(jù)之 impala教程
一、什么是Impala？ Impala是用于處理存儲(chǔ)在Hadoop集群中的大量數(shù)據(jù)的MPP（大規(guī)模并行處理）SQL查詢(xún)引擎。它是一個(gè)用C ++和Java編寫(xiě)的開(kāi)源軟件。與其他Hadoop的SQL引擎相比，它提供了高性能和低延遲。換句話(huà)說(shuō)，Impala是性能最高的SQL引擎（提供類(lèi)似RDBMS的體驗(yàn)），它提供了訪問(wèn)
2024年02月15日
瀏覽(26)
impala元數(shù)據(jù)自動(dòng)刷新
一.操作步驟進(jìn)入CM界面 Hive 配置搜索啟用數(shù)據(jù)庫(kù)中的存儲(chǔ)通知(英文界面搜索：Enable Stored Notifications in Database)，并且勾選，注意一定要勾選，配置后面的配置不生效。數(shù)據(jù)庫(kù)通知的保留時(shí)間默認(rèn)為2天，意味著如果事件通知沒(méi)有更新超過(guò)2天事件將會(huì)丟失二.hive配置參數(shù) hive
2024年01月20日
瀏覽(24)
Impala計(jì)算日期差datediff
在數(shù)據(jù)庫(kù)查詢(xún)上，除了獲取當(dāng)前日期、進(jìn)行日期加減外，常見(jiàn)的還有計(jì)算兩個(gè)日期之后的日期差，為一些指標(biāo)的計(jì)算提供時(shí)間基礎(chǔ)； Impala中常用的日期差函數(shù) datediff ，就是用來(lái)計(jì)算兩個(gè)日期之間的間隔；使用方式如下：類(lèi)似日期差的計(jì)算中，還有其他計(jì)算時(shí)間差的函數(shù)，如
2024年02月11日
瀏覽(19)
Impala：大數(shù)據(jù)交互查詢(xún)工具
Impala是由Cloudera公司開(kāi)發(fā)的一款開(kāi)源的大數(shù)據(jù)交互查詢(xún)工具，能夠?qū)Υ鎯?chǔ)在HDFS、HBase上的數(shù)據(jù)進(jìn)行快速的交互式SQL查詢(xún)。Impala可以實(shí)現(xiàn)對(duì)PB級(jí)別的數(shù)據(jù)的實(shí)時(shí)分析，其查詢(xún)速度比基于MapReduce的Hive高出3到90倍。Impala使用了類(lèi)似于傳統(tǒng)的MPP數(shù)據(jù)庫(kù)技術(shù)，避免了MapReduce引擎的啟動(dòng)開(kāi)
2023年04月14日
瀏覽(17)

<rp id="jygnj"></rp>

<i id="jygnj"><ins id="jygnj"></ins></i>