国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

hive數(shù)據(jù)的導入導出

這篇具有很好參考價值的文章主要介紹了hive數(shù)據(jù)的導入導出。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

一、hive 的數(shù)據(jù)導入

Linux本地文件以及數(shù)據(jù)格式:
hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫
在hive中創(chuàng)建表:

create table t_user(
id int
,name string
)
row format delimited
fields terminated by ","
lines terminated by '\n'
stored as textfile;

stored as常見的幾種格式

1. TextFile:使用TextFile格式存儲的表將數(shù)據(jù)以文本文件的形式進行存儲。這是最常用的默認存儲格式。
2. SequenceFile:使用SequenceFile格式存儲的表將數(shù)據(jù)以鍵-值對的形式存儲,適用于數(shù)據(jù)壓縮和高效讀取。
3. ORC(Optimized Row Columnar):ORC是Hive的一種高性能列式存儲格式,它以列的方式組織數(shù)據(jù),提供了更高的壓縮率和查詢性能。
4. Parquet:Parquet是一種列式存儲格式,也是Hive的一個常用選項。它支持高度壓縮和謂詞下推等優(yōu)化,適用于大規(guī)模數(shù)據(jù)分析。
5. Avro:Avro是一種跨語言的數(shù)據(jù)序列化系統(tǒng),Hive可以使用Avro格式存儲數(shù)據(jù)!

加載本地數(shù)據(jù)

load data local inpath '/home/hivedata/user.txt' into table t_user ;
-- 如果在into前面加了overwrite就是覆蓋之前的數(shù)據(jù)重新導入數(shù)據(jù)

加載hdfs上的數(shù)據(jù)
*注意:hdfs上需要有數(shù)據(jù)
從本地上傳文件到hdfs上
hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫

// 追加添加
load data inpath '/yan/hivedata/user.txt' into table t_user;
//覆蓋添加
load data inpath '/yan/hivedata/user.txt' into table t_user;

把別的表中的數(shù)據(jù)插入目標表

create table u1(
id int,
name string
);
insert into u1
(select id ,name from t_user);
# 查詢一次插入多個表 ,把from寫在前面
from t_user 
insert into u2 select *
insert into u3 select id ,name;

克隆表

-- 把表結(jié)構(gòu)和數(shù)據(jù)一起復制
create table u4 as select * from t_user;
-- 只復制表結(jié)構(gòu),只需要使用like 表名即可,不用select
create table u5 like t_user;

本地數(shù)據(jù)導入和hdfs數(shù)據(jù)導入的區(qū)別:

本地:將數(shù)據(jù)copy到hdfs的表目錄下
hdfs:將數(shù)據(jù)剪切到hdfs的表目錄下

二、hive中數(shù)據(jù)的導出

導出到本地文件系統(tǒng)的目錄下

# 必須加overwrite
insert overwrite local directory '/home/hivedata/out/out1' select * from t_user;
# 在本地Linux系統(tǒng)中,最后一級的out1也是目錄

hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫
hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫

導出到hdfs的目錄下

-- 比本地少了local
insert overwrite directory '/yan/hivedata/out/out1' select * from t_user;

導出的數(shù)據(jù)文件中,默認字段不分割,其中的方括號是hdfs默認的分隔,之前的逗號分隔符沒有了hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫
把hdfs上的數(shù)據(jù)導入到Linux本地:

hive -e 'select * from zoo.t_user' >> /home/hivedata/out/out2/02
# 02是我建的空文件
# 導出的文件中字段分隔符默認是\t

hive數(shù)據(jù)的導入導出,hive,hadoop,數(shù)據(jù)倉庫文章來源地址http://www.zghlxwxcb.cn/news/detail-525318.html

到了這里,關(guān)于hive數(shù)據(jù)的導入導出的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務器費用

相關(guān)文章

  • 大數(shù)據(jù)技術(shù)之Hadoop學習(七)——Hive數(shù)據(jù)倉庫

    大數(shù)據(jù)技術(shù)之Hadoop學習(七)——Hive數(shù)據(jù)倉庫

    目錄 素材 一、數(shù)據(jù)倉庫簡介 1、數(shù)據(jù)倉庫的認識 (1)數(shù)據(jù)倉庫是面向主題的。 (2)數(shù)據(jù)倉庫是隨時間變化的。 (3)數(shù)據(jù)倉庫相對穩(wěn)定 (4)OLTP和OLAP 2、數(shù)據(jù)倉庫的結(jié)構(gòu) (1)數(shù)據(jù)源 (2)數(shù)據(jù)存儲及管理 (3)OLAP 服務器 (4)前端工具 3、數(shù)據(jù)倉庫的數(shù)據(jù)模型 (1)星狀模

    2024年02月17日
    瀏覽(59)
  • 使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出

    使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出

    ???????? DataX 是 阿里巴巴開源 的一個異構(gòu)數(shù)據(jù)源離線同步工具,致力于實現(xiàn)包括關(guān)系型數(shù)據(jù)庫(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等 各種異構(gòu)數(shù)據(jù)源之間穩(wěn)定高效的數(shù)據(jù)同步 功能。 ???????? 為了解決異構(gòu)數(shù)據(jù)源同步問題,DataX 將復雜的 網(wǎng)狀 的同步鏈路變成了

    2024年02月08日
    瀏覽(31)
  • 使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出
一、概論

    使用DataX實現(xiàn)mysql與hive數(shù)據(jù)互相導入導出 一、概論

    ???????? DataX 是 阿里巴巴開源 的一個異構(gòu)數(shù)據(jù)源離線同步工具,致力于實現(xiàn)包括關(guān)系型數(shù)據(jù)庫(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等 各種異構(gòu)數(shù)據(jù)源之間穩(wěn)定高效的數(shù)據(jù)同步 功能。 ???????? 為了解決異構(gòu)數(shù)據(jù)源同步問題,DataX 將復雜的 網(wǎng)狀 的同步鏈路變成了

    2024年02月14日
    瀏覽(22)
  • 大數(shù)據(jù):hive數(shù)據(jù)庫的操作語法,數(shù)據(jù)表,內(nèi)部表,external外部表,數(shù)據(jù)導入導出load,insert

    大數(shù)據(jù):hive數(shù)據(jù)庫的操作語法,數(shù)據(jù)表,內(nèi)部表,external外部表,數(shù)據(jù)導入導出load,insert

    2022找工作是學歷、能力和運氣的超強結(jié)合體,遇到寒冬,大廠不招人,可能很多算法學生都得去找開發(fā),測開 測開的話,你就得學數(shù)據(jù)庫,sql,oracle,尤其sql要學,當然,像很多金融企業(yè)、安全機構(gòu)啥的,他們必須要用oracle數(shù)據(jù)庫 這oracle比sql安全,強大多了,所以你需要學

    2024年02月08日
    瀏覽(34)
  • hive 導入導出csv文件

    1、導入 將CSV文件導入到hive數(shù)據(jù)庫,具體操作如下, 首先在hive中創(chuàng)建自己的table, 并且設置以逗號分隔。 然后 確定tmp.hb_label_C表的分布式文件路徑 最后在linux命令行輸入 查看結(jié)果 2、導出 使用beeline重定向 同時使用以下方式導出數(shù)據(jù)帶表頭

    2024年02月16日
    瀏覽(21)
  • Hive/Spark 整庫導出/導入腳本

    博主歷時三年精心創(chuàng)作的《大數(shù)據(jù)平臺架構(gòu)與原型實現(xiàn):數(shù)據(jù)中臺建設實戰(zhàn)》一書現(xiàn)已由知名IT圖書品牌電子工業(yè)出版社博文視點出版發(fā)行,點擊《重磅推薦:建大數(shù)據(jù)平臺太難了!給我發(fā)個工程原型吧!》了解圖書詳情,京東購書鏈接:https://item.jd.com/12677623.html,掃描左側(cè)

    2024年02月12日
    瀏覽(16)
  • Docker基礎入門:鏡像、容器導入導出與私有倉庫搭建

    Docker基礎入門:鏡像、容器導入導出與私有倉庫搭建

    ??The Begin??點點關(guān)注,收藏不迷路?? 1.鏡像導入 是復制的過程。 2.容器導入 是將當前容器 變成一個新的鏡像。 save 和 export區(qū)別: 1)save 保存鏡像所有的信息-包含歷史信息。 2)export 只導出當前的信息。 首先,兩者的操作對象不同。docker save是將一個鏡像保存為一個tar包

    2024年02月12日
    瀏覽(22)
  • Postman 實現(xiàn)備份數(shù)據(jù) Postman恢復數(shù)據(jù) postman 導出導入數(shù)據(jù) postman 導入導出數(shù)據(jù)

    Postman 實現(xiàn)備份數(shù)據(jù) Postman恢復數(shù)據(jù) postman 導出導入數(shù)據(jù) postman 導入導出數(shù)據(jù)

    ????????在使用postman調(diào)試接口時,若遇到內(nèi)網(wǎng)的環(huán)境,無法通過賬戶同步數(shù)據(jù); 在A電腦調(diào)試的接口數(shù)據(jù),需要移動到B電腦上,如何實現(xiàn)postman 的數(shù)據(jù)遷移(導出)功能呢? ????????在新的電腦上,如何導入postman的數(shù)據(jù)呢? ????????本文將整理 postman的數(shù)據(jù)導出、

    2024年01月25日
    瀏覽(28)
  • 數(shù)倉報表數(shù)據(jù)導出——Hive數(shù)據(jù)導出至Clickhouse

    數(shù)倉報表數(shù)據(jù)導出——Hive數(shù)據(jù)導出至Clickhouse

    創(chuàng)建database 創(chuàng)建table 使用 spark-sql 查詢數(shù)據(jù),然后通過 jdbc 寫入Clickhouse。 創(chuàng)建Maven項目,pom.xml文件如下 創(chuàng)建HiveToClickhouse類 上傳hive.xml,hdfs.xml 以及core-site.xml文件到項目的resource目錄下 打包,并上傳hive-to-clickhouse-1.0-SNAPSHOT-jar-with-dependencies.jar到hadoop節(jié)點 執(zhí)行如下命令測試 為

    2024年02月16日
    瀏覽(41)
  • 數(shù)據(jù)導入與預處理——實驗一:數(shù)據(jù)導入與導出

    數(shù)據(jù)導入與預處理——實驗一:數(shù)據(jù)導入與導出

    目的: 掌握使用Kettle進行數(shù)據(jù)導入與導出的方法 主要儀器設備: 計算機、Kettle(PDI)、MySQL數(shù)據(jù)庫 某連鎖超市為了優(yōu)化經(jīng)營管理,擬搭建一個商務智能系統(tǒng),來幫助企業(yè)管理團隊更全面、專業(yè)的通過數(shù)據(jù)了解業(yè)務況狀。目前公司有一個訂單數(shù)據(jù)庫,記錄了每一筆訂單的詳細數(shù)

    2024年02月06日
    瀏覽(54)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包