国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

最近怎么流量漲這么多？那我開(kāi)始講Hive特性了！

2年前作者：Joy T分類(lèi)：Toy博客閱讀(21)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了最近怎么流量漲這么多？那我開(kāi)始講Hive特性了！。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Hive架構(gòu)原理

a.用戶接口：Client

CLI（Hive shell）、JDBC/ODBC(java訪問(wèn)hive)、Hive WEBUI（瀏覽器訪問(wèn)hive）和Thrift服務(wù)器
b.驅(qū)動(dòng)器：Driver
解析器（SQL Parser）：將SQL字符串轉(zhuǎn)換成抽象語(yǔ)法樹(shù)AST，這一步一般都用第三方工具庫(kù)完成，比如antlr；對(duì)AST進(jìn)行語(yǔ)法分析，比如表是否存在、字段是否存在、SQL語(yǔ)義是否有誤。
編譯器（Physical Plan）：將AST編譯生成邏輯執(zhí)行計(jì)劃
優(yōu)化器（Query Optimizer）：對(duì)邏輯執(zhí)行計(jì)劃進(jìn)行優(yōu)化。
執(zhí)行器（Execution）：把邏輯執(zhí)行計(jì)劃轉(zhuǎn)換成可以運(yùn)行的物理計(jì)劃對(duì)于Hive來(lái)說(shuō)，就是MR/Spark
c.元數(shù)據(jù)：MetaStore
通俗來(lái)說(shuō)，元數(shù)據(jù)就是“數(shù)據(jù)的數(shù)據(jù)”，例如一張表里有許多數(shù)據(jù)，而元數(shù)據(jù)則是在描述該表的相關(guān)信息，例如創(chuàng)建時(shí)間、列數(shù)、行數(shù)等。Hive的元數(shù)據(jù)默認(rèn)儲(chǔ)存在derby數(shù)據(jù)庫(kù)里，但推薦儲(chǔ)存在MySQL里。
d.存儲(chǔ)和計(jì)算
使用HDFS進(jìn)行存儲(chǔ)，使用MapReduce進(jìn)行計(jì)算
一句話概括：Hive通過(guò)給用戶提供的一系列交互接口，接收到用戶的指令(SQL)，使用自己的Driver，結(jié)合元數(shù)據(jù)(MetaStore)，將這些指令翻譯成MapReduce，提交到Hadoop中執(zhí)行，最后，將執(zhí)行返回的結(jié)果輸出到用戶交互接口

索引！

Hive在加載數(shù)據(jù)的過(guò)程中不會(huì)對(duì)數(shù)據(jù)進(jìn)行任何處理，甚至不會(huì)對(duì)數(shù)據(jù)進(jìn)行掃描，因此也沒(méi)有對(duì)數(shù)據(jù)中的某些Key建立索引。
Hive要訪問(wèn)數(shù)據(jù)中滿足條件的特定值時(shí)，需要暴力掃描整個(gè)數(shù)據(jù)，因此訪問(wèn)延遲較高。由于 MapReduce 的引入， Hive 可以并行訪問(wèn)數(shù)據(jù)，因此即使沒(méi)有索引，對(duì)于大量數(shù)據(jù)的訪問(wèn)，Hive 仍然可以體現(xiàn)出優(yōu)勢(shì)但由于數(shù)據(jù)的訪問(wèn)延遲較高，決定了 Hive 不適合在線數(shù)據(jù)查詢
- 延遲原因：掃描整個(gè)表、底層MR延遲也高
- 數(shù)據(jù)庫(kù)的低延遲是有條件的，當(dāng)數(shù)據(jù)庫(kù)單獨(dú)處理不了超大規(guī)模數(shù)據(jù)時(shí)，并行提供的優(yōu)勢(shì)就大于低延遲的單個(gè)個(gè)體了
而在數(shù)據(jù)庫(kù)中，通常會(huì)針對(duì)一個(gè)或者幾個(gè)列建立索引，提升訪問(wèn)特定條件下數(shù)據(jù)訪問(wèn)的效率，并擁有較低的延遲

建表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], …)]
[CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], …)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format] [STORED AS file_format]
`` [LOCATION hdfs_path];

EXTERNAL關(guān)鍵字可以讓用戶創(chuàng)建一個(gè)外部表，在建表的同時(shí)指定一個(gè)指向?qū)嶋H數(shù)據(jù)的路徑（LOCATION），Hive創(chuàng)建內(nèi)部表時(shí)，會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉(cāng)庫(kù)指向的路徑。
若創(chuàng)建外部表，僅記錄數(shù)據(jù)所在的路徑，不對(duì)數(shù)據(jù)的位置做任何改變
在刪除表的時(shí)候，內(nèi)部表的元數(shù)據(jù)和數(shù)據(jù)會(huì)被一起刪除，而外部表只刪除元數(shù)據(jù)，不刪除數(shù)據(jù)
STORED AS ORC：下次試一下以O(shè)RC文件存儲(chǔ)一張表，養(yǎng)成這樣的習(xí)慣，這個(gè)表只有優(yōu)點(diǎn)

內(nèi)部表和外部表

**內(nèi)部表：**默認(rèn)創(chuàng)建的表都是內(nèi)部表，或稱(chēng)管理表managed table。Hive會(huì)::或多或少地::控制著數(shù)據(jù)的生命周期。Hive默認(rèn)情況下會(huì)將這些表的數(shù)據(jù)存儲(chǔ)在由配置項(xiàng)hive.metastore.warehouse.dir(例如/user/hive/warehouse)所定義的目錄的子目錄下。當(dāng)我們刪除一個(gè)管理表時(shí)，Hive也會(huì)刪除這個(gè)表中數(shù)據(jù)。++管理表不適合和其他工具共享數(shù)據(jù)++
外部表：如果表是外部表，那么Hive并非認(rèn)為其完全擁有這份數(shù)據(jù)刪除該表并不會(huì)刪除掉這份數(shù)據(jù)，不過(guò)描述表的元數(shù)據(jù)信息會(huì)被刪除掉。::所以建一張外部表的實(shí)質(zhì)是在元數(shù)據(jù)建立一個(gè)路徑指向外部數(shù)據(jù)源::，刪除外部表只是刪除元數(shù)據(jù)里的信息而原始數(shù)據(jù)不會(huì)刪除，當(dāng)重建表時(shí)可直接讀取原始數(shù)據(jù)

分區(qū)

究其實(shí)質(zhì)，建一張表就是建一個(gè)文件夾，然后把數(shù)據(jù)放在該文件夾里；而分區(qū)則是指在這個(gè)文件夾(table)下又建立一個(gè)子文件夾，把歸屬這個(gè)分區(qū)的數(shù)據(jù)放在這個(gè)子文件夾中。最為常見(jiàn)的分區(qū)字段就是日期字段，如20200630的數(shù)據(jù)會(huì)放在該表下‘20200630’歸屬的文件夾里。::以后會(huì)出現(xiàn)分區(qū)刪除等操作，所以掌握分區(qū)非常重要::文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-773833.html

分區(qū)的好處在于提供數(shù)據(jù)查詢效率，當(dāng)需要某個(gè)分區(qū)數(shù)據(jù)時(shí)Hive只需要去掃描該表下所需子文件夾即可，而不用全表掃描一遍。++是有點(diǎn)像跳表的索引層，不過(guò)會(huì)不會(huì)允許像跳表一樣重疊，這個(gè)需要進(jìn)一步學(xué)習(xí)++
分區(qū)需要在建表時(shí)進(jìn)行，語(yǔ)句為：PARTITIONED BY (col_name data_type)
增加一個(gè)分區(qū)時(shí)：alter table table_name add partition(dt='20200630');
增加多個(gè)分區(qū)時(shí)：alter table table_name add partition(dt='20200630') partition(dt='20200701');
刪除一個(gè)分區(qū)時(shí)：alter table table_name drop partition(dt='20200630');
刪除多個(gè)分區(qū)時(shí)（注意逗號(hào)！）：alter table table_name drop partition(dt='20200630'),partition(dt='20200701');

其他科普小知識(shí)

世界上最大的Hadoop 集群在 Yahoo!，2009年的規(guī)模在4000 臺(tái)節(jié)點(diǎn)左右，美團(tuán)近年來(lái)達(dá)到了6000臺(tái)以上。而數(shù)據(jù)庫(kù)由于** ACID 語(yǔ)義的嚴(yán)格限制，擴(kuò)展性非常有限**目前最先進(jìn)的并行數(shù)據(jù)庫(kù)Oracle在理論上的擴(kuò)展能力也只有100臺(tái)左右
- 但好像Hadoop也沒(méi)有萬(wàn)臺(tái)那種，好像也不是很厲害……

到了這里，關(guān)于最近怎么流量漲這么多？那我開(kāi)始講Hive特性了！的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

最近網(wǎng)絡(luò)上的移動(dòng)手機(jī)大流量卡，三種坑讓你避免中招！
小伙伴們都知道，移動(dòng)手機(jī)流量卡在信號(hào)上比較于聯(lián)通電信是有一定的優(yōu)勢(shì)的，移動(dòng)基站多，自然信號(hào)就會(huì)更好些，所以，一般選擇手機(jī)流量卡的小伙伴們都會(huì)優(yōu)先考慮移動(dòng)手機(jī)流量卡。不過(guò)現(xiàn)在并不是入手移動(dòng)手機(jī)流量卡的好時(shí)機(jī)，因?yàn)楝F(xiàn)在4大運(yùn)營(yíng)商還在競(jìng)合之中，只有
2024年02月14日
瀏覽(17)
大數(shù)據(jù)畢業(yè)設(shè)計(jì)Flink+Hadoop+Hive地鐵客流量可視化地鐵客流量預(yù)測(cè) 交通大數(shù)據(jù) 地鐵客流量大數(shù)據(jù) 交通可視化機(jī)器學(xué)習(xí) 深度學(xué)習(xí) 人工智能知識(shí)圖譜數(shù)據(jù)可視化計(jì)算機(jī)畢業(yè)設(shè)計(jì)
河北傳媒學(xué)院本科畢業(yè) 論文開(kāi)題報(bào)告專(zhuān)業(yè) 小四號(hào)宋體班級(jí) 小四號(hào)宋體姓名小四號(hào)宋體學(xué)號(hào) 小四號(hào)宋體指導(dǎo)教師小四號(hào)宋體題目基于hadoop+spark的深圳市地鐵運(yùn)營(yíng)的分析與可視化（1.內(nèi)容包括：課題的來(lái)源及意義，國(guó)內(nèi)外發(fā)展?fàn)顩r，本課題的研究目標(biāo)、內(nèi)容、方法、手
2024年03月19日
瀏覽(36)
hive怎么更新數(shù)據(jù)
要在Hive中更新數(shù)據(jù)，你可以使用INSERT OVERWRITE或INSERT INTO語(yǔ)句。使用INSERT OVERWRITE語(yǔ)句時(shí)，首先需要?jiǎng)?chuàng)建一個(gè)臨時(shí)表，將需要更新的數(shù)據(jù)插入到臨時(shí)表中，然后使用INSERT OVERWRITE將臨時(shí)表的數(shù)據(jù)覆蓋到原始表中。示例： -- 創(chuàng)建臨時(shí)表并插入需要更新的數(shù)據(jù) CREATE TABLE temp_table AS
2024年02月04日
瀏覽(17)
【從零開(kāi)始拿捏數(shù)據(jù)結(jié)構(gòu)】順序表是什么？它有什么樣的特性？結(jié)構(gòu)到底是什么樣的？
?? 嶼小夏：個(gè)人主頁(yè) ??個(gè)人專(zhuān)欄：數(shù)據(jù)結(jié)構(gòu)解析 ?? 莫道桑榆晚，為霞尚滿天！ ? 什么是數(shù)據(jù)結(jié)構(gòu)？我們?yōu)槭裁匆獙W(xué)數(shù)據(jù)結(jié)構(gòu)？數(shù)據(jù)結(jié)構(gòu)中的順序表長(zhǎng)什么樣子？它是怎么運(yùn)用？ ? 本期我們將對(duì)這些一一講解,徹底明白數(shù)據(jù)結(jié)構(gòu)的重要性，以及順序表是一種什么的數(shù)據(jù)
2024年02月08日
瀏覽(28)
從零開(kāi)始學(xué)習(xí)iftop流量監(jiān)控（找出服務(wù)器耗費(fèi)流量最多的ip和端口）
iftop是類(lèi)似于top的實(shí)時(shí)流量監(jiān)控工具。作用：監(jiān)控網(wǎng)卡的實(shí)時(shí)流量（可以指定網(wǎng)段）、反向解析IP、顯示端口信息等官網(wǎng)： http://www.ex-parrot.com/~pdw/iftop/ 一般參數(shù) 主機(jī)參數(shù) 端口顯示參數(shù) 輸出排序參數(shù) 1.顯示網(wǎng)卡eth0的信息，主機(jī)通過(guò)ip顯示 2.顯示端口號(hào)（添加-P參數(shù)，進(jìn)入界面
2023年04月08日
瀏覽(28)
工作這么久了，還不懂如何使用純前端實(shí)現(xiàn)分頁(yè)嗎？-假如后端一股腦返回給你所有數(shù)據(jù)，讓你自個(gè)實(shí)現(xiàn)分頁(yè)該怎么辦
有這么個(gè)場(chǎng)景，后端接口的列表數(shù)據(jù)沒(méi)有做分頁(yè)給我，相當(dāng)于是直接返回所有的列表數(shù)據(jù)，比如有100條就返回100，但是前端顯示，則需要做成分頁(yè)，比如10條為一頁(yè)。假如你用vue來(lái)實(shí)現(xiàn)，思路就是將數(shù)據(jù)切割，然后分批顯示。所以可以使用 computed 計(jì)算屬性和 v-for 指令來(lái)實(shí)現(xiàn)
2024年04月17日
瀏覽(22)
ChatGPT這么火，我們能怎么辦？
今天打開(kāi)百度，看到這樣一條熱搜高居榜二：B站UP主發(fā)起停更潮，然后點(diǎn)進(jìn)去了解一看，大體是因?yàn)樽罱麬I創(chuàng)作太火，對(duì)高質(zhì)量原創(chuàng)形成了巨大沖擊！記得之前看過(guò)一位UP主的分享，說(shuō)B站UP主的年收入大體約等于粉絲體量！B站UP主本來(lái)是非常具有吸引力的新星職業(yè)，但如今在
2023年04月21日
瀏覽(28)
網(wǎng)絡(luò)編程——TCP的特性之自動(dòng)重傳/流量控制/擁塞控制，一篇說(shuō)清楚
自動(dòng)重傳請(qǐng)求（Automatic Repeat-reQuest），通過(guò)使用確認(rèn)和超時(shí)這兩個(gè)機(jī)制，在不可靠服務(wù)的基礎(chǔ)上實(shí)現(xiàn)可靠的信息傳輸，其中包括停止等待ARQ協(xié)議和連續(xù)ARQ協(xié)議 1.1 停止等待ARQ 發(fā)送窗口大小為1，接收窗口大小也為1 發(fā)送方每發(fā)送一個(gè)數(shù)據(jù)包，就要等待接收方返回ack包，如果在定
2024年04月26日
瀏覽(33)
蘋(píng)果Mac電腦怎么顯示/取消顯示最近使用的文檔記錄
Mac可以隱藏最近使用的文檔嗎？有些小伙伴的mac打開(kāi)finder會(huì)自動(dòng)打開(kāi)“ 最近使用 ”項(xiàng)目，將最近所有打開(kāi)的圖片，txt文檔等都一一展現(xiàn)出來(lái)，沒(méi)有任何隱私可言。那么該如何在 finder設(shè)置不顯示最近文檔呢？下面小編就介紹一下該如何關(guān)閉最近使用這項(xiàng)功能。 1、在左上角，
2024年02月10日
瀏覽(139)
ChatGPT是怎么實(shí)現(xiàn)的？為什么它這么有效？
ChatGPT 能夠自動(dòng)生成類(lèi)似于人類(lèi)寫(xiě)作的文本，這一點(diǎn)非常引人注目，也令人意外。但它是如何實(shí)現(xiàn)的？為什么它能夠如此出色地生成我們認(rèn)為有意義的文本？我的目的是在這里概述ChatGPT內(nèi)部的運(yùn)行情況，并探討它能夠如此出色地產(chǎn)生有意義文本的原因。首先需要解釋的是，
2023年04月26日
瀏覽(23)

<rp id="q5v3m"></rp>

<style id="q5v3m"><nobr id="q5v3m"><tt id="q5v3m"></tt></nobr></style>

<style id="q5v3m"></style>

<style id="q5v3m"></style>