国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七)

這篇具有很好參考價(jià)值的文章主要介紹了Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Doris框架

大規(guī)模并行處理的分析型數(shù)據(jù)庫(kù)產(chǎn)品。使用場(chǎng)景:一般先將原始數(shù)據(jù)經(jīng)過(guò)清洗過(guò)濾轉(zhuǎn)換后,再導(dǎo)入doris中使用。主要實(shí)現(xiàn)的功能有:

  1. 實(shí)時(shí)看板
    • 面向企業(yè)內(nèi)部分析師和管理者的報(bào)表
    • 面向用戶或者客戶的高并發(fā)報(bào)表分析
  2. 即席查詢
  3. 統(tǒng)一數(shù)倉(cāng)構(gòu)建:替換了原來(lái)由Spark, Hive,Kudu, Hbase等舊框架
  4. 數(shù)據(jù)湖聯(lián)邦查詢:通過(guò)外表的方式聯(lián)邦分析位于Hive,IceBerg,Hudi中的數(shù)據(jù)

Doris架構(gòu)

  • 后端:C語(yǔ)言編寫的,用于數(shù)據(jù)查詢
  • 前端:Leader, Follower, Oberserver
    Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七),flink,大數(shù)據(jù),doris

部署注意事項(xiàng)

  1. 磁盤空間按用戶總數(shù)據(jù)量x3副本計(jì)算,然后再預(yù)留額外40%的空間。
  2. 所有部署節(jié)點(diǎn)關(guān)閉swap
  3. FE節(jié)點(diǎn)數(shù)據(jù)至少為1。一個(gè)Follower和一個(gè)Observer時(shí),可以實(shí)現(xiàn)高可用
    Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七),flink,大數(shù)據(jù),doris

參數(shù)修改

  1. 最大同時(shí)打開文件個(gè)數(shù)
  2. 設(shè)置最大虛擬塊,sudo reboot重啟后生效
  3. 根據(jù)自己需求下載對(duì)應(yīng)的安裝包,如果是蘋果電腦下載arm包,否則選擇x64. https://doris.apache.org/download/
  4. 解壓安裝fe, be,以及其他依賴,也就是下載的安裝包里面的三個(gè)文件。
  5. 由于虛擬機(jī)有多張網(wǎng)卡,因此需要修改對(duì)應(yīng)的網(wǎng)段信息,和NAT模式里面的網(wǎng)段對(duì)應(yīng)。

Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七),flink,大數(shù)據(jù),doris

  1. 如果參數(shù)配置錯(cuò)誤,導(dǎo)致無(wú)法成功啟動(dòng),直接刪掉已經(jīng)安裝的文件,直接重新解壓。

配置BE

  1. 修改web_server的端口號(hào),改為7040
  2. 修改網(wǎng)段地址為NAT的網(wǎng)段
  3. 添加單臺(tái)后端BEALTER SYSTEM ADD BACKEND "hadoop102:9050";
  4. /opt/module/doris/be/bin/start_be.sh --daemon啟動(dòng)后端
  5. SHOW PROC '/backends'\G查看后端狀態(tài)

BE后臺(tái)節(jié)點(diǎn)變更

  • 建議直接分發(fā)BE壓縮包,因?yàn)镈oris解壓?jiǎn)?dòng)后就會(huì)產(chǎn)生底層數(shù)據(jù),直接使用新的壓縮包擴(kuò)容會(huì)更為方便。在MySQL客戶端,通過(guò)ALTER SYSTEM ADD BACKEND
  • 減少節(jié)點(diǎn)時(shí)需要先移動(dòng)數(shù)據(jù),然后再刪除。ALTER SYSTEM DECOMMISSION BACKEND "be_host:be_heartbeat_service_port";

FE節(jié)點(diǎn)的變更

  1. 分發(fā)fe文件,注意刪除元數(shù)據(jù)。hadoop102 發(fā)過(guò)來(lái)的元數(shù)據(jù)rm -rf /opt/module/doris/fe/doris-meta/*
  2. 啟動(dòng)FE:/opt/module/doris/fe/bin/start_fe.sh --daemon --helper hadoop102:9010
  3. 查看FE狀態(tài):show proc '/frontends';
  4. FE的縮容:ALTER SYSTEM DROP FOLLOWER[OBSERVER] "fe_host:edit_log_port";

群?jiǎn)⑷宏P(guān)腳本

  • 創(chuàng)建腳本為doris.sh
#!/bin/bash
case $1 in
    "start")
        for host in hadoop102 hadoop103 hadoop104 ; do
            echo "========== 在 $host 上啟動(dòng) fe  ========="
            ssh $host "source /etc/profile; /opt/module/doris/fe/bin/start_fe.sh --daemon"
        done
        for host in hadoop102 hadoop103 hadoop104 ; do
            echo "========== 在 $host 上啟動(dòng) be  ========="
            ssh $host "source /etc/profile; /opt/module/doris/be/bin/start_be.sh --daemon"
        done

       ;;
    "stop")
            for host in hadoop102 hadoop103 hadoop104 ; do
                echo "========== 在 $host 上停止 fe  ========="
                ssh $host "source /etc/profile; /opt/module/doris/fe/bin/stop_fe.sh "
            done
            for host in hadoop102 hadoop103 hadoop104 ; do
                echo "========== 在 $host 上停止 be  ========="
                ssh $host "source /etc/profile; /opt/module/doris/be/bin/stop_be.sh "
            done

           ;;

    *)
        echo "你啟動(dòng)的姿勢(shì)不對(duì)"
        echo "  start   啟動(dòng)doris集群"
        echo "  stop    停止stop集群"

    ;;
esac
  • chmod +x doris.sh 添加腳本執(zhí)行權(quán)限

數(shù)據(jù)表設(shè)計(jì)

  • row: 用戶的一行數(shù)據(jù)
  • column:描述一行數(shù)據(jù)中的不同字段
    • key: 維度列
    • value:指標(biāo)列
  • 分區(qū)分片
    • Tablet:數(shù)據(jù)分片,數(shù)據(jù)劃分的最小邏輯單元
    • Partition:最小的管理單元,數(shù)據(jù)的導(dǎo)入與刪除,都只能針對(duì)一個(gè)partition進(jìn)行
  • 數(shù)據(jù)模型
    • Aggregate聚合模型
      • 一般用來(lái)存放事實(shí)表
      • 副本數(shù)不能高于be的個(gè)數(shù)
      • 沒有冪等性,如果sum求和,多次插入同樣數(shù)據(jù)時(shí),結(jié)果會(huì)加起來(lái)
    • Unique唯一性模型
      • 使用unique key(k1, k2)來(lái)保證key的唯一
      • 底層其實(shí)也是使用聚合模型,非主鍵使用replace關(guān)鍵字
    • Duplicate重復(fù)模型
      • 一般用于收集日志
      • 數(shù)據(jù)會(huì)自動(dòng)排序

建表語(yǔ)法

Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七),flink,大數(shù)據(jù),doris

  1. olap是默認(rèn)引擎,字段可以設(shè)置引擎,如果是其他的引擎,就表示遠(yuǎn)程連接其他數(shù)據(jù)庫(kù)
  2. 盡量選擇整型類型,整型長(zhǎng)度遵循夠用即可
  3. 分區(qū)方式,如果不分區(qū)時(shí),會(huì)默認(rèn)創(chuàng)建一個(gè)跟表名一致的分區(qū)
    • range分區(qū),一般按照天數(shù)劃分。一般使用value less than 的方式來(lái)指定上界,區(qū)間都是左閉右開的
    • list分區(qū),一般按照城市劃分。使用value in(一般是城市名稱列表)
  4. 分桶:分桶字段一般是join時(shí)使用的關(guān)鍵字字段。建議桶的個(gè)數(shù)等于離線時(shí)劃分的個(gè)數(shù)。一般為10~20.
  5. propertities屬性
    • 副本數(shù)
    • 設(shè)定到期時(shí)間,到期后作為冷數(shù)據(jù)放到機(jī)械硬盤

動(dòng)態(tài)分區(qū)

動(dòng)態(tài)分區(qū)只支持Range分區(qū),動(dòng)態(tài)分區(qū)功能啟動(dòng)時(shí),F(xiàn)E會(huì)啟動(dòng)一個(gè)后臺(tái)進(jìn)程,根據(jù)用戶指定的規(guī)則創(chuàng)建或刪除分區(qū)。
Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七),flink,大數(shù)據(jù),doris

  1. 查看分區(qū)詳情:show partition from 表名
  2. 如果分區(qū)不存在,則無(wú)法插入數(shù)據(jù)。并且會(huì)報(bào)錯(cuò) no partition for this tuple

上卷

  1. desc 表名 all :查詢表格的全部信息
  2. 上卷類似MR中的預(yù)聚合,提前創(chuàng)建好要查詢的指標(biāo)。后期查詢?cè)摂?shù)據(jù)時(shí),直接返回即可。也可以對(duì)于部分?jǐn)?shù)據(jù)做排序。

物化視圖

預(yù)先計(jì)算定義好的數(shù)據(jù)集,存儲(chǔ)在Doris中的一個(gè)特殊的表。加快對(duì)固定維度進(jìn)行分析查詢。

  • 適用場(chǎng)景:
    • 查詢僅涉及表中的很小一部分列或行
    • 查詢包含一些耗時(shí)處理操作,比如,事件很久的聚合操作
    • 查詢需要匹配不同的前綴索引
  • 使用
    • 創(chuàng)建物化視圖

    • 檢查物化視圖是否構(gòu)建完成desc sales_records all;

    • 檢驗(yàn)當(dāng)前查詢是否匹配到了合適的物化視圖EXPLAIN SELECT store_id, sum(sale_amt) FROM sales_records GROUP BY store_id;文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-770222.html

create materialized view store_amt as 
select 
store_id, 
sum(sale_amt) 
from sales_records 
group by store_id;

到了這里,關(guān)于Flink實(shí)時(shí)電商數(shù)倉(cāng)之Doris框架(七)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Flink電商實(shí)時(shí)數(shù)倉(cāng)(三)

    Flink電商實(shí)時(shí)數(shù)倉(cāng)(三)

    維度層的重點(diǎn)和難點(diǎn)在于實(shí)時(shí)電商數(shù)倉(cāng)需要的維度信息一般是動(dòng)態(tài)的變化的,并且由于實(shí)時(shí)數(shù)倉(cāng)一般需要一直運(yùn)行,無(wú)法使用常規(guī)的配置文件重啟加載方式來(lái)修改需要讀取的ODS層數(shù)據(jù),因此需要通過(guò)Flink-cdc實(shí)時(shí)監(jiān)控MySql中的維度數(shù)據(jù)配置信息表,實(shí)時(shí)動(dòng)態(tài)的發(fā)布廣播信息。主

    2024年02月03日
    瀏覽(19)
  • Flink實(shí)時(shí)電商數(shù)倉(cāng)(八)

    主要任務(wù):從kafka頁(yè)面日志主題讀取數(shù)據(jù),統(tǒng)計(jì) 七日回流用戶:之前活躍的用戶,有一段時(shí)間不活躍了,之后又開始活躍,稱為回流用戶 當(dāng)日獨(dú)立用戶數(shù):同一個(gè)用戶當(dāng)天重復(fù)登錄,只算作一個(gè)獨(dú)立用戶。 讀取kafka頁(yè)面主題數(shù)據(jù) 轉(zhuǎn)換數(shù)據(jù)結(jié)構(gòu): String - JSONObject 過(guò)濾數(shù)據(jù),u

    2024年02月03日
    瀏覽(23)
  • Flink實(shí)時(shí)電商數(shù)倉(cāng)(十)

    Flink實(shí)時(shí)電商數(shù)倉(cāng)(十)

    app BaseApp: 作為其他子模塊中使用Flink - StreamAPI的父類,實(shí)現(xiàn)了StreamAPI中的通用邏輯,在其他子模塊中只需編寫關(guān)于數(shù)據(jù)處理的核心邏輯。 BaseSQLApp: 作為其他子模塊中使用Flink- SQLAPI的父類。在里面設(shè)置了使用SQL API的環(huán)境、并行度、檢查點(diǎn)等固定邏輯。 bean:存放其他子模塊中

    2024年02月03日
    瀏覽(23)
  • 如何基于 Apache Doris 與 Apache Flink 快速構(gòu)建極速易用的實(shí)時(shí)數(shù)倉(cāng)

    如何基于 Apache Doris 與 Apache Flink 快速構(gòu)建極速易用的實(shí)時(shí)數(shù)倉(cāng)

    隨著大數(shù)據(jù)應(yīng)用的不斷深入,企業(yè)不再滿足離線數(shù)據(jù)加工計(jì)算的時(shí)效,實(shí)時(shí)數(shù)據(jù)需求已成為數(shù)據(jù)應(yīng)用新常態(tài)。伴隨著實(shí)時(shí)分析需求的不斷膨脹,傳統(tǒng)的數(shù)據(jù)架構(gòu)面臨的成本高、實(shí)時(shí)性無(wú)法保證、組件繁冗、運(yùn)維難度高等問(wèn)題日益凸顯。為了適應(yīng)業(yè)務(wù)快速迭代的特點(diǎn),幫助企業(yè)

    2024年02月12日
    瀏覽(20)
  • Apache Flink X Apache Doris構(gòu)建極速易用的實(shí)時(shí)數(shù)倉(cāng)架構(gòu)

    Apache Flink X Apache Doris構(gòu)建極速易用的實(shí)時(shí)數(shù)倉(cāng)架構(gòu)

    大家好,我叫王磊。是SelectDB 大數(shù)據(jù)研發(fā)。今天給大家?guī)?lái)的分享是《Apache Flink X Apache Doris構(gòu)建極速易用的實(shí)時(shí)數(shù)倉(cāng)架構(gòu)》。 下面是我們的個(gè)人介紹:我是Apache Doris Contributor 和阿里云 MVP。同時(shí)著有《 圖解 Spark 大數(shù)據(jù)快速分析實(shí)戰(zhàn)》等書籍。 接下來(lái)咱們進(jìn)入本次演講的正題

    2023年04月24日
    瀏覽(24)
  • Flink 實(shí)時(shí)數(shù)倉(cāng) (一) --------- 數(shù)據(jù)采集層

    Flink 實(shí)時(shí)數(shù)倉(cāng) (一) --------- 數(shù)據(jù)采集層

    1. 普通實(shí)時(shí)計(jì)算與實(shí)時(shí)數(shù)倉(cāng)比較 普通的實(shí)時(shí)計(jì)算優(yōu)先考慮時(shí)效性,所以從數(shù)據(jù)源采集經(jīng)過(guò)實(shí)時(shí)計(jì)算直接得到結(jié)果。如此做時(shí)效性更好,但是弊端是由于計(jì)算過(guò)程中的中間結(jié)果沒有沉淀下來(lái),所以當(dāng)面對(duì)大量實(shí)時(shí)需求的時(shí)候,計(jì)算的復(fù)用性較差,開發(fā)成本隨著需求增加直線上升

    2024年02月06日
    瀏覽(29)
  • Flink實(shí)時(shí)同步MySQL與Doris數(shù)據(jù)

    Flink實(shí)時(shí)同步MySQL與Doris數(shù)據(jù)

    技術(shù)解析|Doris Connector 結(jié)合 Flink CDC 實(shí)現(xiàn) MySQL 分庫(kù)分表 Exactly Once 精準(zhǔn)接入-阿里云開發(fā)者社區(qū) 1. Flink環(huán)境: https://flink.apache.org/zh/ 下載flink-1.15.1 解壓,修改配置 修改配置 修改rest.bind-address為 0.0.0.0 下載依賴jar包 至 flink安裝目錄lib下 啟動(dòng)flink 訪問(wèn)WebUI http://192.168.0.158:8081 2、

    2024年02月13日
    瀏覽(27)
  • 使用 Flink CDC 實(shí)現(xiàn) MySQL 數(shù)據(jù),表結(jié)構(gòu)實(shí)時(shí)入 Apache Doris

    現(xiàn)有數(shù)據(jù)庫(kù):mysql 數(shù)據(jù):庫(kù)表較多,每個(gè)企業(yè)用戶一個(gè)分庫(kù),每個(gè)企業(yè)下的表均不同,無(wú)法做到聚合,且表可以被用戶隨意改動(dòng),增刪改列等,增加表 分析:用戶自定義分析,通過(guò)拖拽定義圖卡,要求實(shí)時(shí),點(diǎn)擊確認(rèn)即出現(xiàn)相應(yīng)結(jié)果,其中有無(wú)法預(yù)判的過(guò)濾 問(wèn)題:隨業(yè)務(wù)增長(zhǎng)

    2023年04月08日
    瀏覽(24)
  • [選型] 實(shí)時(shí)數(shù)倉(cāng)之技術(shù)選型

    [選型] 實(shí)時(shí)數(shù)倉(cāng)之技術(shù)選型

    對(duì)于已有的hive數(shù)據(jù)倉(cāng),怎樣改造成實(shí)時(shí)數(shù)倉(cāng)的要求呢? 2.關(guān)于實(shí)時(shí)數(shù)倉(cāng)的選型 如果選擇hbase,建議選擇kudu 如果選擇kudu,?還可以選擇doris 如果選擇doris,建議選擇iceberg 以上三種選擇,要配合具體的場(chǎng)景; 其中doris作為實(shí)時(shí)數(shù)倉(cāng),可以設(shè)計(jì)存儲(chǔ)n天的(doris紫自身能夠自動(dòng)就行數(shù)

    2024年02月13日
    瀏覽(23)
  • 實(shí)時(shí)數(shù)倉(cāng)|基于Flink1.11的SQL構(gòu)建實(shí)時(shí)數(shù)倉(cāng)探索實(shí)踐

    實(shí)時(shí)數(shù)倉(cāng)主要是為了解決傳統(tǒng)數(shù)倉(cāng)數(shù)據(jù)時(shí)效性低的問(wèn)題,實(shí)時(shí)數(shù)倉(cāng)通常會(huì)用在實(shí)時(shí)的 OLAP 分析、實(shí)時(shí)的數(shù)據(jù)看板、業(yè)務(wù)指標(biāo)實(shí)時(shí)監(jiān)控等場(chǎng)景。雖然關(guān)于實(shí)時(shí)數(shù)倉(cāng)的架構(gòu)及技術(shù)選型與傳統(tǒng)的離線數(shù)倉(cāng)會(huì)存在差異,但是關(guān)于數(shù)倉(cāng)建設(shè)的基本方法論是一致的。本文會(huì)分享基于 Flink

    2024年02月16日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包