国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

doris - 數(shù)倉 拉鏈表 按天全量打?qū)挶硇阅軆?yōu)化

這篇具有很好參考價值的文章主要介紹了doris - 數(shù)倉 拉鏈表 按天全量打?qū)挶硇阅軆?yōu)化。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

現(xiàn)狀描述

1、業(yè)務(wù)歷史數(shù)據(jù)可以變更
2、拉鏈表按天打?qū)?br> 3、拉鏈表模型分區(qū)字段設(shè)計不合理,通用的過濾字段沒有作為分區(qū)分桶字段
4、拉鏈表表數(shù)據(jù)量略大、模型數(shù)據(jù)分區(qū)不合理和服務(wù)器資源限制,計算任務(wù)執(zhí)行超時【3-4年,用戶數(shù):132W】
5、基于拉鏈表打?qū)捄蟮奶毂硇修D(zhuǎn)列【最多列達到300列】,sum(case when … end),沒有提前過濾數(shù)據(jù)

優(yōu)化

1、完善模型設(shè)計,設(shè)計主鍵和分桶字段

1)在單表計算:若大表存放多種類型數(shù)據(jù),數(shù)據(jù)分類字段要做為分區(qū)或分桶字段,可以實現(xiàn)數(shù)據(jù)快速過濾
2)多表關(guān)聯(lián):在大表合理設(shè)置了主鍵、分區(qū)或分桶的前提下,建議把關(guān)聯(lián)字段做份分區(qū)或分桶字段【要綜合考慮驗證,設(shè)置過多分區(qū)分桶字段可能也會影響數(shù)據(jù)性能】

2、提前進行數(shù)據(jù)過濾和分級分類計算
前提:拉鏈表數(shù)據(jù)量較大或打?qū)捄髷?shù)據(jù)量較大

1)若拉鏈表數(shù)據(jù)量較大且包含多種類型數(shù)據(jù),需要進行打?qū)挶硖幚怼疽粭l打?qū)挸啥鄺l】,那么打?qū)挶砗蟮臄?shù)據(jù)量會翻幾倍甚至更多從而導(dǎo)致性能很慢或者執(zhí)行超時;
》》》建議1:在打?qū)挼倪^程中按類別均勻拆分數(shù)據(jù)打?qū)挼蕉鄠€臨時表
》》》建議2:增加任務(wù)并行度【在資源允許的前提下,大部分任務(wù)提高并發(fā)度可以解決性能問題:set parallel_fragment_exec_instance_num=8;】

2)若拉鏈表數(shù)據(jù)量較大【同一種類型數(shù)據(jù)】,需要進行打?qū)挶硖幚怼疽粭l打?qū)挸啥鄺l】,那么打?qū)挶砗蟮臄?shù)據(jù)量會翻幾倍甚至更多從而導(dǎo)致性能很慢或者執(zhí)行超時;
》》》建議1:在打?qū)挼倪^程中可以按時間拆分為當前和歷史數(shù)據(jù)表【數(shù)據(jù)歸檔處理】
》》》建議2:增加任務(wù)并行度【在資源允許的前提下,大部分任務(wù)提高并發(fā)度可以解決性能問題:set parallel_fragment_exec_instance_num=8;】

3)若拉鏈表打?qū)捄蟛煌愋蛿?shù)據(jù)在下游計算邏輯不一致,建議根據(jù)數(shù)據(jù)類型或其他類型拆分數(shù)據(jù)

doris寬表,大數(shù)據(jù),doris,數(shù)據(jù)庫,性能優(yōu)化,數(shù)據(jù)庫,大數(shù)據(jù)
3、根據(jù)指標需求進行熱點數(shù)據(jù)特殊優(yōu)化
前提:資源有限,1個并發(fā)度運行

1)拉鏈表按分類拆分【過濾】后再按天打?qū)挼蕉鄠€寬表;
2)計算邏輯:計算第1-150天和150+的數(shù)據(jù),打?qū)挸?51行;
》》》可以分兩類計算:第一類計算第1-150天【150列】再關(guān)聯(lián)計算150+列
3)若按以上邏輯計算任務(wù)還是執(zhí)行超時,把數(shù)據(jù)拆分當前表和歷史表,使用兩個insert 

優(yōu)化參數(shù)

set enable_vectorized_engine = true; – 開啟向量化【 doris 1.1 版本中默認開啟】文章來源地址http://www.zghlxwxcb.cn/news/detail-624629.html

到了這里,關(guān)于doris - 數(shù)倉 拉鏈表 按天全量打?qū)挶硇阅軆?yōu)化的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔相關(guān)法律責任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Flink+Doris 實時數(shù)倉

    Flink+Doris 實時數(shù)倉

    Doris基本原理 Doris基本架構(gòu)非常簡單,只有FE(Frontend)、BE(Backend)兩種角色,不依賴任何外部組件,對部署和運維非常友好。架構(gòu)圖如下 可以 看到Doris 的數(shù)倉架構(gòu)十分簡潔,不依賴 Hadoop 生態(tài)組件,構(gòu)建及運維成本較低。 FE(Frontend)以 Java 語言為主,主要功能職責: 接收用戶

    2024年02月07日
    瀏覽(20)
  • Doris實時數(shù)倉dim層構(gòu)建

    flink cdc實時同步mysql維表 本文是基于flink 1.16 將 flink-doris-connector-1.16-1.4.0.jar 上傳至 $FLINK_HOME/lib目錄下 可至 maven官網(wǎng) 下載

    2024年02月08日
    瀏覽(16)
  • 【大數(shù)據(jù)】Doris 構(gòu)建實時數(shù)倉落地方案詳解(二):Doris 核心功能解讀

    【大數(shù)據(jù)】Doris 構(gòu)建實時數(shù)倉落地方案詳解(二):Doris 核心功能解讀

    本系列包含: Doris 構(gòu)建實時數(shù)倉落地方案詳解(一):實時數(shù)據(jù)倉庫概述 Doris 構(gòu)建實時數(shù)倉落地方案詳解(二):Doris 核心功能解讀 Doris 構(gòu)建實時數(shù)倉落地方案詳解(三):Doris 實時數(shù)倉設(shè)計 Apache Doris 是由 百度 研發(fā)并開源的數(shù)據(jù)庫項目。 Doris 2008 年開始在百度內(nèi)部立項,

    2024年02月07日
    瀏覽(16)
  • Flink實時電商數(shù)倉之Doris框架(七)

    Flink實時電商數(shù)倉之Doris框架(七)

    大規(guī)模并行處理的分析型數(shù)據(jù)庫產(chǎn)品。使用場景:一般先將原始數(shù)據(jù)經(jīng)過清洗過濾轉(zhuǎn)換后,再導(dǎo)入doris中使用。主要實現(xiàn)的功能有: 實時看板 面向企業(yè)內(nèi)部分析師和管理者的報表 面向用戶或者客戶的高并發(fā)報表分析 即席查詢 統(tǒng)一數(shù)倉構(gòu)建:替換了原來由Spark, Hive,Kudu, Hba

    2024年02月03日
    瀏覽(24)
  • 深入解析實時數(shù)倉Doris:Rollup上卷表與查詢

    深入解析實時數(shù)倉Doris:Rollup上卷表與查詢

    碼到三十五 : 個人主頁 心中有詩畫,指尖舞代碼,目光覽世界,步履越千山,人間盡值得 ! ROLLUP 在多維分析中是“上卷”的意思,即將數(shù)據(jù)按某種指定的粒度進行進一步聚合。 在 Doris 中,我們將用戶通過建表語句創(chuàng)建出來的表稱為 Base 表(Base Table)。Base 表中保存著按用

    2024年04月10日
    瀏覽(25)
  • 陳長城:NineData面向Doris實時數(shù)倉集成的技術(shù)實踐

    在剛剛過去的北京Doris Summit Asia 2023,玖章算術(shù)技術(shù)副總裁陳長城受邀參加并做了《NineData面向Doris實時數(shù)倉集成的技術(shù)實踐》報告。 玖章算術(shù)技術(shù)副總裁陳長城 從業(yè)界的報告中我們知道超過81%的企業(yè)使用了多云或混合云架構(gòu),超過70%的企業(yè)使用了多種數(shù)據(jù)類型,而對基礎(chǔ)架構(gòu)

    2024年02月05日
    瀏覽(20)
  • 【大數(shù)據(jù)】Doris 構(gòu)建實時數(shù)倉落地方案詳解(一):實時數(shù)據(jù)倉庫概述

    【大數(shù)據(jù)】Doris 構(gòu)建實時數(shù)倉落地方案詳解(一):實時數(shù)據(jù)倉庫概述

    本系列包含: Doris 構(gòu)建實時數(shù)倉落地方案詳解(一):實時數(shù)據(jù)倉庫概述 Doris 構(gòu)建實時數(shù)倉落地方案詳解(二):Doris 核心功能解讀 Doris 構(gòu)建實時數(shù)倉落地方案詳解(三):Doris 實時數(shù)倉設(shè)計 數(shù)據(jù)倉庫的概念可以追溯到 20 世紀 80 年代,當時 IBM 的研究人員提出了商業(yè)數(shù)據(jù)

    2024年02月04日
    瀏覽(21)
  • Flink CDC和Flink SQL構(gòu)建實時數(shù)倉Flink寫入Doris

    Flink CDC和Flink SQL構(gòu)建實時數(shù)倉Flink寫入Doris

    軟件環(huán)境 Flink1.13.3 Scala 2.12 doris 0.14 一、MySQL 開啟binlog日志、創(chuàng)建用戶 1.開啟bin log MySQL 8.0默認開啟了binlog,可以通過代碼show variables like \\\"%log_bin%\\\";查詢是否開啟了,show variables like \\\"%server_id%\\\";查詢服務(wù)器ID。 上圖分別顯示了bin long是否開啟以及bin log所在的位置。 2.創(chuàng)建用戶 C

    2024年02月02日
    瀏覽(17)
  • 如何基于 Apache Doris 與 Apache Flink 快速構(gòu)建極速易用的實時數(shù)倉

    如何基于 Apache Doris 與 Apache Flink 快速構(gòu)建極速易用的實時數(shù)倉

    隨著大數(shù)據(jù)應(yīng)用的不斷深入,企業(yè)不再滿足離線數(shù)據(jù)加工計算的時效,實時數(shù)據(jù)需求已成為數(shù)據(jù)應(yīng)用新常態(tài)。伴隨著實時分析需求的不斷膨脹,傳統(tǒng)的數(shù)據(jù)架構(gòu)面臨的成本高、實時性無法保證、組件繁冗、運維難度高等問題日益凸顯。為了適應(yīng)業(yè)務(wù)快速迭代的特點,幫助企業(yè)

    2024年02月12日
    瀏覽(20)
  • Apache Flink X Apache Doris構(gòu)建極速易用的實時數(shù)倉架構(gòu)

    Apache Flink X Apache Doris構(gòu)建極速易用的實時數(shù)倉架構(gòu)

    大家好,我叫王磊。是SelectDB 大數(shù)據(jù)研發(fā)。今天給大家?guī)淼姆窒硎恰禔pache Flink X Apache Doris構(gòu)建極速易用的實時數(shù)倉架構(gòu)》。 下面是我們的個人介紹:我是Apache Doris Contributor 和阿里云 MVP。同時著有《 圖解 Spark 大數(shù)據(jù)快速分析實戰(zhàn)》等書籍。 接下來咱們進入本次演講的正題

    2023年04月24日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包