国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

聊聊分布式 SQL 數(shù)據(jù)庫Doris(九)

2年前作者：又見阿郎分類：Toy博客閱讀(29)違法舉報

這篇具有很好參考價值的文章主要介紹了聊聊分布式 SQL 數(shù)據(jù)庫Doris(九)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

優(yōu)化器的作用是優(yōu)化查詢語句的執(zhí)行效率，它通過評估不同的執(zhí)行計劃并選擇最優(yōu)的執(zhí)行計劃來實(shí)現(xiàn)這一目標(biāo)。

CBO: 一種基于成本的優(yōu)化器，它通過評估不同查詢執(zhí)行計劃的成本來選擇最優(yōu)的執(zhí)行計劃。CBO會根據(jù)數(shù)據(jù)庫系統(tǒng)定義的統(tǒng)計信息以及其他因素，對不同的執(zhí)行計劃進(jìn)行評估，并選擇成本最低的執(zhí)行計劃。CBO的目標(biāo)是找到一個最優(yōu)的執(zhí)行計劃，使得查詢的執(zhí)行成本最低。

RBO: 一種基于規(guī)則的優(yōu)化器，它通過應(yīng)用一系列的優(yōu)化規(guī)則來選擇最優(yōu)的執(zhí)行計劃。RBO會根據(jù)預(yù)定義的規(guī)則對查詢進(jìn)行優(yōu)化，這些規(guī)則基于數(shù)據(jù)庫系統(tǒng)的特定邏輯和語義。RBO的優(yōu)點(diǎn)是實(shí)現(xiàn)簡單，適用于特定的查詢模式和數(shù)據(jù)分布。然而，RBO可能無法找到最優(yōu)的執(zhí)行計劃，特別是對于復(fù)雜的查詢和大規(guī)模的數(shù)據(jù)集。

Doris主要整合了Google Mesa（數(shù)據(jù)模型），Apache Impala（MPP查詢引擎)和Apache ORCFile (存儲格式，編碼和壓縮) 的技術(shù)。 Doris的查詢優(yōu)化器則是基于Impala改造實(shí)現(xiàn)的。Doris官方提供的 Nereids優(yōu)化器文檔。

優(yōu)化器組件

查詢優(yōu)化器由多個部分組成，分別是: 詞法語法解析、語義解析、query改寫、生成執(zhí)行計劃。最后這步根據(jù)算法實(shí)現(xiàn)與業(yè)務(wù)場景的不同會有些許差異。

詞法語法解析

這個步驟，其實(shí)是做兩件事情，首先是解析SQL文本，提取關(guān)鍵字出來，比如(select、from等); 然后分析SQL文本是否滿足SQL語法，最終生成一個AST樹。其結(jié)構(gòu)如下:

對于不同類型的SQL，其語法樹的根節(jié)點(diǎn)類型也是不一樣的。一般是InsertStmt、UpdateStmt、DeleteStmt、SelectStmt等。而這些概念其實(shí)是impala中的，Doris的SQL查詢引擎是參考自impala。在其源碼中有這么一段注釋:

Impala是用于處理存儲在Hadoop集群中的大量數(shù)據(jù)的MPP（大規(guī)模并行處理）sql查詢引擎。它是一個用C ++和Java編寫的開源軟件。與其他Hadoop的SQL引擎相比，它提供了高性能和低延遲。其相關(guān)信息及文檔可參考: impala中文手冊

語義解析

根據(jù)AST樹與元數(shù)據(jù)中的表、列信息等做一個語義校驗，比如，表、字段是否在元數(shù)據(jù)中存在。其步驟一般如下:

query改寫

對原始的sql文本做一定程度的改寫使得SQL更簡單，執(zhí)行效率更高；一般是條件表達(dá)式改寫、子查詢改寫等。

在Doris中，有一個接口 ExprRewriteRule 負(fù)責(zé)表達(dá)式的改寫規(guī)則，基于該接口與各種不同的規(guī)則有不同的實(shí)現(xiàn)，在 Analyzer類的內(nèi)部類 GlobalState 構(gòu)造函數(shù)中，注冊了諸多的規(guī)則到rules集合中，而該list會被傳遞到ExprRewriter類中被應(yīng)用。

StmtRewriter 類處理子查詢改寫邏輯，其中的方法會處理各種場景下的子查詢改寫，比如rewriteSelectStatement方法.

這一步驟的處理是基于詞法語法解析后生成的AST樹進(jìn)行的。

public class GlobalState(Env env, ConnectContext context) {
    this.env = env;
    this.context = context;
    List<ExprRewriteRule> rules = Lists.newArrayList();
    // BetweenPredicates must be rewritten to be executable. Other non-essential
    // expr rewrites can be disabled via a query option. When rewrites are enabled
    // BetweenPredicates should be rewritten first to help trigger other rules.
    rules.add(BetweenToCompoundRule.INSTANCE);
    // Binary predicates must be rewritten to a canonical form for both predicate
    // pushdown and Parquet row group pruning based on min/max statistics.
    rules.add(NormalizeBinaryPredicatesRule.INSTANCE);
    // Put it after NormalizeBinaryPredicatesRule, make sure slotRef is on the left and Literal is on the right.
    rules.add(RewriteBinaryPredicatesRule.INSTANCE);
    rules.add(RewriteImplicitCastRule.INSTANCE);
    rules.add(RoundLiteralInBinaryPredicatesRule.INSTANCE);
    rules.add(FoldConstantsRule.INSTANCE);
    rules.add(EraseRedundantCastExpr.INSTANCE);
    rules.add(RewriteFromUnixTimeRule.INSTANCE);
    rules.add(CompoundPredicateWriteRule.INSTANCE);
    rules.add(RewriteDateLiteralRule.INSTANCE);
    rules.add(RewriteEncryptKeyRule.INSTANCE);
    rules.add(RewriteInPredicateRule.INSTANCE);
    rules.add(RewriteAliasFunctionRule.INSTANCE);
    rules.add(RewriteIsNullIsNotNullRule.INSTANCE);
    rules.add(MatchPredicateRule.INSTANCE);
    rules.add(EliminateUnnecessaryFunctions.INSTANCE);
    List<ExprRewriteRule> onceRules = Lists.newArrayList();
    onceRules.add(ExtractCommonFactorsRule.INSTANCE);
    onceRules.add(InferFiltersRule.INSTANCE);
    exprRewriter = new ExprRewriter(rules, onceRules);
    // init mv rewriter
    List<ExprRewriteRule> mvRewriteRules = Lists.newArrayList();
    mvRewriteRules.add(new ExprToSlotRefRule());
    mvRewriteRules.add(ToBitmapToSlotRefRule.INSTANCE);
    mvRewriteRules.add(CountDistinctToBitmapOrHLLRule.INSTANCE);
    mvRewriteRules.add(CountDistinctToBitmap.INSTANCE);
    mvRewriteRules.add(NDVToHll.INSTANCE);
    mvRewriteRules.add(HLLHashToSlotRefRule.INSTANCE);
    mvExprRewriter = new ExprRewriter(mvRewriteRules);

    // context maybe null. eg, for StreamLoadPlanner.
    // and autoBroadcastJoinThreshold is only used for Query's DistributedPlanner.
    // so it is ok to not set autoBroadcastJoinThreshold if context is null
    if (context != null) {
        // compute max exec mem could be used for broadcast join
        long perNodeMemLimit = context.getSessionVariable().getMaxExecMemByte();
        double autoBroadcastJoinThresholdPercentage = context.getSessionVariable().autoBroadcastJoinThreshold;
        if (autoBroadcastJoinThresholdPercentage > 1) {
            autoBroadcastJoinThresholdPercentage = 1.0;
        } else if (autoBroadcastJoinThresholdPercentage <= 0) {
            autoBroadcastJoinThresholdPercentage = -1.0;
        }
        autoBroadcastJoinThreshold = (long) (perNodeMemLimit * autoBroadcastJoinThresholdPercentage);
    } else {
        // autoBroadcastJoinThreshold is a "final" field, must set an initial value for it
        autoBroadcastJoinThreshold = 0;
    }
}

單機(jī)執(zhí)行計劃

這一過程會生成PlanNodeTree，一般用于處理Join Reorder場景下的join調(diào)優(yōu)與謂詞下推等下推優(yōu)化。

SingleNodePlanner類用于生成單擊執(zhí)行計劃，該類其實(shí)也是基于impala框架改寫適用于Doris的。在這個類中，除了謂詞下推與join reorder外，還有類似列裁剪之類的優(yōu)化，都在這個類中有處理。

分布式執(zhí)行計劃

DistributedPlanner類負(fù)責(zé)分布式執(zhí)行計劃的優(yōu)化，其中會處理Join場景下的分布式執(zhí)行，選擇最優(yōu)的Join執(zhí)行路徑；其次就是Agg聚合函數(shù)的分布式執(zhí)行邏輯，Agg會分兩步執(zhí)行，先會在local本地scan，然后再Agg Node上在做一次scan聚合；當(dāng)然還有一些算子需要做分布式邏輯執(zhí)行優(yōu)化. 都可以在這個類中找到。當(dāng)然這個類也是基于impala框架改寫的。

如下是AggNode的分布式執(zhí)行計劃優(yōu)化:

總結(jié)

Doris的很多設(shè)計，其實(shí)都是有據(jù)可依，參考借鑒已有的框架/論文，再依據(jù)實(shí)際的業(yè)務(wù)場景做改寫；這也正是我們要學(xué)習(xí)了解的東西，通過一個點(diǎn)，然后鋪開去了解學(xué)習(xí)相關(guān)的其他點(diǎn)，慢慢的串聯(lián)起來形成面。查詢優(yōu)化器結(jié)合如下博客再加上自己去閱讀一下代碼，對整個脈絡(luò)及機(jī)制就算是掌握了。

聊聊分布式 SQL 數(shù)據(jù)庫Doris(五) 這是之前寫的對查詢優(yōu)化器相關(guān)的一些知識普及.

查詢優(yōu)化器詳解 Doris團(tuán)隊針對查詢優(yōu)化器的視頻講解.

Doris SQL 原理解析小米工程師寫的，更深入的剖析.文章來源地址http://www.zghlxwxcb.cn/news/detail-747528.html

到了這里，關(guān)于聊聊分布式 SQL 數(shù)據(jù)庫Doris(九)的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請點(diǎn)擊違法舉報進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

聊聊分布式 SQL 數(shù)據(jù)庫Doris(六)
此處的負(fù)載均衡指的是FE層的負(fù)載均衡. 當(dāng)部署多個 FE 節(jié)點(diǎn)時，用戶可以在多個 FE 之上部署負(fù)載均衡層來實(shí)現(xiàn) Doris 的高可用。官方文檔描述: 負(fù)載均衡。實(shí)現(xiàn)方式實(shí)現(xiàn)方式有多種，如下列舉。開發(fā)者在應(yīng)用層自己進(jìn)行重試與負(fù)載均衡。 JDBC Connector 發(fā)現(xiàn)一個連接掛掉，就自
2024年02月05日
瀏覽(25)
聊聊分布式 SQL 數(shù)據(jù)庫Doris(七)
Doris的存儲結(jié)構(gòu)是類似LSM-Tree設(shè)計的，因此很多方面都是通用的，先閱讀了解LSM相關(guān)的知識，再看Doris的底層存儲與讀取流程會清晰透徹很多，LSM基本知識如下: 原理：把各種數(shù)據(jù)先用log等形式組織在內(nèi)存中(該數(shù)據(jù)結(jié)構(gòu)稱為MemTable，且有序)；到達(dá)一定數(shù)據(jù)量后再批量merge寫入磁
2024年02月05日
瀏覽(29)
聊聊分布式 SQL 數(shù)據(jù)庫Doris(三)
在 Doris 的存儲引擎規(guī)則: 表的數(shù)據(jù)是以分區(qū)為單位存儲的，不指定分區(qū)創(chuàng)建時，默認(rèn)就一個分區(qū). 用戶數(shù)據(jù)首先被劃分成若干個分區(qū)（Partition），劃分的規(guī)則通常是按照用戶指定的分區(qū)列進(jìn)行范圍劃分，比如按時間劃分。在每個分區(qū)內(nèi)，數(shù)據(jù)被進(jìn)一步的按照Hash的方式分桶，分
2024年02月05日
瀏覽(18)
聊聊分布式 SQL 數(shù)據(jù)庫Doris(四)
FE層的架構(gòu)都能在網(wǎng)上找到說明. 但BE層的架構(gòu)模式、一致性保障、與FE層之間的請求邏輯，數(shù)據(jù)傳輸邏輯等，我個人暫時沒有找到相應(yīng)的博客說明這些的。當(dāng)然這些是我個人在學(xué)習(xí)與使用Doris過程中，對內(nèi)部交互邏輯與實(shí)現(xiàn)感興趣才有這些疑問. 還好現(xiàn)在有GPT這類大模型，有了
2024年02月05日
瀏覽(30)
分布式數(shù)據(jù)庫Apache Doris簡易體驗
???????????? 哈嘍！大家好，我是【IT邦德】，江湖人稱jeames007，10余年DBA及大數(shù)據(jù)工作經(jīng)驗一位上進(jìn)心十足的【大數(shù)據(jù)領(lǐng)域博主】！?????? 中國DBA聯(lián)盟(ACDU)成員，目前服務(wù)于工業(yè)互聯(lián)網(wǎng) 擅長主流Oracle、MySQL、PG、高斯及Greenplum運(yùn)維開發(fā)，備份恢復(fù)，安裝遷移，性能優(yōu)
2024年02月06日
瀏覽(29)
分布式數(shù)據(jù)庫Apache Doris HA集群部署
???????????? 哈嘍！大家好，我是【IT邦德】，江湖人稱jeames007，10余年DBA及大數(shù)據(jù)工作經(jīng)驗一位上進(jìn)心十足的【大數(shù)據(jù)領(lǐng)域博主】！?????? 中國DBA聯(lián)盟(ACDU)成員，目前服務(wù)于工業(yè)互聯(lián)網(wǎng) 擅長主流Oracle、MySQL、PG、高斯及Greenplum運(yùn)維開發(fā)，備份恢復(fù)，安裝遷移，性能優(yōu)
2024年02月06日
瀏覽(23)
RisingWave分布式SQL流處理數(shù)據(jù)庫調(diào)研
RisingWave是一款分布式SQL流處理數(shù)據(jù)庫，旨在幫助用戶降低實(shí)時應(yīng)用的的開發(fā)成本。作為專為云上分布式流處理而設(shè)計的系統(tǒng)，RisingWave為用戶提供了與PostgreSQL類似的使用體驗，官方宣稱具備比Flink高出10倍的性能（指throughput）以及更低的成本。RisingWave開發(fā)只需要關(guān)注SQL開發(fā)
2024年02月21日
瀏覽(26)
解釋什么是分布式數(shù)據(jù)庫，列舉幾種常見的分布式數(shù)據(jù)庫系統(tǒng)
敏感信息和隱私保護(hù)是指在收集、存儲和使用個人數(shù)據(jù)時，需要采取一系列措施來保護(hù)這些數(shù)據(jù)的安全和機(jī)密性，防止數(shù)據(jù)被未經(jīng)授權(quán)的第三方訪問、使用或泄露。這些措施包括加密、訪問控制、數(shù)據(jù)脫敏、數(shù)據(jù)加密、隱私政策等。在隱私保護(hù)的技術(shù)手段方面，常用的技術(shù)包
2024年02月08日
瀏覽(32)
分布式數(shù)據(jù)庫架構(gòu)
對于mysql架構(gòu)，一定會使用到讀寫分離，在此基礎(chǔ)上有五種常見架構(gòu)設(shè)計：一主一從或多從、主主復(fù)制、級聯(lián)復(fù)制、主主與級聯(lián)復(fù)制結(jié)合。 1.1、主從復(fù)制這種架構(gòu)設(shè)計是使用的最多的。在讀寫分離的基礎(chǔ)上，會存在一臺master作為寫機(jī)，一個或多個slave作為讀機(jī)。因為在實(shí)際的
2024年02月10日
瀏覽(32)
分析型數(shù)據(jù)庫：分布式分析型數(shù)據(jù)庫
分析型數(shù)據(jù)庫的另外一個發(fā)展方向就是以分布式技術(shù)來代替MPP的并行計算，一方面分布式技術(shù)比MPP有更好的可擴(kuò)展性，對底層的異構(gòu)軟硬件支持度更好，可以解決MPP數(shù)據(jù)庫的幾個關(guān)鍵架構(gòu)問題。本文介紹分布式分析型數(shù)據(jù)庫。 — 背景介紹— 目前在分布式分析型數(shù)據(jù)庫領(lǐng)域，
2023年04月14日
瀏覽(52)