国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

火山引擎 DataLeap 構(gòu)建Data Catalog系統(tǒng)的實(shí)踐(二):技術(shù)與產(chǎn)品概覽

這篇具有很好參考價(jià)值的文章主要介紹了火山引擎 DataLeap 構(gòu)建Data Catalog系統(tǒng)的實(shí)踐(二):技術(shù)與產(chǎn)品概覽。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

技術(shù)與產(chǎn)品概覽

架構(gòu)設(shè)計(jì)

火山引擎 DataLeap 構(gòu)建Data Catalog系統(tǒng)的實(shí)踐(二):技術(shù)與產(chǎn)品概覽,火山引擎

?文章來源地址http://www.zghlxwxcb.cn/news/detail-558695.html

元數(shù)據(jù)的接入

  • 元數(shù)據(jù)接入支持T+1和近實(shí)時(shí)兩種方式
  • 上游系統(tǒng):包括各類存儲(chǔ)系統(tǒng)(比如Hive、 Clickhouse等)和業(yè)務(wù)系統(tǒng)(比如數(shù)據(jù)開發(fā)平臺(tái)、數(shù)據(jù)質(zhì)量平臺(tái)等)
  • 中間層:
    • ETL Bridge:T+1方式運(yùn)行,通常是從外部系統(tǒng)拉取最新元數(shù)據(jù),與當(dāng)前Catalog系統(tǒng)的元數(shù)據(jù)做對(duì)比,并更新差異的部分
    • MQ:用于暫存各類元數(shù)據(jù)增量消息,供Catalog系統(tǒng)近實(shí)時(shí)消費(fèi)
    • 與上游系統(tǒng)打交道的各類Clients,封裝了操作底層資源的能力

核心服務(wù)層

系統(tǒng)的核心服務(wù),根據(jù)職責(zé)的不同,細(xì)拆為以下子服務(wù):
  • Catalog Service:支持元數(shù)據(jù)的搜索、詳情、修改等核心服務(wù)
  • Ingestion Service:接受外部系統(tǒng)調(diào)用,寫入元數(shù)據(jù),或主動(dòng)從MQ中消費(fèi)增量元數(shù)據(jù)
  • Resource Control Plane:通過各類Clients,與底層的存儲(chǔ)或業(yè)務(wù)系統(tǒng)交互,操作底層資源,比如建庫(kù)建表,能力可插拔
  • Q&A Service:?jiǎn)柎鹣到y(tǒng)相關(guān)能力,支持對(duì)元數(shù)據(jù)的字段含義、使用場(chǎng)景等提問和回答,能力可插拔
  • ML Service:負(fù)責(zé)封裝與機(jī)器學(xué)習(xí)相關(guān)的能力,能力可插拔
  • API Layer:以RESTful API的形式整合系統(tǒng)中的各類能力

存儲(chǔ)層

針對(duì)不同場(chǎng)景,選用的不同的存儲(chǔ):
  • Meta Store:存放全量元數(shù)據(jù)和血緣關(guān)系,當(dāng)前使用的是HBase
  • Index Store:存放用于加速查詢,支持全文索引等場(chǎng)景的索引,當(dāng)前使用的是ElasticSearch
  • Model Store:存放推薦、打標(biāo)等的算法模型信息,使用HDFS,當(dāng)ML Service啟用時(shí)使用

元數(shù)據(jù)的消費(fèi)

  • 數(shù)據(jù)的生產(chǎn)者和消費(fèi)者,通過Data Catalog的前端與系統(tǒng)交互
  • 下游在線服務(wù)可通過OpenAPI訪問元數(shù)據(jù),與系統(tǒng)交互
  • Metadata Outputs Layer:提供除了API之外的另外一種下游消費(fèi)方式
    • MQ:用于暫存各類元數(shù)據(jù)變更消息,格式由Catalog系統(tǒng)官方定義
    • Data warehouse:以數(shù)倉(cāng)表的形式呈現(xiàn)的全量元數(shù)據(jù)

產(chǎn)品功能升級(jí)

火山引擎 DataLeap 構(gòu)建Data Catalog系統(tǒng)的實(shí)踐(二):技術(shù)與產(chǎn)品概覽,火山引擎

?

產(chǎn)品能力上的升級(jí)迭代,大致分為以下幾個(gè)階段:
  • 基礎(chǔ)能力建設(shè)(2017-2019):數(shù)據(jù)源主要是離線數(shù)倉(cāng)Hive,支持了Hive相關(guān)庫(kù)表創(chuàng)建、元數(shù)據(jù)搜索與詳情展示、表之間血緣,以及將相關(guān)表組織成業(yè)務(wù)視角的數(shù)據(jù)專題等
  • 中階能力建設(shè)(2019-2020年中):數(shù)據(jù)源擴(kuò)展了Clickhouse與Kafka,支持了Hive列血緣,Q&A問答系統(tǒng)等
  • 架構(gòu)升級(jí)(2020年中-2021年初):產(chǎn)品能力迭代放緩,基于新設(shè)計(jì)升級(jí)架構(gòu)
  • 能力提升與快速迭代(2021年至今):數(shù)據(jù)源擴(kuò)展為包含離線、近實(shí)時(shí)、業(yè)務(wù)等端到端系統(tǒng),搜索和血緣能力有明顯增強(qiáng),探索機(jī)器學(xué)習(xí)能力,產(chǎn)品形態(tài)更成熟穩(wěn)定。另外我們還具備了ToB售賣的能力。
點(diǎn)擊跳轉(zhuǎn)?
大數(shù)據(jù)研發(fā)治理套件-火山引擎
?了解更多

到了這里,關(guān)于火山引擎 DataLeap 構(gòu)建Data Catalog系統(tǒng)的實(shí)踐(二):技術(shù)與產(chǎn)品概覽的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 數(shù)據(jù)剖析更靈活、更快捷,火山引擎 DataLeap 動(dòng)態(tài)探查全面升級(jí)

    更多技術(shù)交流、求職機(jī)會(huì),歡迎關(guān)注 字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)微信公眾號(hào),回復(fù)【1】進(jìn)入官方交流群 近期,火山引擎 DataLeap 上線“動(dòng)態(tài)探查”能力,為用戶提供全局?jǐn)?shù)據(jù)視角、完善的抽樣策略,提高數(shù)據(jù)探查的靈活度以及響應(yīng)速率。 傳統(tǒng)的數(shù)據(jù)探查是基于庫(kù)表的全量探查,由后

    2024年02月03日
    瀏覽(20)
  • 火山引擎 DataLeap:揭秘字節(jié)跳動(dòng)業(yè)務(wù)背后的分布式數(shù)據(jù)治理思路

    火山引擎 DataLeap:揭秘字節(jié)跳動(dòng)業(yè)務(wù)背后的分布式數(shù)據(jù)治理思路

    動(dòng)手點(diǎn)關(guān)注 干貨不迷路 導(dǎo)讀:經(jīng)過十多年的發(fā)展, 數(shù)據(jù)治理 在傳統(tǒng)行業(yè)以及新興互聯(lián)網(wǎng)公司都已經(jīng)產(chǎn)生落地實(shí)踐。字節(jié)跳動(dòng)也在探索一種分布式的數(shù)據(jù)治理方式。本篇內(nèi)容來源于 火山引擎 超話數(shù)據(jù)直播活動(dòng)的回顧,將從以下四個(gè)部分展開分享: 字節(jié)的挑戰(zhàn)與實(shí)踐 數(shù)據(jù)治

    2023年04月10日
    瀏覽(16)
  • 開發(fā)調(diào)試更便捷!火山引擎 DataLeap 提供 Notebook 交互式開發(fā)體驗(yàn)

    開發(fā)調(diào)試更便捷!火山引擎 DataLeap 提供 Notebook 交互式開發(fā)體驗(yàn)

    更多技術(shù)交流、求職機(jī)會(huì),歡迎關(guān)注 字節(jié)跳動(dòng)數(shù)據(jù)平臺(tái)微信公眾號(hào),回復(fù)【1】進(jìn)入官方交流群 Notebook 是一種支持 REPL 模式的開發(fā)環(huán)境。 所謂「REPL」,即「讀取-求值-輸出」循環(huán):輸入一段代碼,立刻得到相應(yīng)的結(jié)果,并繼續(xù)等待下一次輸入。Notebook 通常使得探索性的開發(fā)和

    2024年02月12日
    瀏覽(19)
  • 火山引擎DataLeap如何解決SLA治理難題(二):申報(bào)簽署流程與復(fù)盤詳解

    火山引擎DataLeap如何解決SLA治理難題(二):申報(bào)簽署流程與復(fù)盤詳解

    火山引擎DataLeap SLA保障的前提是先達(dá)成SLA協(xié)議。在SLA保障平臺(tái)中,以 申報(bào)單簽署 的形式達(dá)成SLA協(xié)議。平臺(tái)核心特點(diǎn)是 優(yōu)化了SLA達(dá)成的流程 ,先通過 “系統(tǒng)卡點(diǎn)計(jì)算”減少待簽署任務(wù)的數(shù)量 ,再通過 “SLA推薦計(jì)算”自動(dòng)簽署部分任務(wù),最后為剩下的待簽署任務(wù)智能提供合適

    2024年02月15日
    瀏覽(14)
  • 火山引擎 Iceberg 數(shù)據(jù)湖的應(yīng)用與實(shí)踐

    火山引擎 Iceberg 數(shù)據(jù)湖的應(yīng)用與實(shí)踐

    在云原生計(jì)算時(shí)代,云存儲(chǔ)使得海量數(shù)據(jù)能以低成本進(jìn)行存儲(chǔ),但是這也給如何訪問、管理和使用這些云上的數(shù)據(jù)提出了挑戰(zhàn)。而 Iceberg 作為一種云原生的表格式,可以很好地應(yīng)對(duì)這些挑戰(zhàn)。本文將介紹火山引擎在云原生計(jì)算產(chǎn)品上使用 Iceberg 的實(shí)踐,和大家分享高效查詢、

    2024年02月09日
    瀏覽(20)
  • 湖倉(cāng)一體架構(gòu)在火山引擎 LAS 的探索與實(shí)踐

    湖倉(cāng)一體架構(gòu)在火山引擎 LAS 的探索與實(shí)踐

    動(dòng)手點(diǎn)關(guān)注 干貨不迷路 火山引擎湖倉(cāng)一體分析服務(wù) LAS(Lakehouse Analytics Service),是面向湖倉(cāng)一體架構(gòu)的 Serverless 數(shù)據(jù)處理分析服務(wù),提供字節(jié)跳動(dòng)最佳實(shí)踐的一站式 EB 級(jí)海量數(shù)據(jù)存儲(chǔ)計(jì)算和交互分析能力,兼容 Spark、Presto 生態(tài),幫助企業(yè)輕松構(gòu)建智能實(shí)時(shí)湖倉(cāng)。 LAS 服務(wù)是

    2024年02月06日
    瀏覽(19)
  • 火山引擎DataTester:A/B實(shí)驗(yàn)平臺(tái)數(shù)據(jù)集成技術(shù)分享

    DataTester的數(shù)據(jù)集成系統(tǒng),可大幅降低企業(yè)接入A/B實(shí)驗(yàn)平臺(tái)門檻。 ? 當(dāng)企業(yè)想要接入一套A/B實(shí)驗(yàn)平臺(tái)的時(shí)候,常常會(huì)遇到這樣的問題: 企業(yè)已經(jīng)有一套埋點(diǎn)系統(tǒng)了,增加A/B實(shí)驗(yàn)平臺(tái)的話需要重復(fù)做一遍埋點(diǎn),費(fèi)時(shí)費(fèi)力; 企業(yè)有多個(gè)客戶端和數(shù)據(jù)中臺(tái)并行的情況,這些不同來源

    2024年02月04日
    瀏覽(23)
  • 如何基于知識(shí)圖譜技術(shù)構(gòu)建現(xiàn)代搜索引擎系統(tǒng)、智能問答系統(tǒng)、智能推薦系統(tǒng)?

    如何基于知識(shí)圖譜技術(shù)構(gòu)建現(xiàn)代搜索引擎系統(tǒng)、智能問答系統(tǒng)、智能推薦系統(tǒng)?

    1.構(gòu)建搜索引擎系統(tǒng) 下圖中描述的體系結(jié)構(gòu)包括三個(gè)部分:結(jié)合本體庫(kù)的網(wǎng)絡(luò)爬蟲,索引及檢索模塊以及知識(shí)圖譜模塊。其中爬蟲及索引模塊主要負(fù)責(zé)從網(wǎng)絡(luò)中爬取原始數(shù)據(jù)并通過解析得到實(shí)體相關(guān)信息以及建立索引;搜索模塊結(jié)合本體庫(kù)Query解析檢索語句得到搜索,

    2024年02月12日
    瀏覽(42)
  • 構(gòu)建高效外賣系統(tǒng):技術(shù)實(shí)踐與代碼示例

    構(gòu)建高效外賣系統(tǒng):技術(shù)實(shí)踐與代碼示例

    外賣系統(tǒng)在現(xiàn)代社會(huì)中扮演著重要的角色,為用戶提供了便捷的用餐解決方案。在這篇文章中,我們將探討構(gòu)建高效外賣系統(tǒng)的技術(shù)實(shí)踐,同時(shí)提供一些基礎(chǔ)的代碼示例,幫助開發(fā)者更好地理解和應(yīng)用這些技術(shù)。 構(gòu)建外賣系統(tǒng)首先需要選擇合適的技術(shù)棧。以下是一個(gè)簡(jiǎn)單的技

    2024年01月19日
    瀏覽(22)
  • TPC-DS 測(cè)試是否支持 Glue Data Catalog?

    在上一篇文章《在Hive/Spark上執(zhí)行TPC-DS基準(zhǔn)測(cè)試 (PARQUET格式)》中,我們?cè)敿?xì)介紹了具體的操作方法,當(dāng)時(shí)的集群使用的是Hive Metastore,所有操作均可成功執(zhí)行。當(dāng)集群?jiǎn)⒂?Glue Data Catalog 時(shí),在執(zhí)行 add_constraints.sql 時(shí)會(huì)報(bào)錯(cuò):

    2024年02月12日
    瀏覽(22)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包