国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

這篇具有很好參考價(jià)值的文章主要介紹了實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

當(dāng)前隨著企業(yè)內(nèi)外部數(shù)據(jù)源的不斷擴(kuò)展和積累,數(shù)據(jù)呈現(xiàn)出大規(guī)模、多樣化、質(zhì)量參差不齊等顯著特征。如何有效激活這些結(jié)構(gòu)復(fù)雜且類型多樣的數(shù)據(jù)資產(chǎn),挖掘其深層價(jià)值,已成為眾多企業(yè)亟待解決的實(shí)際挑戰(zhàn)。

袋鼠云數(shù)棧作為新一代一站式大數(shù)據(jù)基礎(chǔ)軟件,其核心優(yōu)勢(shì)在于不僅提供了快速便捷、易于上手的底層數(shù)據(jù)開(kāi)發(fā)模塊,更推出了涵蓋質(zhì)量、標(biāo)簽及指標(biāo)等上層偏業(yè)務(wù)功能模塊。這些模塊旨在實(shí)現(xiàn)對(duì)數(shù)據(jù)質(zhì)量的有效校驗(yàn)、提升數(shù)據(jù)加工處理效能以及規(guī)范檢索流程,從而賦能最上層的業(yè)務(wù)人員進(jìn)行自主分析與直觀展示。

因此,在技術(shù)選型過(guò)程中,關(guān)鍵一步便是選擇一款集數(shù)據(jù)ETL、聯(lián)邦比對(duì)、Ad-hoc 查詢以及報(bào)表展示等一系列功能于一體的全能型底層計(jì)算引擎,以驅(qū)動(dòng)整個(gè)平臺(tái)高效運(yùn)作。

袋鼠云數(shù)棧經(jīng)過(guò)技術(shù)沉淀與實(shí)踐,探索出以 Trino 作為底層計(jì)算引擎的解決方案,并將此回饋給開(kāi)發(fā)者們。

為什么是 Trino?

Trino 是一種分布式 SQL 查詢引擎,旨在查詢分布在一個(gè)或多個(gè)異構(gòu)數(shù)據(jù)源上的大型數(shù)據(jù)集。它通過(guò)在整個(gè)集群的服務(wù)器上分配處理任務(wù)來(lái)實(shí)現(xiàn)橫向擴(kuò)展,基于這種架構(gòu),Trino 查詢引擎可以在集群內(nèi)的計(jì)算節(jié)點(diǎn)并行處理海量數(shù)據(jù)的 SQL 查詢。

Trino 作為一個(gè)典型的存算分離 OLAP 引擎,采用了經(jīng)典的 Master-Slave 架構(gòu),即 Coordinator+多個(gè) Worker。其中,Coordinator 主要做以下三件事:

· 接收、處理 Client 的請(qǐng)求,返回查詢結(jié)果給 Client

· 對(duì) SQL 進(jìn)行詞法解析,隨后進(jìn)行語(yǔ)法/語(yǔ)義分析并優(yōu)化生成執(zhí)行計(jì)劃

· 將物理執(zhí)行計(jì)劃以 TASK 的方式分發(fā)到 Worker 節(jié)點(diǎn)去執(zhí)行并將結(jié)果進(jìn)行匯總

Worker 是實(shí)際的執(zhí)行節(jié)點(diǎn),主要就做一件事情,執(zhí)行 Coordinator 分發(fā)下來(lái)的 TASK。

Trino 的前身便是大名鼎鼎的 Presto。Trino 和 PrestoDB 的架構(gòu)是類似的,在這里附上 PrestoDB 的架構(gòu)圖:

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

我們對(duì)于底層計(jì)算引擎的選型同樣經(jīng)歷了從 PresotDB 到 Trino 的過(guò)程,中間對(duì)這兩者從功能、性能、社區(qū)活躍度幾個(gè)維度進(jìn)行過(guò)詳細(xì)的調(diào)研。通過(guò)對(duì)比,我們發(fā)現(xiàn) Trino 相較于 PrestoDB 有以下幾個(gè)優(yōu)勢(shì):

· 動(dòng)態(tài)過(guò)濾優(yōu)化

· 賬號(hào)安全認(rèn)證集成度

· 審計(jì)日志集成度

· 更多的 RBO 優(yōu)化規(guī)則

· 享受 Spark 統(tǒng)計(jì)信息加成

· 更多的 UDF 函數(shù)

· 更多基于 ORC 表格式的查詢優(yōu)化

· 社區(qū)的高活躍度,在技術(shù)上更加激進(jìn)

其中,社區(qū)的高活躍度、更多的 RBO 優(yōu)化規(guī)則以及享受 Spark 統(tǒng)計(jì)信息加成是我們選擇 Trino 的根本原因。

Trino 在數(shù)棧的部署架構(gòu)

Trino 在袋鼠云數(shù)棧落地的探索實(shí)踐中經(jīng)歷了兩種方式的迭代:混合部署方式和資源物理隔離方式。

混合部署方式

在剛剛將 Trino 選定為指標(biāo)、標(biāo)簽平臺(tái)底層計(jì)算引擎時(shí),考慮到部分企業(yè)的業(yè)務(wù)量以及數(shù)據(jù)量規(guī)模,我們決定采取 Trino Worker 與 HDFS DataNode 混合部署的策略,這樣可以避免跨網(wǎng)絡(luò)節(jié)點(diǎn)的數(shù)據(jù)拉取帶來(lái)的查詢延遲問(wèn)題。

在企業(yè)業(yè)務(wù)量和數(shù)據(jù)規(guī)模相對(duì)較小的情況下,這種混合部署方式確實(shí)能夠在滿足客戶業(yè)務(wù)需求的 SLA 的同時(shí),還能夠達(dá)到降本增效的效果。但是當(dāng)客戶的業(yè)務(wù)量以及數(shù)據(jù)量達(dá)到一定規(guī)模時(shí),這種混合部署方式也會(huì)隨之帶來(lái)一系列資源競(jìng)爭(zhēng)衍生出的穩(wěn)定性問(wèn)題。

具體來(lái)說(shuō),當(dāng)數(shù)據(jù)量不斷攀升時(shí),Trino Worker 節(jié)點(diǎn)處理每次查詢所需內(nèi)存峰值也會(huì)相應(yīng)增大。當(dāng)峰值增長(zhǎng)太快而 Trino 來(lái)不及做內(nèi)存回撤時(shí),會(huì)直接增加 Worker 的堆內(nèi)存使用,進(jìn)而影響其他的業(yè)務(wù)查詢。此外,還可能會(huì)間接性增加整個(gè) Worker 的堆外內(nèi)存的使用量,導(dǎo)致 HDFS 的 DataNode 與 Woker 進(jìn)行資源的搶占,從而降低了兩個(gè)系統(tǒng)的穩(wěn)定性。

資源物理隔離方式

為應(yīng)對(duì)大型企業(yè)在數(shù)棧指標(biāo)、標(biāo)簽平臺(tái)每日面臨的海量 ETL 處理、Ad-hoc 查詢以及 API 報(bào)表分析等業(yè)務(wù)需求,并考慮到 Trino 只能做軟性資源隔離的劣勢(shì),我們采取了資源物理隔離的解決方案。同時(shí)基于客戶業(yè)務(wù)的時(shí)效性要求,我們將原來(lái)的一個(gè)集群劃分成了離線集群和 API 集群,以分別高效地處理客戶的 ETL 任務(wù)和 API 報(bào)表分析等業(yè)務(wù),同時(shí)利用袋鼠云 EMR 運(yùn)維工具進(jìn)行集群部署和管理。

針對(duì)負(fù)責(zé)客戶 ETL 任務(wù)的離線集群,我們采取了降低任務(wù)并發(fā)、增加任務(wù)的容錯(cuò)配置以及寫(xiě)入并發(fā)控制等優(yōu)化策略,從而顯著提升 ETL 任務(wù)的穩(wěn)定性;而對(duì)于 API 報(bào)表分析等業(yè)務(wù),則通過(guò)適當(dāng)增加任務(wù)并發(fā)、算子并行度等手段,來(lái)降低客戶 API 報(bào)表業(yè)務(wù)的延時(shí)性,確保了整體服務(wù)性能和用戶體驗(yàn)。

挑戰(zhàn)、問(wèn)題及解決方案

在以 Trino 為底層計(jì)算引擎,袋鼠云數(shù)棧服務(wù)企業(yè)的過(guò)程中,我們也遇到了一些具有代表性的問(wèn)題以及痛點(diǎn),在這里分享一部分?jǐn)?shù)棧的解決方案。

任務(wù)并發(fā)運(yùn)行數(shù)量大帶來(lái)的任務(wù)間穩(wěn)定性問(wèn)題

日常情況下,我們同時(shí)使用 Trino 的在線用戶可能在個(gè)位數(shù),運(yùn)行 SQL 的并發(fā)數(shù)量屈指可數(shù),因此不會(huì)存在用戶任務(wù)之間資源競(jìng)爭(zhēng)的問(wèn)題。但是當(dāng)我們面臨的客戶群體規(guī)模是「總行+N分行」時(shí),在線用戶數(shù)和 SQL 執(zhí)行的并發(fā)請(qǐng)求量會(huì)顯著增加。在這種情況下,受限于當(dāng)前有限的系統(tǒng)資源,一旦某個(gè)分行的任務(wù)運(yùn)行時(shí)間較長(zhǎng)且占用大量資源,就極有可能導(dǎo)致其他分行的任務(wù)響應(yīng)速度大幅降低,甚至出現(xiàn)任務(wù)執(zhí)行失敗的情況。

● 原因分析

Trino 不能夠承擔(dān)很高的并發(fā)運(yùn)行情況,主要在于兩點(diǎn):

· 海量的數(shù)據(jù)規(guī)模導(dǎo)致 Trino 不得不消耗大量的資源去進(jìn)行快速計(jì)算

· TCP 通信的連接數(shù)限制會(huì)導(dǎo)致大量任務(wù)并發(fā)運(yùn)行時(shí) block 或者直接失敗掉

● 解決思路

根據(jù)當(dāng)前的 Trino 集群情況,通過(guò)配置資源組,合理限制各個(gè)分行的任務(wù)并發(fā)數(shù)量,同時(shí)限制任務(wù)運(yùn)行的最大執(zhí)行時(shí)長(zhǎng)、Memory 大小、CPU 使用時(shí)長(zhǎng)。這樣,既能夠保證正在運(yùn)行的任務(wù)穩(wěn)定性,同時(shí)也主動(dòng)過(guò)濾了不合理的任務(wù)異常占用資源的情況。更重要的是,通過(guò)任務(wù)排隊(duì)的方式,降低任務(wù)的失敗率,避免影響下游任務(wù)的出數(shù)。

底層 HiveMetastore 負(fù)載過(guò)高,任務(wù)大量超時(shí)失敗

數(shù)棧客戶的主要業(yè)務(wù)場(chǎng)景之一是通過(guò) Trino 來(lái)加速對(duì) Hive 數(shù)據(jù)的處理以及查詢。Trino 與 Hive 的最主要區(qū)別是 RunTime 層面不同,一個(gè)是基于內(nèi)存的計(jì)算,一個(gè)是基于 MR 的計(jì)算。本質(zhì)上 Trino 的 Hive 插件還是依賴 HiveMetastore(下文簡(jiǎn)稱 HMS) 以及 HDFS 做數(shù)據(jù)的處理以及查詢。因此當(dāng)客戶端業(yè)務(wù)量比較大的情況下,會(huì)因?yàn)轭l繁訪問(wèn) HMS,出現(xiàn) HMS 內(nèi)存異常高且訪問(wèn)超時(shí)的問(wèn)題。

● 原因分析

在分析為什么會(huì)導(dǎo)致 HMS 負(fù)載過(guò)高之前,我們得先弄明白 Trino 在哪些步驟會(huì)訪問(wèn) HMS。

通過(guò)源碼分析發(fā)現(xiàn),Trino 在 SQL 語(yǔ)義分析階段會(huì)通過(guò)訪問(wèn) HMS 來(lái)完善每個(gè) Node 的元數(shù)據(jù)相關(guān)信息,后續(xù)會(huì)借助這些元數(shù)據(jù)信息生成邏輯執(zhí)行計(jì)劃。在對(duì)數(shù)據(jù)進(jìn)行 DDL 時(shí)或者執(zhí)行 DML 時(shí),也會(huì)出現(xiàn)有 HMS 的操作。另外 Trino 基于 Thrift 協(xié)議自己實(shí)現(xiàn)了一套 HMS 的 Client 端,并實(shí)現(xiàn)了失敗重試以及高可用功能。

但是我們發(fā)現(xiàn) Trino HMS Client 的失敗重試只是針對(duì)于連接失敗,當(dāng)一臺(tái) HMS 連接不上會(huì)去連接另外一臺(tái) HMS,而我們現(xiàn)在是 socket read timeout 類的失敗。這樣的話,即使任務(wù)失敗了,那么下一次 Trino 還是會(huì)連接這臺(tái) HMS,從而導(dǎo)致 HMS 持續(xù)高負(fù)載低響應(yīng)。其中,由于 Trino 和 PrestoDB 在執(zhí)行過(guò)程上差別不大,在這里附上 PrestoDB 的 SQL 執(zhí)行過(guò)程原理:

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

隨后我們又基于 HMS 的 gc 日志以及火焰圖進(jìn)行分析,發(fā)現(xiàn)平臺(tái)性能瓶頸都出現(xiàn)在 String.intern() 這個(gè)方法上。具體來(lái)說(shuō),當(dāng) String.intern() 被調(diào)用后,底層會(huì)從一個(gè) hash table 的數(shù)據(jù)結(jié)構(gòu)中找同名字符串,在數(shù)量較大時(shí)會(huì)導(dǎo)致 hash 碰撞使 CPU 占用升高。

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

除此之外,我們從 HMS 的元信息數(shù)據(jù)庫(kù) MySQL 中看到表數(shù)量和分區(qū)數(shù)分別達(dá)到了十萬(wàn)級(jí)別跟百萬(wàn)級(jí)別。

● 解決思路

基于上述分析,我們決定從 HMS 和 Trino 兩方面入手。

在 HMS 層面,我們調(diào)整了 JVM 參數(shù):

-XX:StringTableSize=20000000

但是好景不長(zhǎng),半個(gè)月左右問(wèn)題再次復(fù)現(xiàn),鑒于此,我們開(kāi)始質(zhì)疑問(wèn)題可能并非僅局限于 StringTable 本身,而是懷疑是 StringTable 中的數(shù)據(jù)沒(méi)有釋放。

在網(wǎng)上搜索“G1 CMS StringTable”關(guān)鍵字查找到 JDK 的一個(gè)相關(guān) bug:https://bugs.openjdk.org/browse/JDK-8180048

G1 垃圾回收器在回收 StringTable 上存在問(wèn)題,效率不及 CMS。最后通過(guò)將 Hive MetaStore 的垃圾回收器由 G1 調(diào)整為 CMS,問(wèn)題得以解決。

在 Trino 層面,我們開(kāi)啟了 Metastore 的緩存,考慮到 Coorinator 內(nèi)存的限制,我們?cè)O(shè)置了緩存的最大數(shù)量。其配置如下:

hive.metastore-cache-ttl=2h
hive.metastore-refresh-interval=1h
hive.metastore-cache-maximum-size=5000000
hive.metastore-refresh-max-threads=30
hive.metastore-cache.cache-partitions=true

另外,基于客戶當(dāng)前的數(shù)據(jù)量規(guī)模,我們發(fā)現(xiàn)在某些特殊的場(chǎng)景下 HMS 接口調(diào)用20s的超時(shí)時(shí)間是遠(yuǎn)遠(yuǎn)不夠的,而 Hive 社區(qū)在0.14版本就已經(jīng)將 HMS 20s的超時(shí)時(shí)間調(diào)整到600s來(lái)提高穩(wěn)定性,因此我們也將 Trino HMS 超時(shí)時(shí)間調(diào)整到了600s:

hive.metastore-timeout=600s

最后,我們優(yōu)化了 Trino HMS 的訪問(wèn)策略,增加了 RoundRobin 模式,來(lái)對(duì) HMS 的請(qǐng)求做負(fù)載均衡,避免單臺(tái) HMS 的請(qǐng)求負(fù)載過(guò)高。其配置如下:

hive.metastore.round-robin=true

● 實(shí)際使用效果

通過(guò)上述的調(diào)整之后,數(shù)棧的 Trino 集群基本上能夠滿足日均10w+ETL 任務(wù)的快速穩(wěn)定運(yùn)行。在這里附上內(nèi)部離線集群部分日均調(diào)用情況:

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

Catalog 配置后冷重啟導(dǎo)致業(yè)務(wù)中斷

在客戶使用數(shù)棧時(shí),經(jīng)常有很多需要跨數(shù)據(jù)源的聯(lián)邦查詢場(chǎng)景,因此不得不頻繁對(duì) Trino 配置靜態(tài) Catalog 文件并進(jìn)行重啟,這樣就會(huì)影響當(dāng)前正在運(yùn)行的任務(wù)。因此,我們開(kāi)始思考如何實(shí)現(xiàn) Catalog 的動(dòng)態(tài)添加與注冊(cè)。

● 解決思路

如何持久化 Catalog 元數(shù)據(jù)?

在早期的動(dòng)態(tài)配置 Catalog 方案中,我們選擇將 Catalog 元數(shù)據(jù)保存在 zookeeper 上,默認(rèn)路徑為 /trino/catalog/meta,每一個(gè) Catalog 都會(huì)在保存路徑下創(chuàng)建一個(gè)節(jié)點(diǎn)并寫(xiě)入 Catalog 元數(shù)據(jù)信息。在相應(yīng)的 Catalog 節(jié)點(diǎn)下會(huì)存在若干子節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表 Trino 中的一個(gè) Node,節(jié)點(diǎn)內(nèi)容為該 Node 上的該 Catalog 狀態(tài)信息,該狀態(tài)信息由各個(gè) Node 定時(shí)檢測(cè)并匯報(bào)。

如何操作管理 Catalog?

· 在 Coordinator 中提供出管理 Catalog 的 rest 接口進(jìn)行訪問(wèn)

· Coordinator 收到請(qǐng)求后會(huì)往 zk 上的元數(shù)據(jù)保存路徑下新增一個(gè) Catalog 節(jié)點(diǎn)并將 Catalog 元數(shù)據(jù)信息寫(xiě)入 Catalog 節(jié)點(diǎn)

· 隨后各個(gè) Node(包含 Coordinator 和 Worker)內(nèi)的監(jiān)聽(tīng)線程根據(jù)元數(shù)據(jù)保存路徑下的節(jié)點(diǎn)事件來(lái)通過(guò) CatalogManager 進(jìn)行操作

· Coordinator 節(jié)點(diǎn)在操作完 Catalog 并匯報(bào)操作結(jié)果后會(huì)等待所有節(jié)點(diǎn)的操作結(jié)果,若在超時(shí)時(shí)間內(nèi)獲取 Node 的操作結(jié)果且都操作成功,那么則認(rèn)為此次 Catalog 操作成功,否則會(huì)認(rèn)為失敗

· 若 Catalog 操作失敗,Coorinator 節(jié)點(diǎn)會(huì)進(jìn)行事務(wù)回滾操作,刪除 zk 上的 Catalog 節(jié)點(diǎn)以及所有子節(jié)點(diǎn)

下圖為 Trino 添加 Catalog 的原理圖:

實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐

● 實(shí)際使用效果

從客戶使用層面來(lái)講,通過(guò)在頁(yè)面動(dòng)態(tài)配置 Trino Catalog,大幅度提升了客戶使用平臺(tái)的效率,同時(shí)降低了客戶運(yùn)維側(cè)的成本。

《數(shù)棧產(chǎn)品白皮書(shū)》下載地址:https://www.dtstack.com/resources/1004?src=szsm

《數(shù)據(jù)治理行業(yè)實(shí)踐白皮書(shū)》下載地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或咨詢更多有關(guān)大數(shù)據(jù)產(chǎn)品、行業(yè)解決方案、客戶案例的朋友,瀏覽袋鼠云官網(wǎng):https://www.dtstack.com/?src=szbky文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-805129.html

到了這里,關(guān)于實(shí)戰(zhàn)講解|Trino 在袋鼠云數(shù)棧的探索與實(shí)踐的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 袋鼠云數(shù)棧UI5.0設(shè)計(jì)實(shí)戰(zhàn)|B端表單這樣設(shè)計(jì),不僅美觀還提效

    袋鼠云數(shù)棧UI5.0設(shè)計(jì)實(shí)戰(zhàn)|B端表單這樣設(shè)計(jì),不僅美觀還提效

    我們是袋鼠云數(shù)棧 UED 團(tuán)隊(duì),致力于打造優(yōu)秀的一站式數(shù)據(jù)中臺(tái)產(chǎn)品。我們始終保持工匠精神,探索前端道路,為社區(qū)積累并傳播經(jīng)驗(yàn)價(jià)值。 本文作者:大喜 相關(guān)文章:袋鼠云出品!數(shù)棧UI 5.0全新體驗(yàn)升級(jí),設(shè)計(jì)背后的故事 表單是B端產(chǎn)品中最常見(jiàn)的組件之一,主要?于數(shù)據(jù)

    2024年02月03日
    瀏覽(24)
  • 袋鼠云數(shù)棧產(chǎn)品中 AI+ 實(shí)現(xiàn)原理剖析

    袋鼠云數(shù)棧產(chǎn)品中 AI+ 實(shí)現(xiàn)原理剖析

    我們是袋鼠云數(shù)棧 UED 團(tuán)隊(duì),致力于打造優(yōu)秀的一站式數(shù)據(jù)中臺(tái)產(chǎn)品。我們始終保持工匠精神,探索前端道路,為社區(qū)積累并傳播經(jīng)驗(yàn)價(jià)值。 本文作者:修能 生產(chǎn)力工具 + AI 是不可逆轉(zhuǎn)的趨勢(shì),慢慢的大模型能力通過(guò) AI Agent 落地的工程化能力也開(kāi)始趨于成熟。作為大數(shù)據(jù)產(chǎn)

    2024年01月25日
    瀏覽(19)
  • 揭秘|來(lái)看看袋鼠云數(shù)棧內(nèi)部的資產(chǎn)血緣方案設(shè)計(jì)與實(shí)現(xiàn)

    揭秘|來(lái)看看袋鼠云數(shù)棧內(nèi)部的資產(chǎn)血緣方案設(shè)計(jì)與實(shí)現(xiàn)

    數(shù)據(jù)資產(chǎn)現(xiàn)在需要接入數(shù)棧內(nèi)部相關(guān)應(yīng)用的時(shí)候,支持查看血緣的類型從表、離線任務(wù)增加到需要表、離線任務(wù)、實(shí)時(shí)任務(wù)、API任務(wù)、指標(biāo)、標(biāo)簽等,需要支持?jǐn)?shù)?,F(xiàn)有的所有應(yīng)用任務(wù),最終實(shí)現(xiàn)在數(shù)據(jù)資產(chǎn)平臺(tái)查看任務(wù)的完整應(yīng)用鏈路。 雖然增加不同的任務(wù),現(xiàn)階段資產(chǎn)實(shí)

    2024年02月16日
    瀏覽(26)
  • 一文了解袋鼠云在實(shí)時(shí)數(shù)據(jù)湖上的探索與實(shí)踐

    一文了解袋鼠云在實(shí)時(shí)數(shù)據(jù)湖上的探索與實(shí)踐

    近日,袋鼠云大數(shù)據(jù)引擎專家郝衛(wèi)亮,為大家?guī)?lái)了《袋鼠云在實(shí)時(shí)數(shù)據(jù)湖上的探索與實(shí)踐》主題分享,幫助大家能了解到什么是實(shí)時(shí)數(shù)據(jù)湖、如何進(jìn)行數(shù)據(jù)湖選型及數(shù)據(jù)平臺(tái)建設(shè)數(shù)據(jù)湖的經(jīng)驗(yàn)。 如今,大規(guī)模、高時(shí)效、智能化數(shù)據(jù)處理已是“剛需”,企業(yè)需要更強(qiáng)大的數(shù)據(jù)

    2024年02月08日
    瀏覽(15)
  • 基于袋鼠云實(shí)時(shí)開(kāi)發(fā)平臺(tái)開(kāi)發(fā) FlinkSQL 任務(wù)的實(shí)踐探索

    基于袋鼠云實(shí)時(shí)開(kāi)發(fā)平臺(tái)開(kāi)發(fā) FlinkSQL 任務(wù)的實(shí)踐探索

    隨著業(yè)務(wù)的發(fā)展,實(shí)時(shí)場(chǎng)景在各個(gè)?業(yè)中變得越來(lái)越重要。?論是?融、電商還是物流,實(shí)時(shí)數(shù)據(jù)處理都成為了其中的關(guān)鍵環(huán)節(jié)。Flink 憑借其強(qiáng)?的流處理特性、窗?操作以及對(duì)各種數(shù)據(jù)源的?持,成為實(shí)時(shí)場(chǎng)景下的?選開(kāi)發(fā)?具。 FlinkSQL 通過(guò) SQL 語(yǔ)??向數(shù)據(jù)開(kāi)發(fā)提供了更

    2024年02月12日
    瀏覽(20)
  • 袋鼠云產(chǎn)品功能更新報(bào)告05期|應(yīng)有盡“優(yōu)”,數(shù)棧一大波功能優(yōu)化升級(jí)!

    袋鼠云產(chǎn)品功能更新報(bào)告05期|應(yīng)有盡“優(yōu)”,數(shù)棧一大波功能優(yōu)化升級(jí)!

    這段時(shí)間,我們對(duì)產(chǎn)品本身以及客戶反饋的一些問(wèn)題進(jìn)行了持續(xù)的更新和優(yōu)化,包括對(duì)離線平臺(tái)數(shù)據(jù)同步功能的更新,數(shù)據(jù)資產(chǎn)平臺(tái)血緣問(wèn)題的優(yōu)化等,力求滿足不同行業(yè)用戶的更多需求,為用戶帶來(lái)極致的產(chǎn)品使用體驗(yàn)。 以下為袋鼠云產(chǎn)品功能更新報(bào)告第五期內(nèi)容,更多探

    2024年02月04日
    瀏覽(42)
  • 袋鼠云產(chǎn)品功能更新報(bào)告06期|數(shù)棧產(chǎn)品功能升級(jí),做產(chǎn)品我們是認(rèn)真的!

    袋鼠云產(chǎn)品功能更新報(bào)告06期|數(shù)棧產(chǎn)品功能升級(jí),做產(chǎn)品我們是認(rèn)真的!

    2023年已過(guò)半,袋鼠云開(kāi)發(fā)團(tuán)隊(duì)和產(chǎn)品團(tuán)隊(duì)對(duì)數(shù)棧產(chǎn)品本身以及客戶反饋的問(wèn)題和痛點(diǎn)進(jìn)行了持續(xù)性的更新和優(yōu)化,包括對(duì) EasyMR 監(jiān)控告警功能的更新,以及對(duì)離線開(kāi)發(fā)平臺(tái)表生命周期邏輯的優(yōu)化等,力求滿足不同行業(yè)用戶的更多需求,為用戶帶來(lái)極致的產(chǎn)品使用體驗(yàn)。 以下為

    2024年02月15日
    瀏覽(20)
  • 揭秘新一代云數(shù)倉(cāng)技術(shù)架構(gòu)與最佳實(shí)踐

    從傳統(tǒng)數(shù)倉(cāng)到湖倉(cāng)一體,歷經(jīng)三十多年發(fā)展,技術(shù)的浪潮快速迭代,以云原生數(shù)倉(cāng)為中心的現(xiàn)代數(shù)據(jù)棧時(shí)代已然到來(lái)。 背后的核心的原因在于,企業(yè)正在加速走向數(shù)字化、智能化,對(duì)數(shù)據(jù)的應(yīng)用也提出了全新要求,特別是對(duì)數(shù)據(jù)的實(shí)時(shí)分析、實(shí)時(shí)部署需求更加的強(qiáng)烈,而云數(shù)

    2024年02月09日
    瀏覽(32)
  • 如何構(gòu)建新一代實(shí)時(shí)湖倉(cāng)?袋鼠云基于數(shù)據(jù)湖的探索升級(jí)之路

    如何構(gòu)建新一代實(shí)時(shí)湖倉(cāng)?袋鼠云基于數(shù)據(jù)湖的探索升級(jí)之路

    在之前的實(shí)時(shí)湖倉(cāng)系列文章中,我們已經(jīng)介紹了實(shí)時(shí)湖倉(cāng)對(duì)于當(dāng)前企業(yè)數(shù)字化轉(zhuǎn)型的重要性,實(shí)時(shí)湖倉(cāng)的功能架構(gòu)設(shè)計(jì),以及實(shí)時(shí)計(jì)算和數(shù)據(jù)湖結(jié)合的應(yīng)用場(chǎng)景。 在本篇文章中,將介紹袋鼠云數(shù)棧在構(gòu)建實(shí)時(shí)湖倉(cāng)系統(tǒng)上的探索與落地實(shí)踐,及未來(lái)規(guī)劃。 數(shù)棧作為一個(gè)數(shù)據(jù)開(kāi)

    2024年02月05日
    瀏覽(33)
  • 【Trino實(shí)戰(zhàn)】Elasticsearch Connector輔助說(shuō)明

    對(duì)ES的版本要求:(Elasticsearch 6.6.0 or later) or OpenSearch (1.1.0 or later) 。 常規(guī)配置 Property name Description Default elasticsearch.host 以逗號(hào)分隔的Elasticsearch節(jié)點(diǎn)連接的主機(jī)名稱列表。這個(gè)屬性是必需的。 elasticsearch.port 要連接的Elasticsearch節(jié)點(diǎn)的端口。 9200 elasticsearch.default-schema-name 包含所有

    2024年02月07日
    瀏覽(18)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包