Datavines
是一站式開源數(shù)據(jù)可觀測性平臺,提供元數(shù)據(jù)管理、數(shù)據(jù)概覽報告、數(shù)據(jù)質(zhì)量管理,數(shù)據(jù)分布查詢、數(shù)據(jù)趨勢洞察等核心能力,致力于幫助用戶全面地了解和掌管數(shù)據(jù),讓您做到心中有數(shù),目前作為 Datavane
開源組織的重點推薦項目,正式開源,歡迎大家使用。
核心特性
數(shù)據(jù)目錄
-
定時獲取數(shù)據(jù)源元數(shù)據(jù),構(gòu)造數(shù)據(jù)目錄
-
定時監(jiān)聽元數(shù)據(jù)變更情況
-
支持元數(shù)據(jù)的標(biāo)簽管理
數(shù)據(jù)質(zhì)量監(jiān)控
-
內(nèi)置 27 個數(shù)據(jù)質(zhì)量檢查規(guī)則,開箱即用
-
支持 4 種數(shù)據(jù)質(zhì)量檢查規(guī)則類型
-
單表單列檢查類型
-
單表自定義
SQL
檢查類型 -
跨表準(zhǔn)確性檢查類型
-
兩表值比對檢查類型
-
-
支持配置定時任務(wù)進行定時檢查
-
支持配置
SLA
用于檢查結(jié)果告警
數(shù)據(jù)概覽
-
支持定時執(zhí)行數(shù)據(jù)探測,輸出數(shù)據(jù)概覽報告
-
支持自動識別列的類型自動匹配合適的數(shù)據(jù)概況指標(biāo)
-
支持表行數(shù)趨勢監(jiān)控
-
支持列的數(shù)據(jù)分布情況查看
插件化設(shè)計
平臺以插件化設(shè)計為核心,以下模塊都支持用戶自定義插件
進行擴展
-
數(shù)據(jù)源:已支持
MySQL
、Impala
、Starocks
、Doris
、Presto
、Trino
、ClickHouse
、PostgreSQL
- 檢查規(guī)則:內(nèi)置空值檢查、非空檢查、枚舉檢查等27個檢查規(guī)則
-
作業(yè)執(zhí)行引擎:已支持
Spark
和Local
兩種執(zhí)行引擎。Spark
引擎目前僅支持Spark2.4
版本,Local
引擎則是基于JDBC
開發(fā)的本地執(zhí)行引擎,無需依賴其他執(zhí)行引擎。 - 告警通道:已支持郵件
-
錯誤數(shù)據(jù)存儲:已支持
MySQL
和 本地文件(僅支持Local
執(zhí)行引擎) -
注冊中心:已支持
MySQL
、PostgreSQL
和ZooKeeper
多種運行模式
-
提供Web頁面配置檢查作業(yè)、運行作業(yè)、查看作業(yè)執(zhí)行日志、查看錯誤數(shù)據(jù)和檢查結(jié)果
-
支持在線生成作業(yè)運行腳本,通過
datavines-submit.sh
來提交作業(yè),可與調(diào)度系統(tǒng)配合使用
容易部署&高可用
-
平臺依賴少,容易部署
-
最小僅依賴
MySQL
既可啟動項目,完成數(shù)據(jù)質(zhì)量作業(yè)的檢查 -
支持水平擴容,自動容錯
-
無中心化設(shè)計,
Server
節(jié)點支持水平擴展提高性能 -
作業(yè)自動容錯,保證作業(yè)不丟失和不重復(fù)執(zhí)行
項目架構(gòu)
CatalogManager
CatalogManager
是負(fù)責(zé)管理元數(shù)據(jù)的組件,主要負(fù)責(zé)元數(shù)據(jù)的存儲、查詢以及元數(shù)據(jù)獲取任務(wù)的調(diào)度和容錯處理等。
DataQualityCenter
DataQualityCenter
是負(fù)責(zé)數(shù)據(jù)質(zhì)量管理的組件,主要負(fù)責(zé)數(shù)據(jù)質(zhì)量規(guī)則的管理、數(shù)據(jù)質(zhì)量作業(yè)的調(diào)度、執(zhí)行和自動容錯處理等。
快速上手
數(shù)據(jù)概覽
進行數(shù)據(jù)概覽只需下面3步:
- 創(chuàng)建數(shù)據(jù)源(或者選擇創(chuàng)建好的數(shù)據(jù)源)
- 點擊相應(yīng)的表
- 點擊右上角 運行概覽 并選擇想要探查的列
Datavines數(shù)據(jù)概覽演示
數(shù)據(jù)質(zhì)量檢查
進行數(shù)據(jù)質(zhì)量檢查只需下面4步:
- 點擊想要進行檢查的列,點擊 添加作業(yè)
- 選擇 檢查規(guī)則 并填入?yún)?shù)
- 選擇 檢查公式 ,比如 實際值/期望值 x100% ,填入比較符和閾值
- 點擊保存并運行即可
Datavines數(shù)據(jù)質(zhì)量檢查演示
加入我們
Datavines 的目標(biāo)是成為更好的數(shù)據(jù)可觀測性領(lǐng)域的開源項目,為更多的用戶去解決元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量管理中遇到的問題。在此我們真誠歡迎更多的貢獻(xiàn)者參與到社區(qū)建設(shè)中來,和我們一起成長,攜手共建更好的社區(qū)。
- 項目地址: https://github.com/datavane/datavines
- 問題和建議: https://github.com/datavane/datavines/issues
- 貢獻(xiàn)代碼: https://github.com/datavane/datavines/pulls
關(guān)于Datavane
Datavane
是一個專注于大數(shù)據(jù)領(lǐng)域的開源組織(社區(qū)),由一群大數(shù)據(jù)領(lǐng)域優(yōu)秀的開源項目作者共同創(chuàng)建,旨在幫助開源項目作者更好的建設(shè)項目、為大眾提供高質(zhì)量的開源軟件,宗旨是:只為做一個好軟件。目前已經(jīng)聚集了一批優(yōu)質(zhì)的開源項目,涉及到數(shù)據(jù)集成、大數(shù)據(jù)組件管理、數(shù)據(jù)質(zhì)量等。
在 Datavane
社區(qū)中,所有的項目都是開源開放的,代碼質(zhì)量和架構(gòu)設(shè)計優(yōu)質(zhì)的潛力項目。社區(qū)保持開放中立、協(xié)作創(chuàng)造、堅持精品,鼓勵所有的開發(fā)者、用戶和貢獻(xiàn)者積極參與我們的社區(qū)、共同合作,創(chuàng)新創(chuàng)造,建設(shè)一個更加強大的開源社區(qū)。文章來源:http://www.zghlxwxcb.cn/news/detail-569813.html
官 網(wǎng): http://www.datavane.org/
Github : https://github.com/datavane文章來源地址http://www.zghlxwxcb.cn/news/detail-569813.html
到了這里,關(guān)于一站式數(shù)據(jù)可觀測性平臺 Datavines 正式開源啦的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!