為了幫助大家及時了解中國數(shù)據(jù)庫行業(yè)發(fā)展現(xiàn)狀、梳理當(dāng)前數(shù)據(jù)庫市場環(huán)境和產(chǎn)品生態(tài)等情況,從2022年4月起,墨天輪社區(qū)行業(yè)分析研究團(tuán)隊出品將持續(xù)每月為大家推出最新《中國數(shù)據(jù)庫行業(yè)分析報告》,持續(xù)傳播數(shù)據(jù)技術(shù)知識、努力促進(jìn)技術(shù)創(chuàng)新與行業(yè)生態(tài)發(fā)展,目前已更至第十六期,并發(fā)布了共計122頁的2022年度分析報告。
墨天輪8月《中國數(shù)據(jù)庫行業(yè)分析報告》已正式發(fā)布(點擊即可跳轉(zhuǎn),歡迎大家下載查閱),本期報盤點了墨天輪“中國數(shù)據(jù)庫流行度排行”、新品發(fā)布、投融資等業(yè)內(nèi)資訊,以此展現(xiàn)當(dāng)前數(shù)據(jù)庫市場發(fā)展前沿動態(tài)。
本期報告重點聚焦數(shù)據(jù)倉庫,詳細(xì)介紹其架構(gòu)演進(jìn)、技術(shù)原理,并盤點總結(jié)五大技術(shù)特性與六大發(fā)展趨勢,首發(fā)【全球數(shù)據(jù)倉庫產(chǎn)業(yè)圖譜】,最后精選國內(nèi)外典型的數(shù)據(jù)倉庫產(chǎn)品案例介紹其原理特性,以期帶領(lǐng)大家更加全面、深入地掌握數(shù)倉技術(shù)相關(guān)知識點與應(yīng)用實踐。
一、數(shù)據(jù)庫排行榜及前沿動態(tài)
?本章節(jié)目錄
- 8月中國數(shù)據(jù)庫流行度排名分析
2023年8月的墨天輪中國數(shù)據(jù)庫流行度排行榜共286個數(shù)據(jù)庫參與排名,本月排行榜前十中,頭部變動加劇。其中,OceanBase?連續(xù)九個月奪魁,TiDB?排名較上月上升一位至第二名,阿里云?PolarDB?連續(xù)兩個月排名持續(xù)攀升本月已至第四名。
本月排行榜中一批有潛力的產(chǎn)品排名較上月有所上升,在第10-50名這一賽段不少數(shù)據(jù)庫勢不可擋沖進(jìn)賽場。諸如百度自研并開源的 OLAP 數(shù)據(jù)庫?Apache Doris?排名較上月上升一位至第16名;阿里云?Hologres?是8月新增參與排名的數(shù)據(jù)庫,其排名直逼前二十來到第22名;星環(huán)科技打造的分布式關(guān)系型數(shù)據(jù)庫?KunDB?本月排名上升3位至第28名;北京大學(xué)王選所數(shù)據(jù)管理實驗室研發(fā)的面向 RDF 知識圖譜的開源原生圖數(shù)據(jù)庫系統(tǒng)?gStore?本月排名上升至第31名;貝格邁思(Bigmath)自主設(shè)計研發(fā)采用C++開發(fā)的新型智能數(shù)據(jù)庫 AiSQL 產(chǎn)品?BigInsights?,本月排名較上月迅速攀升63名,現(xiàn)位列第33名等。
- 數(shù)據(jù)庫行業(yè)發(fā)展動態(tài)
報告整理了近期業(yè)內(nèi)較受關(guān)注的投融資、新品發(fā)布等資訊。其中,2023年8月,財政部會同工業(yè)和信息化部研究起草了關(guān)于數(shù)據(jù)庫、操作系統(tǒng)、通用服務(wù)器、殺毒軟件、中間件、便攜式計算機、臺式計算機、一體式計算機、工作站等政府采購需求標(biāo)準(zhǔn),數(shù)據(jù)庫政府采購需求標(biāo)準(zhǔn)分別包括分布式數(shù)據(jù)庫和集中式數(shù)據(jù)庫兩類。此外,星環(huán)科技自主研發(fā)的企業(yè)級交互式數(shù)據(jù)檢索統(tǒng)計分析平臺?Transwarp Scope 2.5版本發(fā)布,報告對其特性功能進(jìn)行了解讀;數(shù)據(jù)庫初創(chuàng)公司?Neon?獲得 4600 萬美元融資;Oracle 宣布全面推出?MySQL HeatWave Lakehouse,使客戶能夠像查詢數(shù)據(jù)庫內(nèi)的數(shù)據(jù)一樣快速地查詢對象存儲中的數(shù)據(jù)。此處因篇幅所限僅截取部分圖片,具體內(nèi)容可查閱報告。
二、數(shù)據(jù)倉庫概述及技術(shù)演進(jìn)
?本章節(jié)目錄
- 數(shù)據(jù)倉庫基本概述
在沒有數(shù)據(jù)倉庫的時代,數(shù)據(jù)分析人員需要收集、清洗、整合來自多個數(shù)據(jù)源的數(shù)據(jù),并為每個決策支持環(huán)境做部分?jǐn)?shù)據(jù)復(fù)制,過程耗時長并且準(zhǔn)確率低。且由于系統(tǒng)迭代更新快,數(shù)據(jù)源通常是已經(jīng)下線的舊業(yè)務(wù)系統(tǒng),這為數(shù)據(jù)分析工作增添了難度。在此發(fā)展背景下,數(shù)據(jù)倉庫(Data Warehouse)?應(yīng)運而生。
報告第二章具體介紹了數(shù)據(jù)倉庫的起源、分層架構(gòu)、基本特征以及架構(gòu)的演變、發(fā)展歷程。數(shù)據(jù)倉庫是來自一個或多個不同來源的集成數(shù)據(jù)的中央存儲庫,將當(dāng)前和歷史數(shù)據(jù)存儲在一個位置,用于為整個企業(yè)的員工創(chuàng)建分析報告,具有面向主題、集成性、非易失性、時變性等特性。
而從1990年 Inmon 提出數(shù)據(jù)倉庫概念至今,數(shù)倉的架構(gòu)也經(jīng)歷了多次演進(jìn),已由最初的傳統(tǒng)數(shù)倉架構(gòu)——離線數(shù)倉庫——離線大數(shù)據(jù)架構(gòu)、Lambda 架構(gòu)、Kappa 架構(gòu)以及 Flink 的火熱帶出的流批一體架構(gòu),不斷方便用戶能以最自然、最小的成本完成實時計算。
此外,報告還總結(jié)了數(shù)倉從萌芽探索到全企業(yè)集成時代、企業(yè)數(shù)據(jù)集成時代、混亂時代–“數(shù)據(jù)倉庫之父”間的論戰(zhàn)、理論模型確認(rèn)時代以及數(shù)據(jù)倉庫產(chǎn)品百家爭鳴時代的發(fā)展歷程坐標(biāo)軸,望幫助讀者縱向掌握其發(fā)展脈絡(luò),具體內(nèi)容可查閱報告。
- 數(shù)據(jù)倉庫技術(shù)解析
報告通過架構(gòu)圖展示了數(shù)據(jù)倉庫的核心組件:中央數(shù)據(jù)庫、ETL(提取、轉(zhuǎn)換、加載)工具、元數(shù)據(jù)和訪問工具,并詳細(xì)解析了數(shù)據(jù)倉庫的五大關(guān)鍵技術(shù):查詢優(yōu)化器、MPP架構(gòu)、向量化、列式存儲和數(shù)據(jù)壓縮。
查詢優(yōu)化器的主要目標(biāo)是選擇最優(yōu)的執(zhí)行計劃,以最小化查詢的執(zhí)行成本,從而提高查詢性能;而MPP架構(gòu)可以加速對來自多個源的數(shù)據(jù)進(jìn)行預(yù)處理操作,以便將數(shù)據(jù)整理成適合分析的形式;向量化可以提高數(shù)據(jù)分析的效率,故被廣泛應(yīng)用于數(shù)據(jù)加載、轉(zhuǎn)換、數(shù)據(jù)分析、復(fù)雜查詢等操作中;列式存儲相比行式存儲壓縮率更高、讀寫效率更快,且能處理質(zhì)量更高的數(shù)據(jù);在數(shù)據(jù)倉庫中,通常采用行和列相結(jié)合的方式進(jìn)行壓縮,以提高存儲效率。此處僅簡單羅列并截圖展示了部分特性,欲了解具體內(nèi)容查閱報告。
數(shù)字化轉(zhuǎn)型浪潮卷起各種概念席卷而來,為幫助大家梳理區(qū)分,本章最后也介紹了數(shù)據(jù)湖、湖倉一體、智能湖倉等一些與常常易與數(shù)據(jù)倉庫混淆的相關(guān)術(shù)語的概念,感興趣的朋友可以下載報告查閱。
三、數(shù)據(jù)倉庫現(xiàn)狀及未來趨勢
?本章節(jié)目錄
報告第三章則從發(fā)展層面對數(shù)據(jù)倉庫的現(xiàn)狀、發(fā)展趨勢進(jìn)行了分析。目前中國數(shù)據(jù)倉庫市場仍然存在廠商發(fā)展歷史較短、市場規(guī)模較少、上云進(jìn)程較美國相對滯后等問題。但中國企業(yè)的數(shù)字化場景更加豐富,數(shù)字化的需求也更加迫切。整體來看,中國數(shù)據(jù)倉庫市場的發(fā)展?jié)摿κ志薮?,在未來較長時間內(nèi)將經(jīng)歷快速增長。IDC預(yù)測,到2027年,中國數(shù)據(jù)倉庫軟件市場規(guī)模將達(dá)到27.3億美元,2022-2027的5年市場年復(fù)合增長率(CAGR)為25.7%。
面對新技術(shù)的層出不窮,數(shù)據(jù)倉庫未來會朝著實時分析、云原生Serverless、湖倉一體、HTAP、數(shù)智融合以及流式數(shù)倉等方向發(fā)展,報告對這六類發(fā)展趨勢均進(jìn)行了具體解讀,此處因篇幅所限并未作詳盡截圖展示,大家可下載報告查閱。
最后,報告整理發(fā)布了【全球數(shù)據(jù)倉庫產(chǎn)業(yè)圖譜】,以開源與商業(yè)、中國與國外兩個維度對全球數(shù)倉產(chǎn)品進(jìn)行區(qū)分,望幫助大家深入掌握數(shù)倉產(chǎn)業(yè)發(fā)展,下載報告可查看高清版。
四、數(shù)據(jù)庫產(chǎn)品典型案例分析
報告最后一章選取了國內(nèi)外較為典型的數(shù)據(jù)倉庫產(chǎn)品作為案例,介紹其核心架構(gòu)、功能特性與應(yīng)用實踐等。
其中國外產(chǎn)品包含彈性數(shù)據(jù)倉庫?Snowflake,具備完整的SQL支持和半結(jié)構(gòu)化和schema-less數(shù)據(jù)模式支持,是一種多租戶、事務(wù)性、安全、高度可擴展的彈性系統(tǒng);數(shù)據(jù)倉庫市場的奠基者?Teradata,主要適用于構(gòu)建大規(guī)模數(shù)據(jù)倉庫應(yīng)用程序,其已于2023年正式宣布將逐步結(jié)束在中國的直接運營;谷歌的完全托管的企業(yè)數(shù)據(jù)倉庫?BigQuery?可幫助用戶通過機器學(xué)習(xí)、地理空間分析和商業(yè)智能等內(nèi)置功能來管理和分析數(shù)據(jù),利用云數(shù)據(jù)倉庫助力數(shù)據(jù)驅(qū)動型創(chuàng)新。
國內(nèi)產(chǎn)品包含面向?qū)崟r分析的現(xiàn)代化數(shù)據(jù)倉庫?Apache Doris,是一款基于 MPP 架構(gòu)的高性能、實時的分析型數(shù)據(jù)庫,不僅可以支持高并發(fā)的點查詢場景,也能支持高吞吐的復(fù)雜分析場景;分布式邏輯數(shù)據(jù)倉庫?GBase 8a,其主要市場是商業(yè)分析和商業(yè)智能市場,可應(yīng)用于政府、黨委、安全敏感部門、國防、統(tǒng)計等擁有海量業(yè)務(wù)數(shù)據(jù)的行業(yè);華為云企業(yè)級云分布式數(shù)據(jù)倉庫服務(wù)?GaussDB(DWS)?是一種基于云基礎(chǔ)架構(gòu)和平臺的在線數(shù)據(jù)處理數(shù)據(jù)庫,提供即開即用、可擴展且完全托管的服務(wù);最后介紹了星環(huán)研發(fā)的助力企業(yè)構(gòu)建一站式實時數(shù)倉?ArgoDB?以及阿里云研發(fā)的一站式實時數(shù)據(jù)倉庫引擎?Hologres。此處僅展示本章節(jié)中部分內(nèi)容,大家可以下載報告獲取更多內(nèi)容。
本文僅對8月《中國數(shù)據(jù)庫行業(yè)分析報告》的部分內(nèi)容進(jìn)行了摘錄、整理,更多完整、詳細(xì)內(nèi)容大家可以下載報告全文了解,也歡迎各位數(shù)據(jù)行業(yè)同道交流、討論、建言獻(xiàn)策,我們一同見證、共同助力中國數(shù)據(jù)庫產(chǎn)業(yè)的發(fā)展壯大!
報告全文下載地址:https://www.modb.pro/doc/116039文章來源:http://www.zghlxwxcb.cn/news/detail-690014.html
往期報告下載
- 2022年4月-2023年8月中國數(shù)據(jù)庫行業(yè)分析報告合輯
- 2022年中國數(shù)據(jù)庫行業(yè)年度分析報告
更多精彩內(nèi)容盡在墨天輪數(shù)據(jù)社區(qū),圍繞數(shù)據(jù)人的學(xué)習(xí)成長提供一站式的全面服務(wù),持續(xù)促進(jìn)數(shù)據(jù)領(lǐng)域的知識傳播和技術(shù)創(chuàng)新。添加社區(qū)墨天輪小助手(VX:modb666)可獲取更多技術(shù)干貨。文章來源地址http://www.zghlxwxcb.cn/news/detail-690014.html
到了這里,關(guān)于8月《中國數(shù)據(jù)庫行業(yè)分析報告》已發(fā)布,聚焦數(shù)據(jù)倉庫、首發(fā)【全球數(shù)據(jù)倉庫產(chǎn)業(yè)圖譜】的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!