国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

這篇具有很好參考價(jià)值的文章主要介紹了微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

沒(méi)有足夠的特征數(shù)據(jù),安全策略將是"無(wú)根之木,無(wú)源之水"。微信安全數(shù)據(jù)倉(cāng)庫(kù)應(yīng)運(yùn)而生,成為整個(gè)安全業(yè)務(wù)的特征數(shù)據(jù)存儲(chǔ)中心,每天服務(wù)了萬(wàn)億級(jí)的特征數(shù)據(jù)讀寫(xiě)請(qǐng)求,為整個(gè)微信安全策略提供了可靠的數(shù)據(jù)支撐,是微信安全基石之所在。
然而,微信安全數(shù)據(jù)倉(cāng)庫(kù)不僅僅是一個(gè)存儲(chǔ)中心,更是一個(gè)特征管理和數(shù)據(jù)質(zhì)量管理的中心。
在演進(jìn)過(guò)程中,數(shù)據(jù)倉(cāng)庫(kù)一直致力于提升特征管理能力和數(shù)據(jù)質(zhì)量保障,實(shí)現(xiàn)了特征的管理、共享、分析和數(shù)據(jù)質(zhì)量檢測(cè)等功能。
本文將介紹安全數(shù)據(jù)倉(cāng)庫(kù)的起源、演進(jìn)、當(dāng)前的架構(gòu)設(shè)計(jì)和數(shù)據(jù)質(zhì)量保證系統(tǒng)的實(shí)現(xiàn)。

業(yè)務(wù)背景

安全策略開(kāi)發(fā)流程

安全業(yè)務(wù)的核心邏輯在安全策略中實(shí)現(xiàn)。整個(gè)的策略開(kāi)發(fā)流程包括特征數(shù)據(jù)的收集,安全策略的編寫(xiě)實(shí)現(xiàn),和策略的反饋評(píng)估。其中特征數(shù)據(jù)的收集是必不可少的環(huán)節(jié),數(shù)據(jù)的質(zhì)量將直接影響安全策略的效果。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

特征數(shù)據(jù)收集主要包括:數(shù)據(jù)接入、特征的計(jì)算、特征的存儲(chǔ)。

在數(shù)據(jù)倉(cāng)庫(kù)還未建立時(shí),業(yè)務(wù)同學(xué)通過(guò)消費(fèi)離線存儲(chǔ)mmdata和tdw接入數(shù)據(jù),通過(guò)Flink流式計(jì)算或者自定義模塊對(duì)數(shù)據(jù)進(jìn)行加工,計(jì)算出需要的特征,最終存儲(chǔ)到自行維護(hù)的KV,然后在安全策略平臺(tái)上編寫(xiě)安全策略,讀取KV中的數(shù)據(jù), 實(shí)現(xiàn)需要的安全邏輯。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
傳統(tǒng)特征數(shù)據(jù)收集流程

為什么需要數(shù)據(jù)倉(cāng)庫(kù)

前面提到在還未建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),業(yè)務(wù)同學(xué)都按照自己的方式去存儲(chǔ)計(jì)算出的特征,大多通過(guò)自行申請(qǐng)部署KV來(lái)存儲(chǔ),如A同學(xué)把部署一套KV集群,存儲(chǔ)特征到KV表中,B同學(xué)把特征存儲(chǔ)到同KV集群的不同表中,C同學(xué)又額外申請(qǐng)了另外一套KV集群存儲(chǔ)。如下圖中的架構(gòu):

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
傳統(tǒng)安全后臺(tái): 各業(yè)務(wù)特征分散存儲(chǔ)

這種特征的分散存儲(chǔ),導(dǎo)致業(yè)務(wù)同學(xué)只了解自己熟悉的特征,難以交流和共享,特征缺乏統(tǒng)一的管理,數(shù)據(jù)質(zhì)量難以保證,不同的存儲(chǔ)方式,也導(dǎo)致特征訪問(wèn)接口的混亂,業(yè)務(wù)系統(tǒng)的可靠性也難以保證。

針對(duì)上述的問(wèn)題,我們希望把所有業(yè)務(wù)的特征,按統(tǒng)一的規(guī)范,建立統(tǒng)一的存儲(chǔ),方便特征的共享、管理和維護(hù)、并建立數(shù)據(jù)質(zhì)量保障體系, 為策略提供可靠的數(shù)據(jù)。所以我們需要開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
問(wèn)題和目標(biāo)

安全業(yè)務(wù)后臺(tái)架構(gòu)

當(dāng)前我們已經(jīng)把所有的安全策略統(tǒng)一到安全策略平臺(tái)進(jìn)行開(kāi)發(fā)和管理,特征數(shù)據(jù)的接入和計(jì)算統(tǒng)一到了Flink實(shí)時(shí)計(jì)算平臺(tái)特征平臺(tái)。

數(shù)據(jù)倉(cāng)庫(kù)作為承上啟下的部分,對(duì)上為在安全策略平臺(tái)上的安全策略提供了數(shù)據(jù)讀寫(xiě),對(duì)下為實(shí)時(shí)計(jì)算平臺(tái)特征平臺(tái)計(jì)算輸出的特征提供了存儲(chǔ),是整個(gè)業(yè)務(wù)體系中不可或缺的部分。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
安全業(yè)務(wù)后臺(tái)架構(gòu)

數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)演進(jìn)

存儲(chǔ)選型

安全業(yè)務(wù)特征數(shù)據(jù)主要有2種類型:

  • 離線特征:用來(lái)滿足離線計(jì)算數(shù)據(jù)導(dǎo)入線上實(shí)時(shí)使用的需求,通常特征離線計(jì)算,定期的批量后臺(tái)上線,提供在線讀,但不支持實(shí)時(shí)寫(xiě)入。
  • 實(shí)時(shí)特征:用來(lái)滿足實(shí)時(shí)的在線讀寫(xiě)需求

微信內(nèi)部有多種非常成熟穩(wěn)定的自研KV:實(shí)時(shí)讀寫(xiě)KV(簡(jiǎn)稱實(shí)時(shí)KV),?離線寫(xiě)實(shí)時(shí)讀KV(簡(jiǎn)稱離線KV), ***KV等等, 這些KV已經(jīng)在多個(gè)業(yè)務(wù)被驗(yàn)證,有非常好的性能和可靠性,有團(tuán)隊(duì)做長(zhǎng)期的維護(hù),為此數(shù)據(jù)倉(cāng)庫(kù)的底層存儲(chǔ)采用了微信自研的KV。其主要特點(diǎn)如下:

存儲(chǔ)KV 特點(diǎn) 是否選用
離線寫(xiě)實(shí)時(shí)讀KV 非常適用大量key的定時(shí)批量更新,在線只讀,具有版本管理功能,支持版本歷史版本回退,具有非常優(yōu)秀的讀性能。
實(shí)時(shí)讀寫(xiě)KV 強(qiáng)一致性的key-value服務(wù),存在類MySQL的表概念,提供了Select Insert Update Delete接口,在單表操作保證ACID,支持過(guò)期淘汰TTL。
***KV 提供強(qiáng)一致性的key-value讀寫(xiě)服務(wù),類似STL中的容器,不支持TTL, 不提供新集群,不建議使用。
  • 離線KV適合離線特征要求的場(chǎng)景,擁有非常好的讀性能,并且提供了版本管理功能,在處理有問(wèn)題數(shù)據(jù)時(shí)可以非常方便的可以回退版本,采用這種KV存儲(chǔ)時(shí),value一般是protobuf對(duì)象,新增特征時(shí)可以在pb中增加字段。
  • 實(shí)時(shí)KV適合實(shí)時(shí)特征的場(chǎng)景,在線實(shí)時(shí)讀寫(xiě)性能優(yōu)秀,而且支持?jǐn)?shù)據(jù)過(guò)期淘汰,該KV提供了類MySQL表的概念,KV表定義類似于一個(gè)MySQL表,而每一個(gè)安全業(yè)務(wù)特征剛好可以用表的一個(gè)字段表示。

架構(gòu)設(shè)計(jì)和演進(jìn)

統(tǒng)一存儲(chǔ)統(tǒng)一接口

數(shù)據(jù)倉(cāng)庫(kù)第一個(gè)版本,針對(duì)特征存儲(chǔ)分散訪問(wèn)接口混亂問(wèn)題,首先部署了公共的實(shí)時(shí)KV/離線KV集群,并實(shí)現(xiàn)了一個(gè)接入層。新增特征和歷史特征放到公共的KV存儲(chǔ)集群,并且在接入層屏蔽了底層KV的細(xì)節(jié),提供了統(tǒng)一的讀寫(xiě)特征的接口。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)1.0

接入層支持任意多個(gè)KV集群,支持多個(gè)表,為屏蔽KV的細(xì)節(jié),接入層為每個(gè)特征分配唯一的標(biāo)識(shí)<sceneid, columnid>,讀寫(xiě)特征數(shù)據(jù)使用唯一標(biāo)識(shí)進(jìn)行,不需要關(guān)注KV類型和KV表ID,方便業(yè)務(wù)的接入使用。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
統(tǒng)一接口

接入層還實(shí)現(xiàn)配置管理、參數(shù)校驗(yàn)、模塊校驗(yàn)、權(quán)限校驗(yàn)、流水上報(bào)、PV統(tǒng)計(jì)等功能。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

讀寫(xiě)分離和多IDC同步

讀寫(xiě)分離:數(shù)據(jù)倉(cāng)庫(kù)的讀請(qǐng)求量遠(yuǎn)遠(yuǎn)多于實(shí)時(shí)寫(xiě)入量,為了提高性能,減少讀寫(xiě)之間的相互影響,接入層做了讀寫(xiě)分離,將讀和寫(xiě)接口拆分到兩個(gè)模塊。

數(shù)據(jù)多IDC同步:數(shù)據(jù)倉(cāng)庫(kù)和業(yè)務(wù)都采用的是多IDC部署,為了不降低查詢性能,不希望業(yè)務(wù)跨IDC訪問(wèn)存儲(chǔ),所以底層的KV也是多IDC部署。這里就帶來(lái)一個(gè)問(wèn)題,特征數(shù)據(jù)如何在多IDC的KV之間進(jìn)行同步? 例如業(yè)務(wù)在上海寫(xiě)入一個(gè)特征,希望在深圳也能讀到這個(gè)特征。這里按特征類型進(jìn)行分類處理:

  • 離線特征數(shù)據(jù)同步:離線特征數(shù)據(jù)上線流程是通過(guò)離線計(jì)算在文件系統(tǒng)中生成一個(gè)文件,然后將文件導(dǎo)入到離線KV, 而離線KV支持多個(gè)IDC共享同一份數(shù)據(jù),數(shù)據(jù)文件只需要生成一份,所有IDC的離線KV拉取同一個(gè)文件,新數(shù)據(jù)最終能同步到所有IDC上。
  • 實(shí)時(shí)特征數(shù)據(jù)同步:實(shí)時(shí)特征的同步采用微信自研的分布式隊(duì)列組件,該組件提供了高可靠、高可用、高吞吐、低延時(shí)的數(shù)據(jù)消息隊(duì)列服務(wù)。數(shù)據(jù)倉(cāng)庫(kù)寫(xiě)接入模塊在寫(xiě)入數(shù)據(jù)時(shí),同時(shí)將數(shù)據(jù)寫(xiě)一份到分布式隊(duì)列,使用隊(duì)列做跨IDC的數(shù)據(jù)同步,在其他IDC啟動(dòng)進(jìn)程消費(fèi)隊(duì)列中的數(shù)據(jù),寫(xiě)入到本IDC的實(shí)時(shí)KV,實(shí)現(xiàn)實(shí)時(shí)特征數(shù)據(jù)的同步。
微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)2.0
異步寫(xiě)和替代分布式隊(duì)列

異步寫(xiě)入:前一個(gè)版本中實(shí)時(shí)特征是同步寫(xiě)入,影響業(yè)務(wù)的性能,業(yè)務(wù)希望是異步寫(xiě)入。

替代分布式隊(duì)列:前一個(gè)版本中分布式隊(duì)列采用的是公共的集群,眾多業(yè)務(wù)使用,出現(xiàn)過(guò)數(shù)據(jù)倉(cāng)庫(kù)受干擾影響特征數(shù)據(jù)同步。

為此在數(shù)據(jù)倉(cāng)庫(kù)中新增一個(gè)異步消息隊(duì)列模塊寫(xiě)MQ,用于異步寫(xiě)入。和分布式隊(duì)列相比MQ更輕量,而且MQ我們可以自行維護(hù), 更可控,所以新架構(gòu)中通過(guò)MQ實(shí)現(xiàn)實(shí)時(shí)特征的多IDC數(shù)據(jù)的同步,替代了分布式隊(duì)列,保證數(shù)據(jù)同步不受其他業(yè)務(wù)影響。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)3.0
運(yùn)營(yíng)系統(tǒng)

前面3個(gè)版本解決了特征存儲(chǔ)分散、讀寫(xiě)接口不統(tǒng)一、數(shù)據(jù)同步、讀寫(xiě)性能問(wèn)題,但是特征的上線依然采用的是配置發(fā)布上線的方式,效率依然低效,更重要的是特征缺乏統(tǒng)一的管理,共享困難,難以滿足業(yè)務(wù)的需求,業(yè)務(wù)常常也有各種疑問(wèn):

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
業(yè)務(wù)的疑問(wèn)

為此數(shù)據(jù)倉(cāng)庫(kù)新增運(yùn)營(yíng)系統(tǒng)模塊,實(shí)現(xiàn)了特征申請(qǐng)、特征上線、特征管理&分析、特征值查詢/修改、特征數(shù)據(jù)質(zhì)量管理等功能

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)4.0
  • 特征申請(qǐng):用戶不再需要手動(dòng)的修改配置文件來(lái)新增特征,可直接通過(guò)WEB頁(yè)面申請(qǐng),填寫(xiě)必要的特征信息,通過(guò)通用審批系統(tǒng)進(jìn)行審批。
  • 特征上線:用戶不在需要手動(dòng)的發(fā)布配置上線特征,無(wú)論是新增的實(shí)時(shí)特征還是離線特征,審批通過(guò)后將自動(dòng)化的上線,提升體驗(yàn)和效率。
  • 特征管理:特征管理支持對(duì)特征meta信息進(jìn)行查詢和修改,包括特征所屬的業(yè)務(wù)分類(索引)、特征類型、特征負(fù)責(zé)人、給特征打tag等等,業(yè)務(wù)可以方便的查詢需要特征信息,避免重復(fù)的計(jì)算,方便各業(yè)務(wù)共享特征。
微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
特征管理頁(yè)面
  • 特征分析:追蹤特征的原始數(shù)據(jù)來(lái)源、計(jì)算過(guò)程、數(shù)據(jù)流路徑、最終的存儲(chǔ)信息等等, 可以追蹤特征完整生產(chǎn)流程。
微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
特征分析頁(yè)面
  • 特征值查詢&修改:運(yùn)營(yíng)系統(tǒng)支持在WEB頁(yè)面查詢特征值和修改特征值。
微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
特征值查詢頁(yè)面
  • 特征數(shù)據(jù)質(zhì)量管理:保障數(shù)據(jù)質(zhì)量, 下一章節(jié)詳細(xì)講述。

數(shù)據(jù)質(zhì)量保障

數(shù)據(jù)倉(cāng)庫(kù)主要通過(guò)兩個(gè)方面來(lái)保障數(shù)據(jù)質(zhì)量:特征的標(biāo)準(zhǔn)化和數(shù)據(jù)空跑系統(tǒng)。

特征標(biāo)準(zhǔn)化

特征的標(biāo)準(zhǔn)化是保證數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)質(zhì)量的手段之一,標(biāo)準(zhǔn)化是指對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的特征進(jìn)行規(guī)范化處理,使得特征能夠達(dá)到一致性、可重復(fù)性等標(biāo)準(zhǔn),從而提高數(shù)據(jù)的可靠性和準(zhǔn)確性。

對(duì)于新增實(shí)時(shí)/離線特征, 數(shù)據(jù)倉(cāng)庫(kù)制定了的特征規(guī)范文檔,并按規(guī)范文檔的要求,特征申請(qǐng)/管理頁(yè)面必須正確的補(bǔ)充完整特征信息,如特征類型、業(yè)務(wù)分類等等,后臺(tái)對(duì)每個(gè)特征都會(huì)進(jìn)行校驗(yàn),不符合規(guī)范的特征無(wú)法錄入。

另外數(shù)據(jù)倉(cāng)庫(kù)還提供了接入編程指導(dǎo)文檔,并給出完整的C++編程實(shí)例,致力于提供標(biāo)準(zhǔn)化的編程最佳實(shí)踐。

數(shù)據(jù)空跑系統(tǒng)

離線特征數(shù)據(jù)來(lái)自于業(yè)務(wù)離線計(jì)算在分布式文件系統(tǒng)中生成數(shù)據(jù)文件,然后將文件上線。歷史上曾因?yàn)樯傻臄?shù)據(jù)文件存在錯(cuò)誤,存在錯(cuò)誤的文件數(shù)據(jù)被上線到離線KV,導(dǎo)致策略出現(xiàn)故障。為了保障離線特征數(shù)據(jù)的質(zhì)量,數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)了一套空跑系統(tǒng),在上線前對(duì)數(shù)據(jù)文件進(jìn)行檢查,避免存在問(wèn)題的數(shù)據(jù)上線到現(xiàn)網(wǎng)。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)空跑架構(gòu)

數(shù)據(jù)空跑架構(gòu)如上圖,離線特征數(shù)據(jù)的上線也納入到了運(yùn)營(yíng)系統(tǒng)的管理中,整個(gè)的空跑流程如下:

  1. 業(yè)務(wù)發(fā)起數(shù)據(jù)上線,運(yùn)營(yíng)系統(tǒng)將數(shù)據(jù)上線到備用的離線KV表,也就是用于空跑的KV表。

  2. 打開(kāi)空跑開(kāi)關(guān),按一定的比率采樣現(xiàn)網(wǎng)的讀請(qǐng)求,旁路到新增的讀MQ模塊,該模塊讀空跑表的數(shù)據(jù),和當(dāng)前現(xiàn)網(wǎng)做對(duì)比, 分析差異率。這里采用的動(dòng)態(tài)采樣, 如果表的PV高則采樣率低,PV低則采樣率高或者100%采樣,避免請(qǐng)求量小的表無(wú)法進(jìn)行空跑,而請(qǐng)求量大的表空跑流量太高又消耗太多資源。

  3. 計(jì)算和分析差異率,如果差異率超過(guò)了閾值,就自動(dòng)的攔截?cái)?shù)據(jù)上線,如果閾值檢查通過(guò),就繼續(xù)后續(xù)的檢查流程,最終自動(dòng)上線數(shù)據(jù)文件到現(xiàn)網(wǎng)離線KV。

差異率示例會(huì)如下圖:詳細(xì)的展示了具體的差異細(xì)節(jié):

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
空跑結(jié)果差異率和差異詳情

完整的數(shù)據(jù)上線流程如下圖,空跑差異檢測(cè)通過(guò)后,需要檢查數(shù)據(jù)文件完整性,防止文件被修改或者覆蓋,最后數(shù)據(jù)再上線到現(xiàn)網(wǎng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),通知業(yè)務(wù)數(shù)據(jù)上線成功。如果中間任何一個(gè)步驟出錯(cuò)將告警給業(yè)務(wù)負(fù)責(zé)人,提醒人工介入處理。

微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)
離線特征數(shù)據(jù)上線完整流程

總結(jié)

數(shù)據(jù)倉(cāng)庫(kù)將分散的特征全部集中統(tǒng)一管理,提供統(tǒng)一的訪問(wèn)接口,標(biāo)準(zhǔn)化每個(gè)一個(gè)特征,建立了統(tǒng)一的規(guī)范,并且在此基礎(chǔ)保障了數(shù)據(jù)的質(zhì)量,夯實(shí)了整個(gè)安全業(yè)務(wù)的基礎(chǔ),助力一站式的數(shù)據(jù)-策略開(kāi)發(fā),極大的提升了安全對(duì)抗的效率,實(shí)現(xiàn)了數(shù)據(jù)價(jià)值的最大化。

?

作者:remy文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-604152.html

到了這里,關(guān)于微信萬(wàn)億數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 數(shù)據(jù)倉(cāng)庫(kù)系列:StarRocks 下一代高性能分析數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)、數(shù)據(jù)存儲(chǔ)及表設(shè)計(jì)

    數(shù)據(jù)倉(cāng)庫(kù)系列:StarRocks 下一代高性能分析數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)、數(shù)據(jù)存儲(chǔ)及表設(shè)計(jì)

    本文是學(xué)習(xí)StarRocks的讀書(shū)筆記,讓你快速理解下一代高性能分析數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)、數(shù)據(jù)存儲(chǔ)及表設(shè)計(jì)。 StarRocks的架構(gòu)相對(duì)簡(jiǎn)單。 整個(gè)系統(tǒng)只包含兩種類型的組件,前端(FE)和后端(BE),StarRocks不依賴任何外部組件,簡(jiǎn)化了部署和維護(hù)。 FE和BE可以在不停機(jī)的情況下橫向擴(kuò)展。

    2024年02月16日
    瀏覽(29)
  • 223頁(yè)10萬(wàn)字大數(shù)據(jù)中心總體架構(gòu)及數(shù)據(jù)倉(cāng)庫(kù)頂層設(shè)計(jì)解決方案WORD

    提供智慧城市、智能制造、數(shù)據(jù)治理、信息化等領(lǐng)域的系統(tǒng)框架、總體架構(gòu)、數(shù)據(jù)流架構(gòu)資料,包括數(shù)據(jù)治理、信息化、精益生產(chǎn)改善知識(shí)。 本文文檔69頁(yè),因篇幅限制,以下僅展示部分資料,需要完整資料,點(diǎn)擊右上角紅色按鈕關(guān)注+私信,喜歡文章,歡迎轉(zhuǎn)發(fā)評(píng)論點(diǎn)贊。本

    2024年01月18日
    瀏覽(87)
  • 大廠案例 - 騰訊萬(wàn)億級(jí) Elasticsearch 架構(gòu)實(shí)踐

    大廠案例 - 騰訊萬(wàn)億級(jí) Elasticsearch 架構(gòu)實(shí)踐

    Elasticsearch(ES)作為首選的開(kāi)源分布式搜索分析引擎,通過(guò)一套系統(tǒng)輕松滿足用戶的日志實(shí)時(shí)分析、全文檢索、時(shí)序數(shù)據(jù)分析等多種需求,大幅降低大數(shù)據(jù)時(shí)代發(fā)掘數(shù)據(jù)價(jià)值的成本。 騰訊在公司內(nèi)部豐富的場(chǎng)景中大規(guī)模使用 ES,同時(shí)聯(lián)合 Elastic 公司在騰訊云上提供內(nèi)核增強(qiáng)版

    2024年02月14日
    瀏覽(22)
  • 詳解數(shù)據(jù)倉(cāng)庫(kù)之拉鏈表(原理、設(shè)計(jì)以及在Hive中的實(shí)現(xiàn))

    詳解數(shù)據(jù)倉(cāng)庫(kù)之拉鏈表(原理、設(shè)計(jì)以及在Hive中的實(shí)現(xiàn))

    最近發(fā)現(xiàn)一本好書(shū),讀完感覺(jué)講的非常好,首先安利給大家,國(guó)內(nèi)第一本系統(tǒng)講解數(shù)據(jù)血緣的書(shū)!點(diǎn)贊!近幾天也會(huì)安排朋友圈點(diǎn)贊贈(zèng)書(shū)活動(dòng)(???_??)? 0x00 前言 本文將會(huì)談一談在數(shù)據(jù)倉(cāng)庫(kù)中拉鏈表相關(guān)的內(nèi)容,包括它的原理、設(shè)計(jì)、以及在我們大數(shù)據(jù)場(chǎng)景下的實(shí)現(xiàn)方式

    2024年02月05日
    瀏覽(31)
  • 漫談數(shù)據(jù)倉(cāng)庫(kù)之拉鏈表(原理、設(shè)計(jì)以及在Hive中的實(shí)現(xiàn)

    漫談數(shù)據(jù)倉(cāng)庫(kù)之拉鏈表(原理、設(shè)計(jì)以及在Hive中的實(shí)現(xiàn)

    本文將會(huì)談一談在數(shù)據(jù)倉(cāng)庫(kù)中拉鏈表相關(guān)的內(nèi)容,包括它的原理、設(shè)計(jì)、以及在我們大數(shù)據(jù)場(chǎng)景下的實(shí)現(xiàn)方式。 全文由下面幾個(gè)部分組成: 先分享一下拉鏈表的用途、什么是拉鏈表。 通過(guò)一些小的使用場(chǎng)景來(lái)對(duì)拉鏈表做近一步的闡釋,以及拉鏈表和常用的切片表的區(qū)別。

    2024年04月12日
    瀏覽(25)
  • JAVA畢業(yè)設(shè)計(jì)100—基于Java+Springboot+Vue的WMS倉(cāng)庫(kù)管理系統(tǒng)+移動(dòng)端微信小程序(源碼+數(shù)據(jù)庫(kù)+部署視頻)

    JAVA畢業(yè)設(shè)計(jì)100—基于Java+Springboot+Vue的WMS倉(cāng)庫(kù)管理系統(tǒng)+移動(dòng)端微信小程序(源碼+數(shù)據(jù)庫(kù)+部署視頻)

    本系統(tǒng)前后端分離帶小程序 本系統(tǒng)分為管理員、用戶角色(角色權(quán)限可自行分配) 功能列表: 1、 數(shù)據(jù)管理:物料數(shù)據(jù)管理、物料Bom管理、物料組管理、物料分類管理、供應(yīng)商管理、倉(cāng)庫(kù)管理、貨位管理、車(chē)間管理 2、 采購(gòu)管理:物料標(biāo)簽管理、入庫(kù)單管理、入庫(kù)退貨管理 3、

    2024年04月10日
    瀏覽(25)
  • 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集成架構(gòu):數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)倉(cāng)庫(kù)規(guī)范與標(biāo)準(zhǔn)的制定與應(yīng)用

    數(shù)據(jù)倉(cāng)庫(kù)是一種用于存儲(chǔ)和管理大量結(jié)構(gòu)化數(shù)據(jù)的系統(tǒng),它的主要目的是為了支持?jǐn)?shù)據(jù)分析和報(bào)告。數(shù)據(jù)倉(cāng)庫(kù)通常包括一個(gè)或多個(gè)數(shù)據(jù)源,這些數(shù)據(jù)源可以是來(lái)自不同的系統(tǒng)或來(lái)自不同的數(shù)據(jù)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)和實(shí)現(xiàn)需要考慮到數(shù)據(jù)的質(zhì)量、一致性、可用性和安全性等方面

    2024年04月09日
    瀏覽(67)
  • 大數(shù)據(jù)架構(gòu)之關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)——解讀大數(shù)據(jù)架構(gòu)(二)

    大數(shù)據(jù)架構(gòu)之關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)——解讀大數(shù)據(jù)架構(gòu)(二)

    本文對(duì)關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)(RDW)進(jìn)行了簡(jiǎn)要的介紹說(shuō)明,包括什么是關(guān)系型數(shù)據(jù)倉(cāng)庫(kù),以及為什么要使用關(guān)系型數(shù)據(jù)倉(cāng)庫(kù),其優(yōu)缺點(diǎn)有哪些,如何增量更新數(shù)據(jù)等,最后還討論了關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)是否會(huì)消失的問(wèn)題,以及哪些人會(huì)繼續(xù)使用關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)。 關(guān)系型數(shù)倉(cāng)(RDW 是集

    2024年04月13日
    瀏覽(24)
  • 基于Kylin的數(shù)據(jù)統(tǒng)計(jì)分析平臺(tái)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

    基于Kylin的數(shù)據(jù)統(tǒng)計(jì)分析平臺(tái)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)

    目錄 1 前言 2 關(guān)鍵模塊 2.1 數(shù)據(jù)倉(cāng)庫(kù)的搭建 2.2 ETL 2.3 Kylin數(shù)據(jù)分析系統(tǒng) 2.4 數(shù)據(jù)可視化系統(tǒng) 2.5 報(bào)表模塊 3 最終成果 4 遇到問(wèn)題 ? ? ????????這是在公司云平臺(tái)部門(mén)做的一個(gè)項(xiàng)目,總體包括云上數(shù)據(jù)統(tǒng)計(jì)平臺(tái)的架構(gòu)設(shè)計(jì)和組件開(kāi)發(fā),在此只做技術(shù)分享,不涉及其他用途。該

    2024年02月07日
    瀏覽(21)
  • 數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)詳解

    數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)詳解

    數(shù)據(jù)倉(cāng)庫(kù) ( Data Warehouse )是一個(gè)為數(shù)據(jù)分析而設(shè)計(jì)的企業(yè)級(jí)數(shù)據(jù)管理系統(tǒng)。數(shù)據(jù)倉(cāng)庫(kù)可集中、整合多個(gè)信息源的大量數(shù)據(jù),借助數(shù)據(jù)倉(cāng)庫(kù)的分析能力, 為企業(yè)指定決策,幫助企業(yè)改進(jìn)業(yè)務(wù)流程、提高產(chǎn)品數(shù)量 一般數(shù)倉(cāng)分為離線數(shù)倉(cāng)(spark)和實(shí)時(shí)數(shù)倉(cāng)(flink) 數(shù)據(jù)采集 數(shù)據(jù)

    2024年02月16日
    瀏覽(16)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包