国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)倉建模方法論

這篇具有很好參考價值的文章主要介紹了數(shù)倉建模方法論。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

1.數(shù)倉建模的理由

數(shù)據(jù)建模的主要目的是降低成本,提高數(shù)據(jù)的利用效率。尤其是大數(shù)據(jù)時代的到來,數(shù)據(jù)的多樣化,巨量,更需要有效的有針對性數(shù)據(jù)建模方法。

大數(shù)據(jù)的數(shù)倉建模正是通過建模的方法,更好的組織、存儲數(shù)據(jù),以便在性能、成本、效率和數(shù)據(jù)質(zhì)量之間找到最佳平衡點,一般我們會從以下面四點考慮:

  • 性能:能夠快速查詢所需的數(shù)據(jù),減少數(shù)據(jù)I/O的吞吐。
  • 成本:減少不必要的數(shù)據(jù)冗余,實現(xiàn)計算結(jié)果的復(fù)用,降低大數(shù)據(jù)系統(tǒng)中的存儲成本和計算成本。
  • 效率:改善用使用數(shù)據(jù)的體驗,提高使用效率。
  • 質(zhì)量:改善數(shù)據(jù)統(tǒng)計口徑的不一致性,減少數(shù)據(jù)計算錯誤的可能性,提供高質(zhì)量的、一致的數(shù)據(jù)訪問平臺。

因此,毋庸置疑,大數(shù)據(jù)系統(tǒng)、數(shù)據(jù)平臺都需要數(shù)據(jù)模型方法來幫助更好的組織和存儲數(shù)據(jù),數(shù)據(jù)建模的工作,也正是圍繞上述四個指標(biāo)取得最佳的平衡而努力。

2.數(shù)據(jù)建模的方法

數(shù)據(jù)倉庫本質(zhì)是從數(shù)據(jù)庫衍生出來的,所以數(shù)據(jù)倉庫的建模也是不斷衍生發(fā)展的。

從最早的借鑒關(guān)系型數(shù)據(jù)庫理論的范式建模,到逐漸提出維度建模等等,越往后建模的要求越高,越需滿足3NF4NF等。但是對于數(shù)據(jù)倉庫來說,目前主流還是維度建模,會夾雜著范式建模。

數(shù)據(jù)倉庫建模方法論可分為:E-R模型、維度模型、Data Vault模型、Anchor模型。

2.1 E-R模型

1). 簡介

ER模型,全稱為實體聯(lián)系模型、實體關(guān)系模型或?qū)嶓w聯(lián)系模式圖(ERD)(英語:Entity-relationship model)由美籍華裔計算機科學(xué)家陳品山發(fā)明,是概念數(shù)據(jù)模型的高層描述所使用的數(shù)據(jù)模型或模式圖。

ER模型常用于OLTP數(shù)據(jù)庫建模,應(yīng)用到構(gòu)建數(shù)倉時更偏重數(shù)據(jù)整合,站在企業(yè)整體考慮,將各個系統(tǒng)的數(shù)據(jù)按相似性一致性、合并處理,為數(shù)據(jù)分析、決策服務(wù),但并不便于直接用來支持分析。缺陷:需要全面梳理企業(yè)所有的業(yè)務(wù)和數(shù)據(jù)流,周期長,人員要求高。

ER模型分為實體、屬性、關(guān)系三個核心部分。實體是長方形體現(xiàn),而屬性則是橢圓形,關(guān)系為菱形。

ER模型的實體(entity)即數(shù)據(jù)模型中的數(shù)據(jù)對象,例如人、學(xué)生、音樂都可以作為一個數(shù)據(jù)對象,用長方體來表示,每個實體都有自己的實體成員(entity member)或者說實體對象(entity instance),例如學(xué)生實體里包括張三、李四等,實體成員(entity member/實體實例(entity instance?不需要出現(xiàn)在ER圖中。

ER模型的屬性(attribute)即數(shù)據(jù)對象所具有的屬性,例如學(xué)生具有姓名、學(xué)號、年級等屬性,用橢圓形表示,屬性分為唯一屬性(?unique attribute)和非唯一屬性,唯一屬性指的是唯一可用來標(biāo)識該實體實例或者成員的屬性,用下劃線表示,一般來講實體都至少有一個唯一屬性。

ER模型的關(guān)系(relationship)用來表現(xiàn)數(shù)據(jù)對象與數(shù)據(jù)對象之間的聯(lián)系,例如學(xué)生的實體和成績表的實體之間有一定的聯(lián)系,每個學(xué)生都有自己的成績表,這就是一種關(guān)系,關(guān)系用菱形來表示。

ER模型中關(guān)聯(lián)關(guān)系有三種:

111:1?11關(guān)系是指對于實體集A與實體集B,A中的每一個實體至多與B中一個實體有關(guān)系;反之,在實體集B中的每個實體至多與實體集A中一個實體有關(guān)系。

1對多1:N?1對多關(guān)系是指實體集A與實體集B中至少有N(N>0)個實體有關(guān)系;并且實體集B中每一個實體至多與實體集A中一個實體有關(guān)系。

多對多M:N?:多對多關(guān)系是指實體集A中的每一個實體與實體集B中至少有M(M>0)個實體有關(guān)系,并且實體集B中的每一個實體與實體集A中的至少NN>0)個實體有關(guān)系。

2). ER實體詳解

ER的實體還可以分為弱實體和復(fù)合實體:

弱實體:一個實體必須依賴于另一個實體存在,那么前者是弱實體,后者是強實體,弱實體必須依賴強實體存在,例如上圖的學(xué)生實體和成績單實體,成績單依賴于學(xué)生實體而存在,因此學(xué)生是強實體,而成績單是弱實體。

弱實體和強實體的聯(lián)系必然只有1:N或者1:1,這是由于弱實體完全依賴于強實體,強實體不存在,那么弱實體就不存在,所以弱實體是完全參與聯(lián)系的,因此弱實體和強實體之間的聯(lián)系也是用的雙線菱形。

復(fù)合實體:復(fù)合實體也稱為聯(lián)合實體或者橋接實體,常常用于實現(xiàn)兩個或者多個實體間的M:N關(guān)系,它由每個關(guān)聯(lián)實體的主體組成,用長方體內(nèi)加一個菱形來表示。

下圖就是一個典型的復(fù)合實體,因為只是舉例,相對粗糙,用戶和商品兩個實體是M:N的關(guān)系,中間又訂單這個實體聯(lián)系,因此訂單這個實體是一個復(fù)合實體,同時如果用戶實體不存在,就沒有訂單實體存在,因此對于用戶實體來說訂單是弱實體,同理商品實體如果不存在,同樣不存在訂單實體,因此對商品實體而言訂單是弱實體

2). ER屬性補充講解:

er圖的屬性還細分為復(fù)合屬性、多值屬性和派生屬性、可選屬性,同時還有用來表示聯(lián)系的屬性,稱為聯(lián)系屬性。

復(fù)合屬性(composite attribute)復(fù)合屬性是指具有多個屬性的組合,例如名字屬性,它可以包含姓氏屬性和名字屬性

復(fù)合屬性也有唯一屬性,例如學(xué)生的所在班級屬性,由于多個年級都有班級,所以單單班級屬性是不唯一的,但是和年級組成的復(fù)合屬性后則可以匹配成唯一屬性。

多值屬性(multivalued attribute):一個實體的某個屬性可以有多個不同的取值,例如一本書的分類屬性,這本書有多個分類,例如科學(xué)、醫(yī)學(xué)等,這個分類就是多值屬性,?用雙線橢圓表示。

派生屬性(derivers attribute):是非永久性存于數(shù)據(jù)庫的屬性。派生屬性的值可以從別的屬性值或其他數(shù)據(jù)(如當(dāng)前日期)派生出來,用虛線橢圓表示,如下圖。

下面的社團人數(shù)就是典型的派生屬性,隨著學(xué)生實例的參加的社團變化,社團人數(shù)屬性也會變化,一般來講派生屬性不存在于數(shù)據(jù)庫中,而是通過相應(yīng)的公式進行計算得到,如果要放到數(shù)據(jù)庫中,那么隔一段時間就要進行更新,否則會出現(xiàn)數(shù)據(jù)錯誤。

可選屬性(optional attribute)并不是所有的屬性都必須有值,有些屬性的可以沒有值,這就是可選屬性,在橢圓的文字后用(O)來表示

關(guān)系屬性:關(guān)系屬于用戶表示多個實體之間關(guān)系所具有的屬性,一般來講M:N的兩個實體的關(guān)系具有關(guān)系屬性,在1:11M的實體關(guān)系中關(guān)系屬性并不必要。

ER實體關(guān)系模型案例

假設(shè)在電商購物系統(tǒng)中,對商品、用戶設(shè)計ER實體關(guān)系模型圖來表示商品信息、用戶購買商品之間的業(yè)務(wù)聯(lián)系,完成數(shù)據(jù)庫邏輯模型設(shè)計。

設(shè)計ER實體關(guān)系模型圖,步驟如下:

1. 抽象出實體

2. 找出實體之間的關(guān)系

3. 找出實體的屬性

4. 畫出E-R關(guān)系圖

轉(zhuǎn)化為傳統(tǒng)數(shù)據(jù)庫表:

所以,ER模型完全可以使用圖數(shù)據(jù)庫代替。

2.2 維度建模

1). 維度建模簡介

維度模型是數(shù)據(jù)倉庫領(lǐng)域大師Ralph Kimall所倡導(dǎo),他的《數(shù)據(jù)倉庫工具箱》,是數(shù)據(jù)倉庫工程領(lǐng)域最流行的數(shù)倉建模經(jīng)典。?維度建模以分析決策的需求出發(fā)構(gòu)建模型,構(gòu)建的數(shù)據(jù)模型為分析需求服務(wù),因此它重點解決用戶如何更快速完成分析需求,同時還有較好的大規(guī)模復(fù)雜查詢的響應(yīng)性能。

維度建模是專門應(yīng)用于分析型數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)集市建模的方法。數(shù)據(jù)集市可以理解為是一種"小型數(shù)據(jù)倉庫"

維度建模的概念是比較少的,下面簡單介紹一下。

2).事實表

發(fā)生在現(xiàn)實世界中的操作型事件,其所產(chǎn)生的可度量數(shù)值,存儲在事實表中。從最低的粒度級別來看,事實表每一行都對應(yīng)于一個度量事件,反之亦然。

事實表表示對分析主題的度量。比如一次購買行為我們就可以理解為是一個事實。

圖中的訂單表就是一個事實表,可以理解他就是在現(xiàn)實中發(fā)生的一次操作型事件,每完成一個訂單,就會在訂單中增加一條記錄。

事實表的特征:表里沒有存放實際的內(nèi)容,他是一堆主鍵的集合,這些ID分別能對應(yīng)到維度表中的一條記錄。事實表包含了與各維度表相關(guān)聯(lián)的外鍵,可與維度表關(guān)聯(lián)。事實表的度量通常是數(shù)值類型(//),且記錄數(shù)會不斷增加,表數(shù)據(jù)規(guī)模迅速增長。

3).維度表

維度表示要對數(shù)據(jù)進行分析時所用的一個量,比如你要分析產(chǎn)品銷售情況,你可以選擇按類別進行分析,或按區(qū)域分析。這區(qū)域,類別就分別就構(gòu)成一個維度。上圖中的用戶表,商家表,時間表這些都屬于維度表。這些表都有一個唯一的主鍵,然后在表中存放了詳細的數(shù)據(jù)信息。

例如:交易金額分析

男性用戶的訂單金額、聯(lián)想商品的訂單金額、第一季度的訂單金額、收集的訂單金額、家里下單的訂單金額。

維度表的特征:每個維度表都包含單一的主鍵列。維度表的主鍵可以作為與之關(guān)聯(lián)的任何事實表的外鍵,當(dāng)然維度表行的描述環(huán)境應(yīng)與事實表行完全對應(yīng)。維度表通常比較寬,是扁平型非規(guī)范表,包含大量的低粒度的文本屬性。

總得來說,在數(shù)據(jù)倉庫中不需要嚴格遵守規(guī)范化設(shè)計原則。因為數(shù)據(jù)倉庫的主導(dǎo)功能就是面向分析的,以查詢?yōu)橹鳎簧婕皵?shù)據(jù)更新操作。

需要強調(diào)的是:

  • 事實表的設(shè)計是以能夠正確記錄歷史信息為準(zhǔn)則。
  • 維度表的設(shè)計是以能夠以適合的角度來聚合主題內(nèi)容為準(zhǔn)則。

4).維度模型

a.星型模型

星型模型(star schema)是最常用的維度建模方式。星型模型是以事實表為中心,所有的維度表直接連接在事實表上,像星星一樣。

星型模型的維度建模是由一個事實表和一組維表組成,且具備以下特點:

  • 維表只和事實表關(guān)聯(lián),維表之間沒有關(guān)聯(lián);
  • 每個維表主鍵為單例,且該主鍵放置在事實表中,作為兩邊連接的外鍵;
  • 以事實表為核心,維度表圍繞核心呈星型分布;

b.雪花模型

雪花模型(snowflake schema)是對星型模型的擴展。雪花模型的維表可以擁有其他維度表,雖然這種模型相比星型更加規(guī)范一些,但是由于這種模型不太容易理解,維護成本比較高,而且性能方面需要關(guān)聯(lián)多層維表,性能也比 星型模型要低。所以一般不是很常用。

c.星座模型

星座模型是星型模型延伸而來,星型模型是基于一張事實表的,而星座模型是基于多張事實表的,而且共享維度信息。前面的兩種維度建模方法都是多維表對應(yīng)于單事實表,但是在很多時候維度空間內(nèi)的事實表不止一個,而一個維表也可能被多個事實表用到。在業(yè)務(wù)發(fā)展的后期,絕大部分維度建模都采樣這種星座模式。

5). 維度變化

你的應(yīng)用必須反映出移植到倉庫中的數(shù)據(jù)源所發(fā)生的數(shù)據(jù)變化。維表中的數(shù)據(jù)特別容易變化。但你怎么維護記錄的歷史變化呢?

  • 第一個也是最簡單的方法是重寫現(xiàn)有的記錄而不跟蹤變動。幸運的是,這個方法被許多維度所接受。例如,如果一個部門名稱從“財務(wù)”變?yōu)椤柏攧?wù)和會計”,你很可能并不需要記錄這種歷史變化。但是,從客戶和學(xué)生的角度看,常常有必要保持跟蹤姓名、婚姻狀態(tài)、教育程度和其它屬性的變化——你的應(yīng)用必要能夠獲得當(dāng)前的以及歷史的數(shù)值。拉鏈表最常用。
  • 管理維度慢慢改變的第二個方法是數(shù)值發(fā)生變化時創(chuàng)建一個新的記錄,并將舊的記錄標(biāo)記為舊記錄。
  • 第三個也是最后的一個方法是維護在維表的同一行中不同列的變化域的歷史數(shù)值。

6). 事實變化。

通常人們認為事實表中的記錄是靜態(tài)的——一旦這條記錄錄入到了倉庫中你的工作就結(jié)束了,是嗎?不幸的是這個回答是它取決于。在某些情況下像在一個數(shù)據(jù)倉庫跟蹤病人的住院情況,所有的記錄通常都是靜態(tài)的。如果你從11日到25日住院,那這條記錄不太可能改變。

但是考慮到零售行業(yè),所有的銷售都不是最終的——我肯定你知道有些人經(jīng)常將它們購買的貨物因為各種原因而退回商店。一些公司管理這種交易為一系列信用和負債來結(jié)算每筆交易。但在其它的情況下你必須更新或刪除事實表記錄,甚至在它們添加到了數(shù)據(jù)倉庫之后。例如,如果一個股票交易記錄不正確,用一個相反的交易來結(jié)算是不能接受的。還有另一個問題要考慮:你可能不希望你的客戶知道你的交易系統(tǒng)中存在的問題。甚至你希望他們只在數(shù)據(jù)被修正后才看到數(shù)據(jù)。

處理方法一:

將數(shù)據(jù)放在暫存區(qū)域直到它經(jīng)過了質(zhì)量檢查,然后將其移植到倉庫中。然而有時甚至是最全面的測試也無法捕獲數(shù)據(jù)源中的所有錯誤,你可能需要通過處理這些包含錯誤數(shù)據(jù)的部分來更新多維數(shù)據(jù)集。這就是為什么有必要保持你的分析服務(wù)部分盡可能的小以便處理可以相對快一些。

處理方法二:

采用一個回寫分區(qū)。采用多維數(shù)據(jù)集回寫,你沒有真的改變關(guān)系數(shù)據(jù)倉庫中的數(shù)據(jù);而是在一個單獨的分區(qū)中添加了一條記錄。當(dāng)用戶查詢一個特殊的測量值組時,分析服務(wù)將只讀分區(qū)的數(shù)據(jù)和回寫分區(qū)的數(shù)據(jù)結(jié)合起來,然后顯示結(jié)果。當(dāng)然,執(zhí)行這樣的查詢計算會額外增加分析服務(wù)器的執(zhí)行時間,并會造成性能下降。

2.3 Data Vault建模

Data Vault是一種由Dan Linstedt提出的數(shù)據(jù)倉庫建模方法,主要應(yīng)用于企業(yè)級數(shù)據(jù)倉庫建模。

不同于三范式數(shù)據(jù)倉庫模型、維度模型,Data Vault模型主要用于存儲來自多個業(yè)務(wù)系統(tǒng)的完整歷史數(shù)據(jù)。它不區(qū)分數(shù)據(jù)在業(yè)務(wù)層面的準(zhǔn)確與否,裝在數(shù)據(jù)也不做驗證和清洗,因此,Data Vault模型可用于跟蹤所有數(shù)據(jù)的來源。

它的每一行數(shù)據(jù)都需要包含來源系統(tǒng)和裝在時間,用于審計和跟蹤數(shù)據(jù)來源系統(tǒng)。

2.3.1?Data Vault模型定義

按照Dan Linstedt的定義,Data Vault模型是面向細節(jié)的、可追蹤歷史的、一組有鏈接關(guān)系的規(guī)范化的表的集合。它綜合了三范式建模和星型模型的優(yōu)點,其設(shè)計理念是滿足企業(yè)對數(shù)據(jù)模型靈活性、可擴展性、一致性和對需求的適應(yīng)性要求,是專門針對企業(yè)級數(shù)據(jù)倉庫需要的一套建模方法。

Data Vault模型只按照業(yè)務(wù)數(shù)據(jù)的原始狀態(tài)存儲數(shù)據(jù),不做任何過濾、清洗、轉(zhuǎn)換,比如:同一個客戶在不同系統(tǒng)有不同地址,Data Vault模型會存儲多個不同版本的客戶地址數(shù)據(jù)。

該模型的主要特點:

  • 與源系統(tǒng)完成獨立。
  • 所有數(shù)據(jù)基于時間戳,即便數(shù)據(jù)質(zhì)量很低,也不能清洗掉數(shù)據(jù)。
  • 可以適應(yīng)源數(shù)據(jù)的各種變化,并可以靈活的實現(xiàn)模型擴展。
  • 數(shù)據(jù)的來源可以完全追蹤,并且數(shù)據(jù)處理作業(yè)可以支持重載。

2.3.2 Data Vault模型體系

Data Vault模型由中心表(hub)、鏈接表(link)、附屬表(satellite)三部分組成,其核心是中心表,用于存儲業(yè)務(wù)主鍵,鏈接表用于存儲業(yè)務(wù)關(guān)系,附屬表用于存儲業(yè)務(wù)描述。

a. 中心表

中心表用于存儲企業(yè)每個業(yè)務(wù)實體的業(yè)務(wù)主鍵,業(yè)務(wù)主鍵需要能夠唯一標(biāo)識一個業(yè)務(wù)實體。按照此定義,中心表與源系統(tǒng)無關(guān),即無論業(yè)務(wù)主鍵是否用于多個業(yè)務(wù)系統(tǒng),其在Data Vault模型中也只有一份數(shù)據(jù)。處于設(shè)計上的考慮,中心表一般由主鍵,業(yè)務(wù)主鍵,裝載時間戳,數(shù)據(jù)來源系統(tǒng)四個字段構(gòu)成,其中主鍵根據(jù)業(yè)務(wù)主鍵唯一分配,一般是與業(yè)務(wù)無關(guān)的序列數(shù)值。

b. link

鏈接表是不同中心表之間的關(guān)系鏈接,鏈接表一般由一組外鍵字段構(gòu)成,表示一種業(yè)務(wù)關(guān)系,比如:交易表、客戶關(guān)聯(lián)賬戶等。鏈接表主要包括主鍵、外鍵1...、外鍵n、裝載時間戳、數(shù)據(jù)來源等字段構(gòu)成,其中主鍵對應(yīng)多個外鍵的唯一組合,一般是與業(yè)務(wù)無關(guān)的序列數(shù)值。

c. satellite

附屬表用于保存中心表和鏈接表的描述屬性,包含了所有歷史變化數(shù)據(jù),附屬表有且僅有一個唯一外鍵關(guān)聯(lián)到中心表或者鏈接表。附屬表主要包括主鍵、外鍵、屬性1?... 、屬性n 、是否失效、失效時間戳、裝載時間戳、數(shù)據(jù)來源系統(tǒng),主鍵用于唯一標(biāo)識附屬表中的一行記錄,一般是與業(yè)務(wù)無關(guān)的序列數(shù)值。

2.3.3 Data Vault 模型設(shè)計

根據(jù)Data Vault模型體系構(gòu)成,Data Vault模型設(shè)計也由此分為三大部分。

a.中心表設(shè)計

1) 明確模型需要覆蓋的業(yè)務(wù)范圍。?

2) 按業(yè)務(wù)范圍劃分若干原子業(yè)務(wù)實體,比如:客戶、產(chǎn)品、投資品種等。

3) 從業(yè)務(wù)實體中抽象業(yè)務(wù)主鍵,業(yè)務(wù)主鍵必須是可唯一標(biāo)識業(yè)務(wù)實體且不會發(fā)生變化。

4) 按照業(yè)務(wù)主鍵生成中心表。

b. 鏈接表設(shè)計

1) 分析業(yè)務(wù)實體間的業(yè)務(wù)關(guān)系,并識別對應(yīng)的中心表,這些業(yè)務(wù)關(guān)系可以是一對一、一對多、多對多多種關(guān)系。

2) 按業(yè)務(wù)關(guān)系涉及的中心表,提取中心表主鍵,組成構(gòu)成鏈接表的外鍵,并確定鏈接表的主鍵。

說明:鏈接表內(nèi)可以保存交易數(shù)據(jù),也可以用附屬表描述交易數(shù)據(jù)。

c. 附屬表設(shè)計

附屬表的設(shè)計相對比較簡單,主要是從中心表、鏈接表出發(fā),提取與中心表、鏈接表相關(guān)的上下文描述信息。由于同一業(yè)務(wù)實體的各類描述信息可能會經(jīng)常變化、變化頻率也不盡相同,因此需要按變化頻率將不同屬性信息分割,建立多個附屬表。

為了訪問數(shù)據(jù)的方便,可能需要設(shè)計PIT表,PIT表不是必須的,但是如果一個中心表有多個附屬表,就有可能用到PIT表。PIT表的主鍵是有附屬表關(guān)聯(lián)的中心表提取而來,有幾個附屬表就會有幾個字段用于記錄附屬表的變化時間戳。

Data Vault案例

2.4?Anchor模型

Anchor模型是Data Vault模型的進一步規(guī)范化,核心思想是所有的擴展只是添加而不會修改,因此將模型規(guī)范到6NF,基本變成了k-v結(jié)構(gòu)化模型。
我們看一下Anchor模型的組成。
1.Anchors:類型于Data VaultHub,代表業(yè)務(wù)實體,且只有主鍵。
2.Attributes:功能類型于Data VaultSatellite,但是它更加規(guī)范化,將其全部k-v結(jié)構(gòu)化,一個表只有一個Anchors的屬性描述。
3.Ties:就是Anchors之間的關(guān)系,單獨用表來描述,類似于Data VaultLink,可以提升整體模型關(guān)系的擴展能力。
4.Knots:代表那些可能會在多個Anchors中公用的屬性的提煉,比如性別、狀態(tài)等這種枚舉類型且被公用的屬性。文章來源地址http://www.zghlxwxcb.cn/news/detail-451512.html

到了這里,關(guān)于數(shù)倉建模方法論的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 數(shù)倉工程師理解復(fù)雜業(yè)務(wù)的思考方法論

    數(shù)倉工程師理解復(fù)雜業(yè)務(wù)的思考方法論

    模型設(shè)計框架(業(yè)務(wù)過程驅(qū)動)還是在經(jīng)典的三層數(shù)據(jù)模型架構(gòu)下去進行,概念模型、邏輯模型、物理模型 首先概念模型其實是業(yè)務(wù)過程(流程圖),其中需要考慮到幾個方面: 1.數(shù)據(jù) 業(yè)務(wù)覆蓋 業(yè)務(wù)感知、全業(yè)務(wù)流程圖 2.過程 建模過程 實操?????? 3.服務(wù) 服務(wù)流程 流程把

    2024年02月10日
    瀏覽(26)
  • 領(lǐng)域建模的體系化思維與6種方法論

    領(lǐng)域建模的體系化思維與6種方法論

    背景 軟件工程師做的核心事情就是對現(xiàn)實世界的問題進行抽象然后用計算機的語言對其進行重新刻畫,在通過信息化來提高生產(chǎn)力。而這其中一個關(guān)鍵環(huán)節(jié)就是如何對問題域進行建模,在過去的工作中經(jīng)常遇到一個問題是前期因為業(yè)務(wù)比較簡單所以設(shè)計的模型在支撐時沒有發(fā)

    2024年02月10日
    瀏覽(25)
  • 收藏:不錯的數(shù)據(jù)中臺建設(shè)方法論

    收藏:不錯的數(shù)據(jù)中臺建設(shè)方法論

    數(shù)據(jù)中臺建設(shè)方法論體系,需要從 組織、保障、準(zhǔn)則、內(nèi)容、步驟5個層面 全面考慮,以確保數(shù)據(jù)中臺建設(shè)和實施能如期完成。 1種戰(zhàn)略行動 ,把用數(shù)據(jù)中臺驅(qū)動業(yè)務(wù)發(fā)展定位為企業(yè)級戰(zhàn)略,全局謀劃 2項保障條件 ,通過宣貫統(tǒng)一組織間的數(shù)據(jù)認知,通過流程加速組織變革

    2024年02月12日
    瀏覽(30)
  • 數(shù)據(jù)倉庫性能測試方法論與工具集

    數(shù)據(jù)倉庫性能測試方法論與工具集

    目錄 目錄 數(shù)據(jù)倉庫 v.s. 傳統(tǒng)數(shù)據(jù)庫 數(shù)據(jù)倉庫性能測試案例 性能指標(biāo) 測試方案 測試場景 測試數(shù)據(jù)集 測試用例 性能指標(biāo) 測試腳本工具 基準(zhǔn)環(huán)境準(zhǔn)備 硬件環(huán)境 軟件環(huán)境 測試操作步驟 Cloudwave 執(zhí)行步驟 導(dǎo)入數(shù)據(jù)集 TestCase 1. 執(zhí)行 13 條標(biāo)準(zhǔn) SQL 測試語句 TestCase 2. 執(zhí)行多表聯(lián)合

    2024年02月12日
    瀏覽(56)
  • MySQL數(shù)據(jù)庫IO性能優(yōu)化方法論

    作者:禪與計算機程序設(shè)計藝術(shù) 隨著互聯(lián)網(wǎng)信息化的發(fā)展,網(wǎng)站日益繁榮,用戶對網(wǎng)站訪問速度要求越來越高。如何提升網(wǎng)站數(shù)據(jù)庫IO性能從而實現(xiàn)快速響應(yīng)?本文將從數(shù)據(jù)庫的優(yōu)化角度出發(fā),結(jié)合實際應(yīng)用場景,進行系統(tǒng)地剖析、歸納和總結(jié),為讀者提供一個系統(tǒng)性、完整

    2024年02月06日
    瀏覽(27)
  • 構(gòu)建數(shù)據(jù)中臺的三要素:方法論、組織和技術(shù)

    構(gòu)建數(shù)據(jù)中臺的三要素:方法論、組織和技術(shù)

    知道要轉(zhuǎn)型,要建設(shè)數(shù)據(jù)中臺,卻不知咋做,咋辦? 現(xiàn)在有很多講“如何建設(shè)數(shù)據(jù)中臺”文章,觀點各不相同: 數(shù)據(jù)中臺是數(shù)據(jù)建設(shè)方法論,按照數(shù)據(jù)中臺設(shè)計方法和規(guī)范實施就可建成數(shù)據(jù)中臺 數(shù)據(jù)中臺背后是數(shù)據(jù)部門組織架構(gòu)變更,把原先分散的組織架構(gòu)形成一個統(tǒng)一中

    2024年02月16日
    瀏覽(26)
  • 什么是主數(shù)據(jù)管理?企業(yè)主數(shù)據(jù)管理方法論

    什么是主數(shù)據(jù)管理?企業(yè)主數(shù)據(jù)管理方法論

    主數(shù)據(jù)又被稱為黃金數(shù)據(jù),其價值高也非常重要。對企業(yè)來說,主數(shù)據(jù)的重要性如何強調(diào)都不為過,主數(shù)據(jù)治理是企業(yè)數(shù)據(jù)治理中最為重要的一環(huán)。主數(shù)據(jù)管理的內(nèi)容包括? 主數(shù)據(jù)管理標(biāo)準(zhǔn)、主數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn)? 和? 主數(shù)據(jù)集成服務(wù)標(biāo)準(zhǔn)? 三大類。 主數(shù)據(jù)管理的作用和意義主要

    2024年02月13日
    瀏覽(32)
  • MATLAB實戰(zhàn)應(yīng)用-【數(shù)據(jù)處理篇】數(shù)據(jù)清洗(從方法論到實戰(zhàn)應(yīng)用)

    目錄 前言 數(shù)據(jù)清洗需要達到什么要求 如何規(guī)范數(shù)據(jù) 一、解決數(shù)據(jù)的完整性問題:

    2023年04月08日
    瀏覽(23)
  • 二蛋贈書七期:《云原生數(shù)據(jù)中臺:架構(gòu)、方法論與實踐》

    二蛋贈書七期:《云原生數(shù)據(jù)中臺:架構(gòu)、方法論與實踐》

    大家好!我是二蛋,一個熱愛技術(shù)、樂于分享的工程師。在過去的幾年里,我一直通過各種渠道與大家分享技術(shù)知識和經(jīng)驗。我深知,每一位技術(shù)人員都對自己的技能提升和職業(yè)發(fā)展有著熱切的期待。因此,我非常感激大家一直以來對我的關(guān)注和支持。 為了回饋大家的厚愛,

    2024年02月05日
    瀏覽(25)
  • 分布式數(shù)據(jù)存儲建設(shè)方法論——從HDFS架構(gòu)優(yōu)化與實踐分析

    作者:禪與計算機程序設(shè)計藝術(shù) 隨著互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等新一代信息技術(shù)的出現(xiàn)和普及,數(shù)據(jù)量的激增、數(shù)據(jù)安全性的需求以及數(shù)據(jù)的分布式儲存需求日益成為各大公司和組織面臨的難題。傳統(tǒng)的單體架構(gòu)模式已經(jīng)無法應(yīng)付如此復(fù)雜的業(yè)務(wù)場景,因此,分布式數(shù)據(jù)存儲

    2024年02月11日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包