国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

如何理解元數(shù)據(jù)、數(shù)據(jù)元、元模型、數(shù)據(jù)字典、數(shù)據(jù)模型這五個的關(guān)系?如何進(jìn)行數(shù)據(jù)治理呢?數(shù)據(jù)治理該從哪方面入手呢?

這篇具有很好參考價值的文章主要介紹了如何理解元數(shù)據(jù)、數(shù)據(jù)元、元模型、數(shù)據(jù)字典、數(shù)據(jù)模型這五個的關(guān)系?如何進(jìn)行數(shù)據(jù)治理呢?數(shù)據(jù)治理該從哪方面入手呢?。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

導(dǎo)讀

請問元數(shù)據(jù)、數(shù)據(jù)元、數(shù)據(jù)字典、數(shù)據(jù)模型及元模型的區(qū)別有哪些呢?

這些相似的概念估計會把人饒暈,這里先給出一個圖解的例子,然后再對這些概念作詳細(xì)解讀。

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

1、數(shù)據(jù)元就是“個人所得稅記錄表”中的字段,比如示例中的“個人所得稅金額”,注意,數(shù)據(jù)元既有描述內(nèi)容,也是數(shù)據(jù)的一部分,最小單元而已,圖中藍(lán)色虛框包含的部分就是數(shù)據(jù)元。

2、數(shù)據(jù)模型就是“個人所得稅記錄表”這張表本身,它是現(xiàn)實世界的一個抽象,見圖中黑色虛框包含的部分。

3、”個人所得稅金額“的元數(shù)據(jù)是對”個人所得稅金額“這個字段的描述,見圖中紅色虛框部分,可見它不包含數(shù)據(jù)。

4、”個人所得稅記錄表“的元數(shù)據(jù)是對”個人所得稅記錄表“這張表的描述,見圖中咖啡色虛框部分。

5、數(shù)據(jù)字典就是針對表,字段等數(shù)據(jù)庫對象元數(shù)據(jù)的一種重新組織形式,示意如上。

6、有了對數(shù)據(jù)模型的理解再看元模型,元模型是模型的模型,定義了描述某一模型的規(guī)范,具體來說就是組成模型的元素和元素之間的關(guān)系,如上圖對實體和實體間的1:1依賴關(guān)系做了定義,對實體的屬性做了name、field定義,元模型實例化就成了模型和元數(shù)據(jù)。

簡單概述一下

數(shù)據(jù)元:是通過定義、標(biāo)識、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元,數(shù)據(jù)元的相關(guān)信息也是元數(shù)據(jù)的一部分,數(shù)據(jù)元=單元數(shù)據(jù)+基本描述(元數(shù)據(jù)子集)

元數(shù)據(jù):關(guān)于數(shù)據(jù)的數(shù)據(jù),但元數(shù)據(jù)無法涵蓋理解數(shù)據(jù)元所要表示的數(shù)據(jù)所必需的所有信息,元數(shù)據(jù)=對于數(shù)據(jù)元有缺失的描述

數(shù)據(jù)字典:用戶可以訪問的一種信息集合的目錄,是元數(shù)據(jù)的子集和應(yīng)用,數(shù)據(jù)字典=元數(shù)據(jù)的一種特殊應(yīng)用

數(shù)據(jù)模型:是數(shù)據(jù)特征的抽象,將若干具有相關(guān)性的數(shù)據(jù)元按一定的次序組成一個整體結(jié)構(gòu)即為數(shù)據(jù)模型,數(shù)據(jù)模型=若干數(shù)據(jù)元組合

元模型:對模型的元素和元素之間關(guān)系的規(guī)范,元模型=數(shù)據(jù)模型和元數(shù)據(jù)的抽象規(guī)范

一、數(shù)據(jù)元

數(shù)據(jù)元(Data element)即數(shù)據(jù)元素,是通過定義、標(biāo)識、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元,在一定語境下,構(gòu)建一個語義正確、獨立且無歧義的特定概念語義的信息單元。

在特定的語義環(huán)境中,數(shù)據(jù)元被認(rèn)為是不可再分的最小數(shù)據(jù)單元,將若干個具有相關(guān)性的數(shù)據(jù)元按一定次序組成的一個整體結(jié)構(gòu),即數(shù)據(jù)模型。

數(shù)據(jù)元由對象類、特性、表示三部分組成,“個人所得稅金額”就是一個數(shù)據(jù)元。

  • 個人”為對象詞。
    對象類:現(xiàn)實世界中的想法、抽象概念或事物的集合,有清楚的邊界和含義,并且特性和其行為遵循同樣的規(guī)則而能夠加以標(biāo)識;

  • 所得稅”是該數(shù)據(jù)元的特性詞。
    特性:對象類的所有個體所共有的某種性質(zhì);

  • 金額”是該數(shù)據(jù)元的表示詞,值域可以是一系列非負(fù)整數(shù)(帶有貨幣單位)。
    表示:值域、數(shù)據(jù)類型、計量單位(如果需要)、表示類(可選)組成。

數(shù)據(jù)元可以用來對各行業(yè)的數(shù)據(jù)進(jìn)行規(guī)范化,對行業(yè)數(shù)據(jù)進(jìn)行統(tǒng)一的名、型、值規(guī)范及分類,規(guī)劃好行業(yè)數(shù)據(jù)元之后,可以為行業(yè)構(gòu)建出統(tǒng)一、集成的、穩(wěn)定的數(shù)據(jù)模型奠定基礎(chǔ),同時它也為數(shù)據(jù)交換奠定基礎(chǔ)。

國標(biāo)GB/T 18391對數(shù)據(jù)元做了詳細(xì)規(guī)范,下圖給出了數(shù)據(jù)元的結(jié)構(gòu)模型,同實體關(guān)系類的數(shù)據(jù)模型相比,模型中的實體相當(dāng)于數(shù)據(jù)元的對象類,而實體的屬性相當(dāng)于數(shù)據(jù)元中的特性和表示。

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫
國標(biāo)定義了數(shù)據(jù)元的基本屬性,如下圖所示:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫
下面是一個示例:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

二、元數(shù)據(jù)

面對數(shù)據(jù)我們總是會有以下的一些疑問:

  • 這個數(shù)據(jù)怎么來的? 誰創(chuàng)建的,誰更新的,從哪個系統(tǒng)來的…
  • 這個數(shù)據(jù)是什么? 數(shù)據(jù)的語義環(huán)境是什么,數(shù)據(jù)怎么存儲的,數(shù)據(jù)的定位是什么…
  • 這個數(shù)據(jù)怎么用? 數(shù)據(jù)的應(yīng)用場景是什么,有沒有和其他系統(tǒng)共享,如果丟失會造成什么影響…
  • 這個數(shù)據(jù)怎么管理? 誰負(fù)責(zé)這個數(shù)據(jù),這個數(shù)據(jù)怎么評定質(zhì)量,誰有權(quán)訪問這個數(shù)據(jù)…

為了更好的解決這些問題,需要使用元數(shù)據(jù)來記錄數(shù)據(jù)相關(guān)的信息。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息,簡言之,元數(shù)據(jù)就是關(guān)于數(shù)據(jù)的數(shù)據(jù)。

元數(shù)據(jù)的作用是巨大的,其是網(wǎng)絡(luò)信息資源描述的重要工具,可以用于網(wǎng)絡(luò)信息資源管理的各個方面,包括信息資源的建立、發(fā)布、轉(zhuǎn)換、使用、共享等,具體可以概括為五個方面:

  1. 描述作用:對信息對象的內(nèi)容和位置進(jìn)行描述,從而為信息對象的存取與利用奠定必要基礎(chǔ)。

  2. 定位作用:由于網(wǎng)絡(luò)信息資源沒有具體的實體存在,因此,明確定位至關(guān)重要,元數(shù)據(jù)包含有關(guān)網(wǎng)絡(luò)信息資源位置方面的信息,由此便可確定資源的位置所在,促進(jìn)了網(wǎng)絡(luò)環(huán)境中信息對象的發(fā)現(xiàn)和檢索。

  3. 搜尋作用:元數(shù)據(jù)提供搜尋的基礎(chǔ),在著錄的過程中,將信息對象中的重要信息抽出并加以組織,賦予語境,并建立關(guān)系,使搜索結(jié)果更加準(zhǔn)確。

  4. 評估作用:元數(shù)據(jù)提供有關(guān)信息對象的名稱、內(nèi)容、年代、格式、制作者等基本屬性,使用戶無需瀏覽信息對象本身情況下,就能對信息對象具備基本了解和認(rèn)識,參照有關(guān)標(biāo)準(zhǔn)即可對其價值進(jìn)行必要的評估,作為存取利用的參考。

  5. 選擇作用:根據(jù)元數(shù)據(jù)提供的描述信息、參考評估標(biāo)準(zhǔn),結(jié)合使用環(huán)境,用戶能夠做出對信息對象取舍的決定,選擇適合用戶使用的資源。

下面舉2個例子。

1、圖書館中的元數(shù)據(jù)

圖書館都會用一個叫作“圖書目錄”的文件夾來管理藏書,圖書目錄包含圖書名稱、編號、作者、主題、簡介、擺放位置等信息,用來幫助圖書管理員管理和快速查找圖書。元數(shù)據(jù)就如同圖書館的圖書目錄一樣,能夠幫助數(shù)據(jù)管理員管理數(shù)據(jù)。

2、元數(shù)據(jù)好比字典

字典包含一個字的注音、含義、組詞、舉例等基本信息及其字體結(jié)構(gòu)、相關(guān)引用、出處等。另外,我們可以通過拼音或偏旁部首查到這個字。所有這些信息都是對這個字的詳細(xì)描述,它們就是描述這個字的元數(shù)據(jù)。

從前面的數(shù)據(jù)元的定義可以知道,數(shù)據(jù)元是數(shù)據(jù)的基本單元,它是先于元數(shù)據(jù)存在的,但一個組織的數(shù)據(jù)元必須具備元數(shù)據(jù),數(shù)據(jù)元的相關(guān)信息也是元數(shù)據(jù)的一部分,這些元數(shù)據(jù)將便于用戶理解和共享該組織中的數(shù)據(jù)

但元數(shù)據(jù)不可能涵蓋理解數(shù)據(jù)元所要表示的數(shù)據(jù)所必需的所有信息,

例如,一個收集調(diào)查資料的組織將會有許多關(guān)于如何收集數(shù)據(jù)的信息,這些諸如樣本和問卷設(shè)計等常常是理解數(shù)據(jù)所必要的,但是,樣本和問卷設(shè)計并不是用來表示和描述數(shù)據(jù)元的元數(shù)據(jù)的一部分。

三、數(shù)據(jù)模型

數(shù)據(jù)模型(Data Model)是數(shù)據(jù)特征的抽象,它從抽象層次上描述了系統(tǒng)的靜態(tài)特征、動態(tài)行為和約束條件,為數(shù)據(jù)庫系統(tǒng)的信息表示與操作提供一個抽象的框架。數(shù)據(jù)模型所描述的內(nèi)容有三部分,分別是數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、數(shù)據(jù)約束。

數(shù)據(jù)模型按不同的應(yīng)用層次分成三種類型:分別是概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、物理數(shù)據(jù)模型。

1、概念數(shù)據(jù)模型:確定好領(lǐng)域內(nèi)的基礎(chǔ)和關(guān)鍵的業(yè)務(wù)實體,統(tǒng)一各種業(yè)務(wù)術(shù)語和命名規(guī)范,同時也要給出實體間關(guān)系的描述,如下示例:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

2、邏輯數(shù)據(jù)模型:邏輯模型所有實體屬性均需添加,實體間關(guān)系要清晰描述,需要使用術(shù)語,遵循命名規(guī)范,邏輯模型不受底層實際存儲數(shù)據(jù)庫的約束,但我們需要定義好實體屬性以及實體間的關(guān)系(這里主要是主外鍵關(guān)系、一對一或一對多或者多對多關(guān)系)、實體和屬性的備注說明、屬性的數(shù)據(jù)類型以及約束(空值、非空、主外鍵鍵約束),如下示例:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

3、物理數(shù)據(jù)模型:是面向計算機(jī)物理表示的模型,描述了數(shù)據(jù)在儲存介質(zhì)上的組織結(jié)構(gòu),它不但與具體的DBMS 有關(guān),而且還與操作系統(tǒng)和硬件有關(guān),需要考慮查詢性能要求和未來一段時間內(nèi)的存儲空間占用情況,一般根據(jù)邏輯模型,使用模型設(shè)計工具自動生成的,如下示例:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

根據(jù)前面的數(shù)據(jù)元結(jié)構(gòu)分析可以知道,數(shù)據(jù)模型從結(jié)構(gòu)上看,跟數(shù)據(jù)元有映射關(guān)系,區(qū)別僅在于數(shù)據(jù)元是基本數(shù)據(jù)單元,是對現(xiàn)實世界更原子化的抽象,將若干具有相關(guān)性的數(shù)據(jù)元按一定的次序組成一個整體結(jié)構(gòu)即為數(shù)據(jù)模型。

四、數(shù)據(jù)字典

數(shù)據(jù)字典是用戶可以訪問的一種信息集合的目錄,記錄了有關(guān)數(shù)據(jù)庫以及應(yīng)用程序源數(shù)據(jù)的信息,

Oracle數(shù)據(jù)庫認(rèn)為:數(shù)據(jù)字典是存放有關(guān)數(shù)據(jù)信息的地方,且具有描述數(shù)據(jù)的用途。數(shù)據(jù)字典不包含數(shù)據(jù)庫實際數(shù)據(jù)的信息。數(shù)據(jù)字典的詳細(xì)分類見下文,集成化數(shù)據(jù)字典具體部分見下:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

  1. 數(shù)據(jù)項:數(shù)據(jù)項是不可再分的數(shù)據(jù)單位,數(shù)據(jù)項描述={數(shù)據(jù)項名,數(shù)據(jù)項含義說明,別名,數(shù)據(jù)類型,長度,取值范圍,取值含義,與其他數(shù)據(jù)項的邏輯關(guān)系}。

  2. 數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)結(jié)構(gòu)反映了數(shù)據(jù)之間的組合關(guān)系。一個數(shù)據(jù)結(jié)構(gòu)可以由若干個數(shù)據(jù)項組成,也可以由若干個數(shù)據(jù)結(jié)構(gòu)組成,或由若干個數(shù)據(jù)項和數(shù)據(jù)結(jié)構(gòu)混合組成。數(shù)據(jù)結(jié)構(gòu)描述={數(shù)據(jù)結(jié)構(gòu)名,含義說明,組成:{數(shù)據(jù)項或數(shù)據(jù)結(jié)構(gòu)}}

  3. 數(shù)據(jù)流:數(shù)據(jù)流是數(shù)據(jù)結(jié)構(gòu)在系統(tǒng)內(nèi)傳輸?shù)穆窂健?code>數(shù)據(jù)流描述={數(shù)據(jù)流名,說明,數(shù)據(jù)流來源,數(shù)據(jù)流去向,組成:{數(shù)據(jù)結(jié)構(gòu)},平均流量,高峰期流量}。

  4. 數(shù)據(jù)存儲:數(shù)據(jù)存儲是數(shù)據(jù)結(jié)構(gòu)停留或保存的地方,也是數(shù)據(jù)流的來源和去向之一。數(shù)據(jù)存儲描述={數(shù)據(jù)存儲名,說明,編號,流入的數(shù)據(jù)流,流出的數(shù)據(jù)流,組成:{數(shù)據(jù)結(jié)構(gòu)},數(shù)據(jù)量,存取方式}。

  5. 處理過程:數(shù)據(jù)字典中只需要描述處理過程的說明性信息。處理過程描述={處理過程名,說明,輸入:{數(shù)據(jù)流},輸出:{數(shù)據(jù)流},處理:{簡要說明}}。

數(shù)據(jù)字典是一個廣泛概念,狹義上指用來存儲信息的數(shù)據(jù)庫本身,也可以是非技術(shù)的業(yè)務(wù)領(lǐng)域內(nèi)數(shù)據(jù)元素的定義的集合。常見分類如下:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

1、按存儲介質(zhì)

  • 數(shù)據(jù)庫介質(zhì):有Oracle、hive自帶的元數(shù)據(jù)庫,也有企業(yè)將自己公司的數(shù)據(jù)字典存儲在數(shù)據(jù)庫中,如MySQL、Oracle、Postgre等。
  • 非數(shù)據(jù)庫介質(zhì):主要是以excel文檔為主:對于一個項目中的數(shù)據(jù)字典,項目組出于使用便捷、成本低以及數(shù)據(jù)量可控制等原因,使用excel存儲相對應(yīng)的數(shù)據(jù)元素,方便數(shù)據(jù)記錄、查詢、維護(hù)和再開發(fā)。

2、自動和手動

  • 自動數(shù)據(jù)字典:一般是數(shù)據(jù)庫管理軟件自動管理或者大公司自研的大數(shù)據(jù)產(chǎn)品,與數(shù)據(jù)庫的當(dāng)前結(jié)構(gòu)和定義一致。當(dāng)數(shù)據(jù)庫管理系統(tǒng)對數(shù)據(jù)庫進(jìn)行任何更改時,數(shù)據(jù)字典也會更新。
  • 手動數(shù)據(jù)字典:一般與業(yè)務(wù)數(shù)據(jù)庫分開維護(hù),需要我們手動更新。被動數(shù)據(jù)字典可以作為單獨的數(shù)據(jù)庫進(jìn)行維護(hù),也可以是在獨立的excel進(jìn)行維護(hù)。
  • 半自動特殊情況:在實施項目過程中,經(jīng)常會出現(xiàn)腳本結(jié)合excel情況。主要有倆種模型,一種是在修改影響數(shù)據(jù)字典內(nèi)容前,本著設(shè)計及開發(fā)原則,先修改數(shù)據(jù)字典,之后通過腳本或者人工方式再去修改對應(yīng)數(shù)據(jù)庫的內(nèi)容;另一種情況是,每次修改完數(shù)據(jù)庫內(nèi)容后,通過腳本方式重新迭代生成新的數(shù)據(jù)字典。

3、使用用途

  • 業(yè)務(wù)數(shù)據(jù)字典:記錄數(shù)據(jù)在業(yè)務(wù)流轉(zhuǎn)過程中的關(guān)鍵節(jié)點和背后業(yè)務(wù)意義,保存一個數(shù)據(jù)元在數(shù)據(jù)產(chǎn)生、流轉(zhuǎn)、融合、銷毀等全生命周期的業(yè)務(wù)信息規(guī)則,幫助數(shù)據(jù)稽查和商業(yè)分析等活動。
  • 技術(shù)數(shù)據(jù)字典:記錄一個數(shù)據(jù)元在物理數(shù)據(jù)庫中信息,方便開發(fā)人員對某一數(shù)據(jù)元或數(shù)據(jù)表建設(shè)數(shù)據(jù)模型等加工處理操作。
  • 其他用途數(shù)據(jù)字典:在某些項目中,由于特殊需求,針對數(shù)據(jù)操作和管理可能會有單獨的數(shù)據(jù)字典來維護(hù),項目中每多增加一個非自動化數(shù)據(jù)字典,提高了維護(hù)的人工成本和數(shù)據(jù)不一致的風(fēng)險,因此需要項目團(tuán)隊謹(jǐn)慎對待。

可以看到,元數(shù)據(jù)有助于填充數(shù)據(jù)字典,將元數(shù)據(jù)存儲于一個庫中并使之條理化就可以形成一個數(shù)據(jù)字典。

數(shù)據(jù)字典一般供技術(shù)團(tuán)隊使用,是引用不同數(shù)據(jù)屬性的主要場所,包括約束、數(shù)據(jù)類型、默認(rèn)值、長度、轉(zhuǎn)換規(guī)則和業(yè)務(wù)定義。通過建立整個公司都能理解的連貫定義,所有團(tuán)隊都可以在同一層面上。這有助于保持?jǐn)?shù)據(jù)的有效性并實現(xiàn)組織內(nèi)的一致性。

五、元模型

元模型定義了描述某一模型的規(guī)范,具體來說就是組成模型的元素和元素之間的關(guān)系。元模型是相對于模型的概念,離開了模型元模型就沒有了意義。

下面來看一個類模型與其元模型的例子:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫
可以將元模型想象成為某種形式語言,這樣模型就是一篇用該語言描述的文章,其中元模型中的元素就是該語言的詞匯,元素之間的關(guān)系就是該語言的語法,如下圖:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫
每個模型都有一種元模型來解釋它,雖然這種元模型可能不是顯而易見的,而模型與元模型也是相對的,對于元元模型來說元模型就是它的模型。模型與元模型構(gòu)成了一個無限循環(huán),而越往上抽象層次越高

舉一個例子,隨著抽象層次的提升,動物、植物在某個抽象層次有一致的元模型(都是有細(xì)胞構(gòu)成的),再往上提升在某一抽象層次,動物植物礦物都是一致了(都是由分子構(gòu)成)。

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

ERWIn,Powerdesign都是建模工具,這些工具中的實體、關(guān)系、屬性等構(gòu)件就是元模型,基于這些元模型的編排我們就可以構(gòu)建出自己需要的數(shù)據(jù)模型,如下圖所示:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫
大家可以看到,元模型讓模型的定義和連接變得更加規(guī)范和標(biāo)準(zhǔn)化,這對于數(shù)據(jù)的集成是非常關(guān)鍵的,現(xiàn)在有很多數(shù)據(jù)庫產(chǎn)品,它們對元數(shù)據(jù)都有自己的定義和格式,如果這些元數(shù)據(jù)沒有統(tǒng)一的標(biāo)準(zhǔn),意味著兩個產(chǎn)品無法進(jìn)行溝通,比如BI產(chǎn)品要從ORACLE數(shù)據(jù)庫取到所需要的的表,雙方必須對接口的定義保持一致,要解決這些問題,就必須得用標(biāo)準(zhǔn)的語言描述雙方元數(shù)據(jù)的結(jié)構(gòu)和語義,并提供標(biāo)準(zhǔn)的元數(shù)據(jù)交換機(jī)制。CWM(公共倉庫元模型)就是滿足這些條件的一個規(guī)范。

OMG(對象管理組織)在2000年發(fā)布了CWM規(guī)范,旨在推動數(shù)據(jù)倉庫、智能商務(wù)和知識管理方面元數(shù)據(jù)的共享和交換。CWM主要基于以下三個工業(yè)標(biāo)準(zhǔn):

  1. UML:統(tǒng)一建模語言,是OMG的一個建模標(biāo)準(zhǔn);
  2. MOF:元對象工具,是OMG關(guān)于元模型和元數(shù)據(jù)庫的一個標(biāo)準(zhǔn);
  3. XMI:XML元數(shù)據(jù)交換,是OMG關(guān)于元數(shù)據(jù)交換的標(biāo)準(zhǔn);

這三個標(biāo)準(zhǔn)是OMG元數(shù)據(jù)庫體系結(jié)構(gòu)的核心,UML定義了表示模型和元模型的語法和語義。MOF為構(gòu)建模型和元模型提供了可擴(kuò)展的框架,并提供了存取元數(shù)據(jù)的程序接口。而利用XMI則可以將元數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)的XML數(shù)據(jù)流或文件的格式,以便進(jìn)行交換,這大大增強(qiáng)了CWM的通用性。

傳統(tǒng)的元數(shù)據(jù)有四個層次,除了最底層外,每一層都對它的下一層進(jìn)行描述。

  1. 最底層是用戶對象層(M0),包括用戶要描述的信息,這些信息統(tǒng)稱為數(shù)據(jù)。

  2. 向上一層是模型層(M1),由描述信息的元數(shù)據(jù)組成,在這一層,元數(shù)據(jù)一般都組合成模型的形式。

  3. 再向上一層是元模型層(M2),由定義M1層元數(shù)據(jù)格式和語義的描述信息組成,也就是元元數(shù)據(jù),一般組合成元模型的形式。

  4. 最高層是元元模型層(M3),它定義了元模型的結(jié)構(gòu)和語義。

下面舉個例子對這種四層結(jié)構(gòu)進(jìn)行說明。

四層的內(nèi)容解釋如下:

  1. 數(shù)據(jù)層是學(xué)生記錄(Record)的實例,即具體的某個學(xué)生;

  2. 模型層描述學(xué)生這個記錄類型的內(nèi)容,它有一個名字(“Student”)和兩個字段(Field),每個字段都有一個名字和類型,比如第一個字段的名字是“name“,字段類型是String;

  3. 元模型層對Record這種類型進(jìn)行定義,在這一層, Record是元類metaClass的一個實例,一個Record擁有兩個元屬性metaAttribute,第一個name定義它的名字,是String類型,第二個fields定義它包含的字段集,字段集中的成員是Field類型。類似的,元類field應(yīng)該也包含兩個元屬性:名字name和類型type;

  4. 元模型層的結(jié)構(gòu)是基本固定的,它將所有概念抽象為以下這些組件:元類meta-Class、元屬性meta-Attribute元關(guān)聯(lián)meta-Association,并定義了元類之間的關(guān)系,主要包括:包含(Contains),繼承(Generalizes)類型引用(IsOfType)依賴(DependsOn);

綜上所述,可以用下面這張表來描述OMG的上述規(guī)范和元數(shù)據(jù)四層結(jié)構(gòu)的對應(yīng)關(guān)系:

元模型和元數(shù)據(jù)的區(qū)別,【理論科普】大數(shù)據(jù) | 云原生 | 機(jī)器學(xué)習(xí) | 人工智能,知識圖譜,數(shù)據(jù)庫,數(shù)據(jù)倉庫

可以想像一下,如果A系統(tǒng)想訪問B數(shù)據(jù)庫的學(xué)生記錄(Record),雙方必需對實體、屬性等的定義和格式要保持一致,這樣A系統(tǒng)才能準(zhǔn)確的告訴B我首先要查找實體學(xué)生記錄,然后從這個實體獲得屬性 ,如果大家的模型不是基于同樣定義的實體和屬性構(gòu)建出來的,那么肯定是無法進(jìn)行連接的,這種抽象就叫CWM元模型,在MOF里叫作元元數(shù)據(jù)。文章來源地址http://www.zghlxwxcb.cn/news/detail-598586.html

到了這里,關(guān)于如何理解元數(shù)據(jù)、數(shù)據(jù)元、元模型、數(shù)據(jù)字典、數(shù)據(jù)模型這五個的關(guān)系?如何進(jìn)行數(shù)據(jù)治理呢?數(shù)據(jù)治理該從哪方面入手呢?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • pdf轉(zhuǎn)jpg怎么解決?這五個轉(zhuǎn)換方法快速搞定!

    pdf轉(zhuǎn)jpg怎么解決?這五個轉(zhuǎn)換方法快速搞定!

    pdf轉(zhuǎn)jpg怎么轉(zhuǎn)?pdf是在我們工作中經(jīng)常使用的一種辦公文件格式類型,但是在某些特殊情況下,我們應(yīng)該把pdf轉(zhuǎn)jpg圖片格式文件,很多人在這種情況下不知道如何把pdf轉(zhuǎn)jpg圖片格式文件,接下來我們一起來了解下pdf轉(zhuǎn)jpg轉(zhuǎn)換方法有哪些? ?PDF轉(zhuǎn)圖片教程 PDF轉(zhuǎn)圖片方法一:使用

    2023年04月21日
    瀏覽(21)
  • 這五個問題一下就看出阿里通義千問和ChatGPT的差距了

    這五個問題一下就看出阿里通義千問和ChatGPT的差距了

    阿里通義千問申請過了,為了看看達(dá)到了什么水平,于是我問題了5個ChatGPT回答過的問題 1 ,這五個問題網(wǎng)上都是沒有的,是我自己想出來的。 這是一個有趣的問題,但是也有一些誤解。公雞蛋并不是公雞下的蛋,而是指公雞的睪丸,也就是公雞的生殖器官。所以小明說他吃

    2024年02月04日
    瀏覽(27)
  • 從這五個方面提升python的執(zhí)行效率,才是軟件開發(fā)層面需要考慮的問題!

    python作為使用最廣泛的編程語言之一,有著無窮無盡的第三方非標(biāo)準(zhǔn)庫的支持。 簡單的語法、優(yōu)雅的代碼塊使其在各個業(yè)務(wù)領(lǐng)域都混的風(fēng)生水起,除了這些優(yōu)點,python有一個經(jīng)常被人詬病的缺點那就是運行速度。 小伙伴通過下面的五個python開發(fā)技巧,來充分提高python代碼塊

    2023年04月14日
    瀏覽(20)
  • 《花雕學(xué)AI》不用花錢,也能和ChatGPT聊天!快來看看這五個免費客戶端吧

    《花雕學(xué)AI》不用花錢,也能和ChatGPT聊天!快來看看這五個免費客戶端吧

    引言 你有沒有想過和一個智能的聊天機(jī)器人對話?一個可以陪你聊天、講故事、寫代碼、模仿名人、生成歌詞等等的聊天機(jī)器人?如果你有這樣的想法,那么你一定要了解ChatGPT。ChatGPT是一個由OpenAI開發(fā)的人工智能聊天機(jī)器人程序,它使用了最先進(jìn)的大型語言模型技術(shù),可以

    2024年02月06日
    瀏覽(26)
  • 關(guān)系代數(shù)(關(guān)系代數(shù)的五個基本操作)

    關(guān)系代數(shù)(關(guān)系代數(shù)的五個基本操作)

    五種基本關(guān)系代數(shù)運算是并、差、投影、交、選擇、投影。 1、并:設(shè)有兩個關(guān)系R和S,它們具有相同的結(jié)構(gòu)。R和S的并是由屬于R或?qū)儆赟的元組組成的集合,運算符為∪。記為T=R∪S。 2、差:R和S的差是由屬于R但不屬于S的元組組成的集合,運算符為- [1]? 。記為T=R-S。 3、交

    2024年02月02日
    瀏覽(23)
  • 元數(shù)據(jù)、數(shù)據(jù)元、元模型、數(shù)據(jù)字典及數(shù)據(jù)模型的區(qū)別

    元數(shù)據(jù)、數(shù)據(jù)元、元模型、數(shù)據(jù)字典及數(shù)據(jù)模型的區(qū)別

    整理不易,轉(zhuǎn)發(fā)請注明出處,請勿直接剽竊! 點贊、關(guān)注、不迷路! 摘要: 元數(shù)據(jù)、數(shù)據(jù)元、數(shù)據(jù)模型、元模型、數(shù)據(jù)字典 元數(shù)據(jù):描述數(shù)據(jù)的數(shù)據(jù) 數(shù)據(jù)元:數(shù)據(jù)的最小單元(字段元數(shù)據(jù)+值) 數(shù)據(jù)模型:由數(shù)據(jù)元組合而成(分為概念、邏輯、物理模型) 元模型:關(guān)系建

    2024年02月07日
    瀏覽(19)
  • iOS 使用coreData存貯頁面的模型數(shù)據(jù)中的字典

    iOS 使用coreData存貯頁面的模型數(shù)據(jù)中的字典

    我們使用coreData時候,會遇到較為復(fù)雜的數(shù)據(jù)類型的存貯,例如,我們要存一個模型,但是一個模型里面有個字典,這時候,我們該如何存貯呢 如圖所示,一個對象中含有一個字典 我們實現(xiàn)一個公共的方法,將對象的所有屬性都賦值給對應(yīng)的coreData模型 存貯數(shù)據(jù)的時候調(diào)用

    2024年02月10日
    瀏覽(20)
  • 模型推理詳細(xì)步驟以及如何排查模型和參數(shù)字典對不上的問題:Missing key(s) in state_dict: xxxx

    模型推理詳細(xì)步驟以及如何排查模型和參數(shù)字典對不上的問題:Missing key(s) in state_dict: xxxx

    首先,模型加載總共分為三步,第一步加載網(wǎng)絡(luò)結(jié)構(gòu),需要和你訓(xùn)時的network結(jié)構(gòu)一樣。 第二步,加載訓(xùn)練好的參數(shù),實際上雖然我們一直說訓(xùn)練模型,實際上訓(xùn)練出來的就是一組參數(shù),這個參數(shù)是一個字典類型,一般保存的名稱為xxx.pt或者pth。里面存放的是模型每一層中的

    2024年02月13日
    瀏覽(16)
  • Django基礎(chǔ)6——數(shù)據(jù)模型關(guān)系

    Django基礎(chǔ)6——數(shù)據(jù)模型關(guān)系

    常見數(shù)據(jù)模型關(guān)系: 一對一(one-to-one),OneToOneField。一個表中的每條記錄對應(yīng)另一個表中的每條記錄,使用OneToOneField建立關(guān)系。 一對多,多對一(one-to-many),F(xiàn)oreignKey 多對多(many-to-many),ManyToManyField 所謂的一對一、一對多,是指數(shù)據(jù)庫中的表之間的關(guān)系。 應(yīng)用場景:當(dāng)一張

    2024年02月11日
    瀏覽(21)
  • hyperf 二十二 數(shù)據(jù)庫 模型關(guān)系

    教程:Hyperf 通過設(shè)置?HyperfDatabaseModelBuilder::eagerLoad加載需查詢用的model, 查詢條件子查詢使用in。 eagerLoad在Builder::eagerLoadRelations()被調(diào)用,傳入Builder::eagerLoadRelation()。eagerLoadRelation()中調(diào)用addEagerConstraints()構(gòu)造查詢。 ?用戶和圖片一對多關(guān)系,文章和圖片一對一關(guān)系。 ?一

    2024年01月19日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包