国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù)

這篇具有很好參考價(jià)值的文章主要介紹了元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù),為描述數(shù)據(jù)的數(shù)據(jù)(data about data),主要是描述數(shù)據(jù)屬性(property)的信息,用來(lái)支持如指示存儲(chǔ)位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。元數(shù)據(jù)算是一種電子式目錄,為了達(dá)到編制目錄的目的,必須在描述并收藏?cái)?shù)據(jù)的內(nèi)容或特色,進(jìn)而達(dá)成協(xié)助數(shù)據(jù)檢索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元數(shù)據(jù)的一種應(yīng)用,是1995年2月由國(guó)際圖書(shū)館電腦中心(OCLC)和美國(guó)國(guó)家超級(jí)計(jì)算應(yīng)用中心(National Center for Supercomputing Applications,NCSA)所聯(lián)合贊助的研討會(huì),在邀請(qǐng)52位來(lái)自圖書(shū)館員、電腦專家,共同制定規(guī)格,創(chuàng)建一套描述網(wǎng)絡(luò)上電子文件之特征。
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息,簡(jiǎn)言之,元數(shù)據(jù)就是關(guān)于數(shù)據(jù)的數(shù)據(jù)

元數(shù)據(jù)被定義為:描述數(shù)據(jù)的數(shù)據(jù),對(duì)數(shù)據(jù)及信息資源的描述性信息。
元數(shù)據(jù)(Metadata)是描述其它數(shù)據(jù)的數(shù)據(jù)(data about other data),或者說(shuō)是用于提供某種資源的有關(guān)信息的結(jié)構(gòu)數(shù)據(jù)(structured data)。元數(shù)據(jù)是描述信息資源或數(shù)據(jù)等對(duì)象的數(shù)據(jù),其使用目的在于:識(shí)別資源;評(píng)價(jià)資源;追蹤資源在使用過(guò)程中的變化;實(shí)現(xiàn)簡(jiǎn)單高效地管理大量網(wǎng)絡(luò)化數(shù)據(jù);實(shí)現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對(duì)使用資源的有效管理。 元數(shù)據(jù)的基本特點(diǎn)主要有:
a)元數(shù)據(jù)一經(jīng)建立,便可共享。元數(shù)據(jù)的結(jié)構(gòu)和完整性依賴于信息資源的價(jià)值和使用環(huán)境;元數(shù)據(jù)的開(kāi)發(fā)與利用環(huán)境往往是一個(gè)變化的分布式環(huán)境;任何一種格式都不可能完全滿足不同團(tuán)體的不同需要;
b)元數(shù)據(jù)首先是一種編碼體系。元數(shù)據(jù)是用來(lái)描述數(shù)字化信息資源,特別是網(wǎng)絡(luò)信息資源的編碼體系,這導(dǎo)致了元數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)編碼體系的根本區(qū)別;元數(shù)據(jù)的最為重要的特征和功能是為數(shù)字化信息資源建立一種機(jī)器可理解框架。
元數(shù)據(jù)體系構(gòu)建了電子政務(wù)的邏輯框架和基本模型,從而決定了電子政務(wù)的功能特征、運(yùn)行模式和系統(tǒng)運(yùn)行的總體性能。電子政務(wù)的運(yùn)作都基于元數(shù)據(jù)來(lái)實(shí)現(xiàn)。其主要作用有:描述功能、整合功能、控制功能和代理功能。
由于元數(shù)據(jù)也是數(shù)據(jù),因此可以用類似數(shù)據(jù)的方法在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和獲取。如果提供數(shù)據(jù)元的組織同時(shí)提供描述數(shù)據(jù)元的元數(shù)據(jù),將會(huì)使數(shù)據(jù)元的使用變得準(zhǔn)確而高效。用戶在使用數(shù)據(jù)時(shí)可以首先查看其元數(shù)據(jù)以便能夠獲取自己所需的信息。
數(shù)據(jù)倉(cāng)庫(kù)
在數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域中,元數(shù)據(jù)按用途分成技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。首先,元數(shù)據(jù)能提供基于用戶的信息,如記錄數(shù)據(jù)項(xiàng)的業(yè)務(wù)描述信息的元數(shù)據(jù)能幫助用戶使用數(shù)據(jù)。其次,元數(shù)據(jù)能支持系統(tǒng)對(duì)數(shù)據(jù)的管理和維護(hù),如關(guān)于數(shù)據(jù)項(xiàng)存儲(chǔ)方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問(wèn)數(shù)據(jù)。具體來(lái)說(shuō),在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,元數(shù)據(jù)機(jī)制主要支持以下五類系統(tǒng)管理功能:
(1)描述哪些數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中;
(2)定義要進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)和從數(shù)據(jù)倉(cāng)庫(kù)中產(chǎn)生的數(shù)據(jù);
(3)記錄根據(jù)業(yè)務(wù)事件發(fā)生而隨之進(jìn)行的數(shù)據(jù)抽取工作時(shí)間安排;
(4)記錄并檢測(cè)系統(tǒng)數(shù)據(jù)一致性的要求和執(zhí)行情況;
(5)衡量數(shù)據(jù)質(zhì)量。
軟件構(gòu)造
軟件構(gòu)造領(lǐng)域的定義在軟件構(gòu)造領(lǐng)域,元數(shù)據(jù)被定義為:在程序中不是被加工的對(duì)象,而是通過(guò)其值的改變來(lái)改變程序的行為的數(shù)據(jù)。它在運(yùn)行過(guò)程中起著以解釋方式控制程序行為的作用。在程序的不同位置配置不同值的元數(shù)據(jù),就可以得到與原來(lái)等價(jià)的程序行為。
圖書(shū)信息
在圖書(shū)館與信息界,元數(shù)據(jù)被定義為:提供關(guān)于信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的數(shù)據(jù),是對(duì)信息資源的結(jié)構(gòu)化的描述。其作用為:描述信息資源或數(shù)據(jù)本身的特征和屬性,規(guī)定數(shù)字化信息的組織,具有定位、發(fā)現(xiàn)、證明、評(píng)估、選擇等功能。
一般認(rèn)為,所謂元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)。從已有的結(jié)論看,元數(shù)據(jù)的含義是逐漸發(fā)展的。元數(shù)據(jù)一詞,早期主要指網(wǎng)絡(luò)資源的描述數(shù)據(jù),用于網(wǎng)絡(luò)信息資源的組織;其后,逐步擴(kuò)大到各種以電子形式存在的信息資源的描述數(shù)據(jù)。元數(shù)據(jù)這一術(shù)語(yǔ)實(shí)際用于各種類型信息資源的描述記錄。
此外,元數(shù)據(jù)在地理界,生命科學(xué)界等領(lǐng)域也有其相應(yīng)的定義和應(yīng)用。

特點(diǎn)
①元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù),它不一定是數(shù)字形式的,可來(lái)自不同的資源。 [1]
②元數(shù)據(jù)是與對(duì)象相關(guān)的數(shù)據(jù),此數(shù)據(jù)使其潛在的用戶不必先具備對(duì)這些對(duì)象的存在和特征的完整認(rèn)識(shí)。 [1]
③元數(shù)據(jù)是對(duì)信息包裹(Information Package)的編碼的描述。 [1]
④元數(shù)據(jù)包含用于描述信息對(duì)象的內(nèi)容和位置的數(shù)據(jù)元素集,促進(jìn)了網(wǎng)絡(luò)環(huán)境中信息對(duì)象的發(fā)現(xiàn)和檢索。 [1]
⑤元數(shù)據(jù)不僅對(duì)信息對(duì)象進(jìn)行描述,還能夠描述資源的使用環(huán)境、管理、加工、保存和使用等方面的情況。 [1]
⑥在信息對(duì)象或系統(tǒng)的生命周期中自然增加元數(shù)據(jù)。 [1]
⑦元數(shù)據(jù)常規(guī)定義中的“數(shù)據(jù)”是表示事務(wù)性質(zhì)的符號(hào),是進(jìn)行各種統(tǒng)計(jì)、計(jì)算、科學(xué)研究、技術(shù)設(shè)計(jì)所依據(jù)的數(shù)值,或是說(shuō)數(shù)字化、公式化、代碼化、圖表化的信息。 [1]
優(yōu)點(diǎn)
對(duì)于一種更簡(jiǎn)單的編程模型來(lái)說(shuō),元數(shù)據(jù)是關(guān)鍵,該模型不再需要接口定義語(yǔ)言 (IDL) 文件、頭文件或任何外部組件引用方法。元數(shù)據(jù)允許 .NET 語(yǔ)言自動(dòng)以非特定語(yǔ)言的方式對(duì)其自身進(jìn)行描述,而這是開(kāi)發(fā)人員和用戶都無(wú)法看見(jiàn)的。另外,通過(guò)使用屬性,可以對(duì)元數(shù)據(jù)進(jìn)行擴(kuò)展。元數(shù)據(jù)具有以下主要優(yōu)點(diǎn):
自描述
公共語(yǔ)言運(yùn)行庫(kù)模塊和程序集是自描述的。模塊的元數(shù)據(jù)包含與另一個(gè)模塊進(jìn)行交互所需的全部信息。元數(shù)據(jù)自動(dòng)提供 COM 中 IDL 的功能,允許將一個(gè)文件同時(shí)用于定義和實(shí)現(xiàn)。運(yùn)行庫(kù)模塊和程序集甚至不需要向操作系統(tǒng)注冊(cè)。結(jié)果,運(yùn)行庫(kù)使用的說(shuō)明始終反映編譯文件中的實(shí)際代碼,從而提高應(yīng)用程序的可靠性。
設(shè)計(jì)
元數(shù)據(jù)提供所有必需的有關(guān)已編譯代碼的信息,以供您從用不同語(yǔ)言編寫(xiě)的 PE 文件中繼承類。您可以創(chuàng)建用任何托管語(yǔ)言(任何面向公共語(yǔ)言運(yùn)行庫(kù)的語(yǔ)言)編寫(xiě)的任何類的實(shí)例,而不用擔(dān)心顯式封送處理或使用自定義的互用代碼。
屬性
.NET Framework 允許您在編譯文件中聲明特定種類的元數(shù)據(jù)(稱為屬性)。在整個(gè) .NET Framework 中到處都可以發(fā)現(xiàn)屬性的存在,屬性用于更精確地控制運(yùn)行時(shí)您的程序如何工作。另外,您可以通過(guò)用戶定義的自定義屬性向 .NET Framework 文件發(fā)出您自己的自定義元數(shù)據(jù)。有關(guān)更多信息,請(qǐng)參見(jiàn)利用屬性擴(kuò)展元數(shù)據(jù)。
意義
說(shuō)到元數(shù)據(jù)的意義,可以從其應(yīng)用目的來(lái)談的。雖然做數(shù)據(jù)倉(cāng)庫(kù)言必稱元數(shù)據(jù),必稱技術(shù)、業(yè)務(wù)元數(shù)據(jù),但其到底用于何處?離開(kāi)了目標(biāo)去談元數(shù)據(jù),就發(fā)現(xiàn)元數(shù)據(jù)包含太多的東西,因?yàn)樗敲枋鰯?shù)據(jù)的數(shù)據(jù)嘛。
還是拿客戶關(guān)系系統(tǒng)來(lái)比喻,這個(gè)系統(tǒng)維護(hù)客戶信息當(dāng)然是有目的的,是要用這些信息進(jìn)行一些自動(dòng)的流程處理、去挖掘一些客戶潛在的價(jià)值、做好客戶服務(wù)。當(dāng)然沒(méi)有必要去維護(hù)客戶的生命特征信息,諸如指紋、犯罪史等,這些信息跟客戶關(guān)系管理的目標(biāo)關(guān)系不大。元數(shù)據(jù)也是如此,你可以將所有數(shù)據(jù)的結(jié)構(gòu)、大小、什么時(shí)間創(chuàng)建、什么時(shí)間消亡、被那些人使用等等,這些信息可以延伸得太廣,如果不管目標(biāo),而試圖去建一個(gè)非常完美的元數(shù)據(jù)管理體系,這是一種絕對(duì)的"自上而下"做法,必?cái)o(wú)疑。
列舉
基于應(yīng)用,可以將元數(shù)據(jù)分成以下的若干種。
數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)集的名稱、關(guān)系、字段、約束等;
數(shù)據(jù)部署:數(shù)據(jù)集的物理位置;
數(shù)據(jù)流:數(shù)據(jù)集之間的流程依賴關(guān)系(非參照依賴),包括數(shù)據(jù)集到另一個(gè)數(shù)據(jù)集的規(guī)則;
質(zhì)量度量:數(shù)據(jù)集上可以計(jì)算的度量;
度量邏輯關(guān)系:數(shù)據(jù)集度量之間的邏輯運(yùn)算關(guān)系;
ETL過(guò)程:過(guò)程運(yùn)行的順序,并行、串行;
數(shù)據(jù)集快照:一個(gè)時(shí)間點(diǎn)上,數(shù)據(jù)在所有數(shù)據(jù)集上的分布情況;
星型模式元數(shù)據(jù):事實(shí)表、維度、屬性、層次等;
報(bào)表語(yǔ)義層:報(bào)表指標(biāo)的規(guī)則、過(guò)濾條件物理名稱和業(yè)務(wù)名稱的對(duì)應(yīng);
數(shù)據(jù)訪問(wèn)日志:哪些數(shù)據(jù)何時(shí)被何人訪問(wèn);
質(zhì)量稽核日志:何時(shí)、何度量被稽核,其結(jié)果;
數(shù)據(jù)裝載日志:哪些數(shù)據(jù)何時(shí)被何人裝載;
標(biāo)準(zhǔn)
1、數(shù)字圖書(shū)館資源組織框架
2. 元數(shù)據(jù)開(kāi)發(fā)應(yīng)用框架
元數(shù)據(jù)的基本意義 Metadata(元數(shù)據(jù))是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”;
元數(shù)據(jù)為各種形態(tài)的數(shù)字化信息單元和資源集合提供規(guī)范、普遍的描述方法和檢索工具;
元數(shù)據(jù)為分布的、由多種數(shù)字化資源有機(jī)構(gòu)成的信息體系(如數(shù)字圖書(shū)館)提供整合的工具與紐帶。
離開(kāi)元數(shù)據(jù)的數(shù)字圖書(shū)館將是一盤(pán)散沙,將無(wú)法提供有效的檢索和處理。
3. 元數(shù)據(jù)應(yīng)用環(huán)境
3.1 Metadata的應(yīng)用目的
(1)確認(rèn)和檢索(Discovery andentification),主要致力于如何幫助人們檢索和確認(rèn)所需要的資源,數(shù)據(jù)元素往往限于作者、標(biāo)題、主題、位置等簡(jiǎn)單信息,Dublin Core是其典型代表。
(2)著錄描述(Cataloging),用于對(duì)數(shù)據(jù)單元進(jìn)行詳細(xì)、全面的著錄描述,數(shù)據(jù)元素囊括內(nèi)容、載體、位置與獲取方式、制作與利用方法、甚至相關(guān)數(shù)據(jù)單元方面等,數(shù)據(jù)元素?cái)?shù)量往往較多,MARC、GILS和FGDC/CSDGM是這類Metadata的典型代表。
(3)資源管理(Resource Administration),支持資源的存儲(chǔ)和使用管理,數(shù)據(jù)元素除比較全面的著錄描述信息外,還往往包括權(quán)利管理(Rights/Privacy Management)、電子簽名(Digital Signature)、資源評(píng)鑒(Seal of Approval/Rating)、使用管理(Access Management)、支付審計(jì)(Payment and Accounting)等方面的信息。
(4)資源保護(hù)與長(zhǎng)期保存(Preservation and Archiving),支持對(duì)資源進(jìn)行長(zhǎng)期保存,數(shù)據(jù)元素除對(duì)資源進(jìn)行描述和確認(rèn)外,往往包括詳細(xì)的格式信息、制作信息、保護(hù)條件、轉(zhuǎn)換方式(Migration Methods)、保存責(zé)任等內(nèi)容。
3.2 Metadata在不同領(lǐng)域的應(yīng)用 根據(jù)不同領(lǐng)域的數(shù)據(jù)特點(diǎn)和應(yīng)用需要,90年代以來(lái),許多Metadata格式在各個(gè)不同領(lǐng)域出現(xiàn)
例如:
網(wǎng)絡(luò)資源:Dublin Core、IAFA Template、CDF、Web Collections
文獻(xiàn)資料:MARC(with 856 Field),Dublic Core
人文科學(xué):TEI Header
社會(huì)科學(xué)數(shù)據(jù)集:ICPSR SGML Codebook
博物館與藝術(shù)作品:CIMI、CDWA、RLG REACH Element Set、VRA Core
政府信息:GILS
地理空間信息:FGDC/CSDGM
數(shù)字圖像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images
檔案庫(kù)與資源集合:EAD
技術(shù)報(bào)告:RFC 1807
連續(xù)圖像:MPEG-7
3.3 Metadata格式的應(yīng)用程度
不同領(lǐng)域的Metadata處于不同的標(biāo)準(zhǔn)化階段:
在網(wǎng)絡(luò)資源描述方面,Dublin Core經(jīng)過(guò)多年國(guó)際性努力,已經(jīng)成為一個(gè)廣為接受和應(yīng)用的事實(shí)標(biāo)準(zhǔn);
在政府信息方面,由于美國(guó)政府大力推動(dòng)和有關(guān)法律、標(biāo)準(zhǔn)的實(shí)行,GILS已經(jīng)成為政府信息描述標(biāo)準(zhǔn),并在世界若干國(guó)家得到相當(dāng)程度的應(yīng)用,與此類似的還有地理空間信息處理的FGDC/CSDGM;
但在某些領(lǐng)域,由于技術(shù)的迅速發(fā)展變化,仍然存在多個(gè)方案競(jìng)爭(zhēng),典型的是數(shù)字圖像的Metadata,提出的許多標(biāo)準(zhǔn)都處于實(shí)驗(yàn)和完善的階段。
3.4 Metadata格式“標(biāo)準(zhǔn)化”程度問(wèn)題
Metadata開(kāi)發(fā)應(yīng)用經(jīng)驗(yàn)表明,很難有一個(gè)統(tǒng)一的Metadata格式來(lái)滿足所有領(lǐng)域的數(shù)據(jù)描述需要;即使在同一個(gè)領(lǐng)域,也可能為了不同目的而需要不同的但可相互轉(zhuǎn)換的Metadata格式。
同時(shí),統(tǒng)一的集中計(jì)劃式的Metadata格式標(biāo)準(zhǔn)也不適合Internet環(huán)境,不利于充分利用市場(chǎng)機(jī)制和各方面力量。
但在同一領(lǐng)域,應(yīng)爭(zhēng)取“標(biāo)準(zhǔn)化”,在不同領(lǐng)域,應(yīng)妥善解決不同格式的互操作問(wèn)題。
4. 元數(shù)據(jù)結(jié)構(gòu)
4.1 總體結(jié)構(gòu)定義方式 一個(gè)Metadata格式由多層次的結(jié)構(gòu)予以定義:
(1)內(nèi)容結(jié)構(gòu)(Content Structure),對(duì)該Metadata的構(gòu)成元素及其定義標(biāo)準(zhǔn)進(jìn)行描述。
(2)句法結(jié)構(gòu)(Syntax Structure),定義Metadata結(jié)構(gòu)以及如何描述這種結(jié)構(gòu)。
(3)語(yǔ)義結(jié)構(gòu)(Semantic Structure),定義Metadata元素的具體描述方法。
4.2 內(nèi)容結(jié)構(gòu)
內(nèi)容結(jié)構(gòu)定義Metadata的構(gòu)成元素,可包括: 描述性元素、技術(shù)性元素、管理性元素、結(jié)構(gòu)性元素(例如與編碼語(yǔ)言、Namespace、數(shù)據(jù)單元等的鏈接)。
這些數(shù)據(jù)元素很可能依據(jù)一定標(biāo)準(zhǔn)來(lái)選取,因此元數(shù)據(jù)內(nèi)容結(jié)構(gòu)中需要對(duì)此進(jìn)行說(shuō)明,例如MARC記錄所依據(jù)的ISBD,EAD所參照的ISAD(G),ICPSR所依據(jù)的ICPSR Data Preparation Manual。
4.3 句法結(jié)構(gòu)
句法結(jié)構(gòu)定義格式結(jié)構(gòu)及其描述方式,例如元素的分區(qū)分段組織、元素選取使用規(guī)則、元素描述方法(例如Dublin Core采用ISO/IEC 11179標(biāo)準(zhǔn))、元素結(jié)構(gòu)描述方法(例如MARC記錄結(jié)構(gòu)、SGML結(jié)構(gòu)、XML結(jié)構(gòu))、結(jié)構(gòu)語(yǔ)句描述語(yǔ)言(例如EBNF Notation)等。
有時(shí),句法結(jié)構(gòu)需要指出元數(shù)據(jù)是否與所描述的數(shù)據(jù)對(duì)象捆綁在一起、或作為單獨(dú)數(shù)據(jù)存在但以一定形式與數(shù)據(jù)對(duì)象鏈接,還可能描述與定義標(biāo)準(zhǔn)、DTD結(jié)構(gòu)和Namespace等的鏈接方式。
4.4 語(yǔ)義結(jié)構(gòu) 語(yǔ)義結(jié)構(gòu)定義元素的具體描述方法,例如 描述元素時(shí)所采用的標(biāo)準(zhǔn)、最佳實(shí)踐(Best Practices)或自定義的描述要求(Instructions)。
有些元數(shù)據(jù)格式本身定義了語(yǔ)義結(jié)構(gòu),而另外一些則由具體采用單位規(guī)定語(yǔ)義結(jié)構(gòu),例如Dublin Core建議日期元素采用ISO 8601、資源類型采用Dublin Core Types、數(shù)據(jù)格式可采用MIME、識(shí)別號(hào)采用URL或DOI或ISBN;
又如OhioLink在使用VRA Core時(shí)要求主題元素使用A&AT、TGM和TGN,人名元素用ULAN。
5. 元數(shù)據(jù)編碼語(yǔ)言與制作方式
5.1 元數(shù)據(jù)編碼語(yǔ)言
元數(shù)據(jù)編碼語(yǔ)言(Metadata Encoding Languages)指對(duì)元數(shù)據(jù)元素和結(jié)構(gòu)進(jìn)行定義和描述的具體語(yǔ)法和語(yǔ)義規(guī)則,常稱為定義描述語(yǔ)言(DDL)。
在元數(shù)據(jù)發(fā)展初期人們常使用自定義的記錄語(yǔ)言(例如MARC)或數(shù)據(jù)庫(kù)記錄結(jié)構(gòu)(如ROADS等),但隨著元數(shù)據(jù)格式的增多和互操作的要求,人們開(kāi)始采用一些標(biāo)準(zhǔn)化的DDL來(lái)描述元數(shù)據(jù),例如SGML和XML,其中以XML最有潛力。
5.2 元數(shù)據(jù)制作方式
(1)專門(mén)編制模塊(例如對(duì)MARC、GILS、FGDC等)
(2)數(shù)據(jù)處理時(shí)自動(dòng)編制(例如對(duì)Dublin Core等)
(3)數(shù)據(jù)物理處理時(shí)自動(dòng)編制(例如數(shù)字圖像掃描時(shí)的某些元數(shù)據(jù)參數(shù))
(4)共享元數(shù)據(jù)(例如OCLC/CORC、IMESH
6. 元數(shù)據(jù)互操作性
6.1 元數(shù)據(jù)互操作性問(wèn)題
由于不同的領(lǐng)域(甚至同一領(lǐng)域)往往存在多個(gè)元數(shù)據(jù)格式,當(dāng)在用不同元數(shù)據(jù)格式描述的資源體系之間進(jìn)行檢索、資源描述和資源利用時(shí),就存在元數(shù)據(jù)的互操作性問(wèn)題(Interoperability):
多個(gè)不同元數(shù)據(jù)格式的釋讀、轉(zhuǎn)換和由多個(gè)元數(shù)據(jù)格式描述的數(shù)字化信息資源體系之間的透明檢索。
6.2 元數(shù)據(jù)格式映射
利用特定轉(zhuǎn)換程序?qū)Σ煌獢?shù)據(jù)元格式進(jìn)行轉(zhuǎn)換,稱為元數(shù)據(jù)映射(Metadata Mapping/Crosswalking)。
已有大量的轉(zhuǎn)換程序存在,供若干流行元數(shù)據(jù)格式之間的轉(zhuǎn)化,例如
Dublin Core與USMARC; Dublin Core與EAD
Dublin Core與GILS; GILS與MARC TEI
Header與MARC FGDC與MARC
也可利用一種中介格式對(duì)同一格式框架下的多種元數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換,例如UNIverse項(xiàng)目利用GRS格式進(jìn)行各種MARC格式和其它記錄格式的轉(zhuǎn)換。格式映射轉(zhuǎn)換準(zhǔn)確、轉(zhuǎn)換效率較高。不過(guò),這種方法在面對(duì)多種元數(shù)據(jù)格式并存的開(kāi)放式環(huán)境中的應(yīng)用效率明顯受到限制。
6.3 標(biāo)準(zhǔn)描述框架
解決元數(shù)據(jù)互操作性的另一種思路是建立一個(gè)標(biāo)準(zhǔn)的資源描述框架,用這個(gè)框架來(lái)描述所有元數(shù)據(jù)格式,那么只要一個(gè)系統(tǒng)能夠解析這個(gè)標(biāo)準(zhǔn)描述框架,就能解讀相應(yīng)的Metadata格式. 實(shí)際上,XML和RDF從不同角度起著類似的作用。
XML通過(guò)其標(biāo)準(zhǔn)的DTD定義方式,允許所有能夠解讀XML語(yǔ)句的系統(tǒng)辨識(shí)用XML_DTD定義的Metadata格式,從而解決對(duì)不同格式的釋讀問(wèn)題。
RDF定義了由Resources、Properties和Statements等三種對(duì)象組成的基本模型,其中Resources和Properties關(guān)系類似于E-R模型,而Statements則對(duì)該關(guān)系進(jìn)行具體描述。
RDF通過(guò)這個(gè)抽象的數(shù)據(jù)模型為定義和使用元數(shù)據(jù)建立一個(gè)框架,元數(shù)據(jù)元素可看成其描述的資源的屬性。
進(jìn)一步地,RDF定義了標(biāo)準(zhǔn)Schema,規(guī)定了聲明資源類型、聲明相關(guān)屬性及其語(yǔ)義的機(jī)制,以及定義屬性與其它資源間關(guān)系的方法。另外,RDF還規(guī)定了利用XML Namespace方法調(diào)用已有定義規(guī)范的機(jī)制。
6.4數(shù)字對(duì)象方式
建立包含元數(shù)據(jù)及其轉(zhuǎn)換機(jī)制的數(shù)字對(duì)象可能從另一個(gè)角度解決元數(shù)據(jù)互操作性問(wèn)題。
Cornell/FEDORA項(xiàng)目提出由內(nèi)核(Structural Kernel)和功能傳播層(Disseminator Layer)組成的復(fù)合數(shù)字對(duì)象。
內(nèi)核里,可以容納以比特流形式存在的文獻(xiàn)內(nèi)容、描述該文獻(xiàn)的元數(shù)據(jù)、以及對(duì)這個(gè)文獻(xiàn)及元數(shù)據(jù)進(jìn)行存取控制的有關(guān)數(shù)據(jù)。
功能傳播層,主功能傳播器(PrimitiveDisseminator)支持有關(guān)解構(gòu)內(nèi)核數(shù)據(jù)類型和對(duì)內(nèi)核數(shù)據(jù)讀取的服務(wù)功能,還可有內(nèi)容類型傳播器(Content-Type Disseminators),它們可內(nèi)嵌元數(shù)據(jù)格式轉(zhuǎn)換機(jī)制。
例如,在一個(gè)數(shù)字對(duì)象的內(nèi)核中存有MARC格式的元數(shù)據(jù),在功能傳播層裝載有請(qǐng)求Dublin Core格式及其轉(zhuǎn)換服務(wù)的內(nèi)容類型傳播器。當(dāng)數(shù)字對(duì)象使用者要求讀取以Dublin Core表示的元數(shù)據(jù)時(shí),相應(yīng)的內(nèi)容類型傳播器將通過(guò)網(wǎng)絡(luò)請(qǐng)求存儲(chǔ)有Dublin Core及其轉(zhuǎn)換服務(wù)程序的數(shù)字對(duì)象,然后將被請(qǐng)求數(shù)字對(duì)象中的MARC形式元數(shù)據(jù)轉(zhuǎn)換為Dublin Core形式,在輸出給用戶。
7. 幾點(diǎn)建議
跟蹤元數(shù)據(jù)發(fā)展、積極參與制定元數(shù)據(jù)標(biāo)準(zhǔn)、加快元數(shù)據(jù)應(yīng)用、注意國(guó)際接軌。
加快研究有效利用元數(shù)據(jù)進(jìn)行檢索(包括異構(gòu)系統(tǒng)透明檢索)、相關(guān)性學(xué)習(xí)、個(gè)性化處理等的機(jī)制。
加快研究元數(shù)據(jù)與數(shù)字對(duì)象和數(shù)字化資源體系有機(jī)整合的途徑與方法。
推進(jìn)研究利用元數(shù)據(jù)進(jìn)行基于知識(shí)的數(shù)據(jù)組織和知識(shí)發(fā)現(xiàn)。
管理編輯 播報(bào)
初期的元數(shù)據(jù)管理通常是在事后由相應(yīng)的元數(shù)據(jù)管理軟件,從已開(kāi)發(fā)完成的應(yīng)用系統(tǒng)中抽取用戶所關(guān)注的各類元數(shù)據(jù),再由人工補(bǔ)錄一些注釋和管理用的屬性。這種模式稱之為基本元數(shù)據(jù)管理,由于存在元數(shù)據(jù)獲取的不及時(shí),存在為了減少工作量有些屬性空缺的風(fēng)險(xiǎn),存在對(duì)應(yīng)用體驗(yàn)支持力度的不足,實(shí)際應(yīng)用并不普遍。在新一代應(yīng)用系統(tǒng)(AS2.0) [2] 中,業(yè)務(wù)功能通常都是由相應(yīng)的構(gòu)件,以人機(jī)交互的形式,通過(guò)在人工業(yè)務(wù)語(yǔ)境的對(duì)話過(guò)程中組裝實(shí)現(xiàn)的。這個(gè)過(guò)程中,不僅完成了業(yè)務(wù)應(yīng)用所需要的應(yīng)用軟件元素,同時(shí)也完成了應(yīng)用軟件元素相對(duì)應(yīng)的元數(shù)據(jù)的采集。這種模式稱之為主動(dòng)元數(shù)據(jù)管理。以下是元數(shù)據(jù)管理的主要功能,后2部分屬于主動(dòng)元數(shù)據(jù)管理的內(nèi)容。
基本管理
元模型管理。利用可視化的用戶體驗(yàn),實(shí)現(xiàn)包括元模型添加、刪除、修改、發(fā)布等維護(hù)功能;并且能讓用戶直觀地了解已有元模型的分類、統(tǒng)計(jì)、使用情況、變更追溯,以及每個(gè)元模型的生命周期管理等等。
元數(shù)據(jù)管理。元數(shù)據(jù)管理實(shí)現(xiàn)針對(duì)元數(shù)據(jù)的基本管理功能。如元數(shù)據(jù)的添加、刪除、修改屬性等維護(hù)功能;元數(shù)據(jù)之間關(guān)系的建立、刪除和跟蹤等關(guān)系維護(hù)功能;提供元數(shù)據(jù)發(fā)布流程管理,可以更好地管理和跟蹤元數(shù)據(jù)的整個(gè)生命周期;元數(shù)據(jù)自身質(zhì)量核查、元數(shù)據(jù)查詢、元數(shù)據(jù)統(tǒng)計(jì)、元數(shù)據(jù)使用情況分析、元數(shù)據(jù)變更、元數(shù)據(jù)版本和生命周期管理等功能。
元數(shù)據(jù)分析。元數(shù)據(jù)分析功能主要實(shí)現(xiàn)針對(duì)元數(shù)據(jù)的基本分析功能。包括血緣分析(血統(tǒng)分析)、影響分析、實(shí)體關(guān)聯(lián)分析、實(shí)體影響分析、主機(jī)拓?fù)浞治?、指?biāo)一致性分析等。
捕獲
為各類應(yīng)用軟件元素提供元數(shù)據(jù)支撐,在相應(yīng)的工具軟件以最佳用戶體驗(yàn)的人機(jī)交互模式,按照嚴(yán)格的邏輯步驟,統(tǒng)一、順序地定義數(shù)據(jù)項(xiàng)、定義表單、定義ETL和加工規(guī)則、定義物理表、定義多維模型、定義展現(xiàn)和結(jié)果數(shù)據(jù)集等等應(yīng)用軟件元素的同時(shí),元數(shù)據(jù)捕獲功能的元數(shù)據(jù)采集接口,及時(shí)地將相應(yīng)的元數(shù)據(jù)收集進(jìn)入元數(shù)據(jù)管理平臺(tái)。替代了基本元數(shù)據(jù)管理需要在事后抽取元數(shù)據(jù)的作法,而在應(yīng)用軟件元素生成的同時(shí),就加載并形成了與其相關(guān)的各種元數(shù)據(jù)。
服務(wù)
各類應(yīng)用軟件元素產(chǎn)生的元數(shù)據(jù)進(jìn)入元數(shù)據(jù)平臺(tái)后,元數(shù)據(jù)管理可通過(guò)元數(shù)據(jù)服務(wù)功能,為需要這些元數(shù)據(jù)的工具軟件或構(gòu)件提供元數(shù)據(jù)服務(wù)。如將前面所述的各種工具軟件的定義結(jié)果,以相應(yīng)的標(biāo)準(zhǔn)協(xié)議進(jìn)行打包形成方案(應(yīng)用腳本),提供給其它應(yīng)用環(huán)境中的物理表建立工具、ETL工具、多維模型建立工具、結(jié)果展現(xiàn)工具等底層工具,從而實(shí)現(xiàn)應(yīng)用的重用和共享。同時(shí),元數(shù)據(jù)服務(wù)還可為業(yè)務(wù)應(yīng)用功能提供輔助的元數(shù)據(jù)幫助信息,如業(yè)務(wù)功能中加工結(jié)果和指標(biāo)的說(shuō)明、提示,及其血緣分析等,讓用戶可明確、直觀地了解數(shù)據(jù)的來(lái)源、加工過(guò)程及加工算法等信息。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-437192.html

到了這里,關(guān)于元數(shù)據(jù)(Metadata),又稱中介數(shù)據(jù)、中繼數(shù)據(jù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包