1、概論
????知識(shí)圖譜(KnowledgeGraph)以結(jié)構(gòu)化的形式描述客觀世界中的概念實(shí)體及其關(guān)系,將互聯(lián)網(wǎng)的信息表達(dá)成更接近人類認(rèn)知世界的形式,提供了一種更好地組織,管理和理解互聯(lián)網(wǎng)海量信息的能力。
????知識(shí)圖譜關(guān)注概念,實(shí)體及其關(guān)系,其中實(shí)體是客觀世界中的事物,概念是對(duì)具有相同屬性的事物的概括和抽象。本體是知識(shí)圖譜的知識(shí)表示基礎(chǔ),可以形式化表示為O={C,H,P,A,I},C為概念集合,如事務(wù)性概念和事件類概念,Hshi概念的上下位關(guān)系集合,P是屬性集合,描述概念所具有的特征,A是規(guī)則集合,描述領(lǐng)域規(guī)則,I是實(shí)例集合,描述實(shí)例-屬性-值。
2、什么是知識(shí)圖譜?
知識(shí)圖譜的定義:“知識(shí)圖譜本質(zhì)上是語(yǔ)義網(wǎng)絡(luò)(Semantic Network
)的知識(shí)庫(kù)”。換個(gè)角度,從實(shí)際應(yīng)用的角度出發(fā)其實(shí)可以簡(jiǎn)單地把知識(shí)圖譜理解成多關(guān)系圖(Multi-relational Graph
)。
什么是對(duì)關(guān)系圖?
圖(Graph)是由節(jié)點(diǎn)(Vertex)和邊(Edge)來構(gòu)成,但這些圖通常只包含一種類型的節(jié)點(diǎn)和邊。多關(guān)系圖一般包含多種類型的節(jié)點(diǎn)和多種類型的邊。
- 知識(shí)圖譜中,我們通用“
實(shí)體(Entity)
”來表達(dá)圖中的節(jié)點(diǎn),用“關(guān)系(Relation)
”來表達(dá)圖中的邊; - 實(shí)體指的是顯示世界中的事物比如人、地名、概念、藥物、公司等,關(guān)系則用來表達(dá)不同實(shí)體之間的某種聯(lián)系。
李小龍的關(guān)系圖譜:
????從數(shù)據(jù)角度來看,知識(shí)圖譜通過對(duì)結(jié)果化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理、抽取、整合,轉(zhuǎn)化成“實(shí)體—關(guān)系—實(shí)體”的三元組。
3、知識(shí)圖譜能做什么?
????這個(gè)問題的答案是非常寬泛的,如果從一個(gè)知識(shí)庫(kù)或者數(shù)據(jù)庫(kù)的角度來看,知識(shí)圖譜可以是任何系統(tǒng)的基礎(chǔ)工程,涉及到存儲(chǔ)、記憶、分析和智能的東西,都可以應(yīng)用知識(shí)圖譜。知識(shí)圖譜首先是一個(gè)規(guī)模龐大的數(shù)據(jù)庫(kù)(或者說知識(shí)庫(kù)),百萬級(jí)、億級(jí)的數(shù)據(jù)相互關(guān)聯(lián),可以從更多維度對(duì)事物進(jìn)行更精確的分析。
知識(shí)圖譜可以用于以下幾個(gè)領(lǐng)域:
- 語(yǔ)義網(wǎng)和智能問答:知識(shí)圖譜可以作為語(yǔ)義網(wǎng)的基礎(chǔ),提供一種描述現(xiàn)實(shí)世界中實(shí)體、概念以及它們之間關(guān)系的方法,使得計(jì)算機(jī)能夠理解并處理這些信息,從而為智能問答提供支持。
- 自然語(yǔ)言處理:知識(shí)圖譜可以用于自然語(yǔ)言處理中的語(yǔ)義分析和理解,通過對(duì)文本中的實(shí)體、概念以及它們之間關(guān)系的識(shí)別和抽取,提高自然語(yǔ)言處理的準(zhǔn)確性和效率。
- 人工智能和機(jī)器學(xué)習(xí):知識(shí)圖譜可以用于提高機(jī)器學(xué)習(xí)算法的準(zhǔn)確性和效率,通過對(duì)知識(shí)的抽取和表示,幫助機(jī)器更好地理解和處理數(shù)據(jù)。
- 生物信息學(xué)和社交網(wǎng)絡(luò)分析:知識(shí)圖譜可以用于描述和分析生物信息學(xué)中的基因、蛋白質(zhì)和疾病等實(shí)體之間的關(guān)系,以及社交網(wǎng)絡(luò)中的用戶、信息和關(guān)系等。
- 推薦系統(tǒng):知識(shí)圖譜可以用于構(gòu)建推薦系統(tǒng),通過對(duì)用戶興趣和行為的建模,提供個(gè)性化的推薦服務(wù)。
- 搜索和信息檢索:知識(shí)圖譜可以用于提高搜索和信息檢索的準(zhǔn)確性和效率,通過對(duì)用戶查詢的理解和分析,提供更相關(guān)的結(jié)果。
4、知識(shí)圖譜的技術(shù)路線圖
????知識(shí)圖譜有廣泛的應(yīng)用和巨大的應(yīng)用價(jià)值,越來越多的企業(yè)也在著手進(jìn)行知識(shí)圖譜的構(gòu)建。
????按流程來說,知識(shí)圖譜具有知識(shí)表示與建模、知識(shí)抽取、知識(shí)融合、知識(shí)圖譜推理、知識(shí)統(tǒng)計(jì)與圖挖掘、知識(shí)檢索與知識(shí)分析等主要的幾步。
5、知識(shí)圖譜構(gòu)建
5.1、構(gòu)建知識(shí)圖譜的生命周期
構(gòu)建知識(shí)圖譜的生命周期:Schema 定義、知識(shí)抽取、知識(shí)融合、知識(shí)存儲(chǔ)、知識(shí)推理這樣的循環(huán)迭代的過程。
-
什么是本體?
????Ontology:通常翻譯為“本體”。本體本身是個(gè)哲學(xué)名詞。在上個(gè)世紀(jì)80年代,人工智能研究人員將這一概念引入了計(jì)算機(jī)領(lǐng)域。Tom Gruber 把本體定義為“概念和關(guān)系的形式化描述”。通俗點(diǎn)講,本體相似于數(shù)據(jù)庫(kù)中的 Schema ,比如足球領(lǐng)域,主要用來定義類和關(guān)系,以及類層次和關(guān)系層次等。OWL 是最常用的本體描述語(yǔ)言。本體通常被用來為知識(shí)圖譜定義 Schema 。
舉個(gè)例子:
張三是一個(gè)實(shí)體,其具有年齡、性別、職業(yè)等屬性;
同時(shí),張三是一個(gè)人,“人類”就是一個(gè)概念、類似的還有“國(guó)家”,“民族”等抽象概念;
本體是概念的集合,知識(shí)圖譜本體層的東西就是各種概念及其屬性和關(guān)系。
5.2、Schema定義
- Schema 是什么?
限定待加入知識(shí)圖譜數(shù)據(jù)的格式;相當(dāng)于某個(gè)領(lǐng)域內(nèi)的數(shù)據(jù)模型,包含了該領(lǐng)域內(nèi)有意義的概念類型以及這些類型的屬性。 - Schema 有什么作用?
規(guī)范結(jié)構(gòu)化數(shù)據(jù)的表達(dá),一條數(shù)據(jù)必須滿足Schema預(yù)先定義好的實(shí)體對(duì)象及其類型,才被允許更新到知識(shí)圖譜中。
5.3、知識(shí)抽取
????從各種數(shù)據(jù)源中進(jìn)行實(shí)體識(shí)別、關(guān)系識(shí)別,從而抽取實(shí)體、關(guān)系、屬性以及實(shí)體間的關(guān)系,屬性的值,完成本體的知識(shí)表達(dá),具體可以參照前文關(guān)于知識(shí)庫(kù)的表達(dá)部分。對(duì)于知識(shí)圖譜來說,數(shù)據(jù)源我們知道有結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
數(shù)據(jù)來源一般有:
- 業(yè)務(wù)的關(guān)系數(shù)據(jù),這些數(shù)據(jù)通常包含在公司內(nèi)數(shù)據(jù)庫(kù)中;一般是結(jié)構(gòu)化數(shù)據(jù),或者是系統(tǒng)交互中Jison數(shù)據(jù),雖然沒有結(jié)構(gòu)化,但是仍然可以通過功能進(jìn)行存儲(chǔ),這種數(shù)據(jù)一般定義好本體庫(kù)可以直接使用;
- 網(wǎng)上公開發(fā)布的可以抓取的數(shù)據(jù),通常以網(wǎng)頁(yè)形式存在,這種一般要通過爬蟲技術(shù),通過本體庫(kù)相關(guān)關(guān)鍵詞進(jìn)行數(shù)據(jù)的爬取并結(jié)構(gòu)化;
- 相關(guān)合同、文件等,比如一些保險(xiǎn)合同、電子發(fā)票信息等;這種一般需要自然語(yǔ)言處理技術(shù),進(jìn)行數(shù)據(jù)信息的結(jié)構(gòu)化提取。
信息的抽取是知識(shí)圖譜構(gòu)建的第一步,關(guān)鍵的點(diǎn)是:如何從數(shù)據(jù)源中自動(dòng)抽取到實(shí)體、關(guān)系、以及屬性等機(jī)構(gòu)化技術(shù)。
實(shí)體抽取又稱為實(shí)體識(shí)別,就是從文本中自動(dòng)識(shí)別出來命名的實(shí)體,它是信息抽取中最基礎(chǔ)的部分。
關(guān)系抽取就是進(jìn)行語(yǔ)義的識(shí)別,抽取到實(shí)體間的關(guān)系,這個(gè)是信息抽取中最關(guān)鍵的部分,也是形成網(wǎng)狀知識(shí)結(jié)構(gòu)的基礎(chǔ)。
關(guān)系的識(shí)別運(yùn)用到各種算法模型以及機(jī)器學(xué)習(xí)的方法,屬性抽取實(shí)現(xiàn)的是實(shí)體屬性的完整勾勒。
5.4、知識(shí)融合
主要是新知識(shí)的融合、整合、判別同義、近義、消除歧義、矛盾。
比如,某些實(shí)體數(shù)據(jù)在顯示世界中有多種表達(dá)方式,公司的注冊(cè)名稱、公司的簡(jiǎn)稱等,要對(duì)這些知識(shí)進(jìn)行同義融合,再比如某些特定的稱謂也許對(duì)應(yīng)著多個(gè)不同的實(shí)體。
知識(shí)融合包括兩部分:實(shí)體鏈接和知識(shí)合并。
- 實(shí)體鏈接:是指對(duì)于從文本中抽取得到的實(shí)體對(duì)象,將其鏈接到知識(shí)庫(kù)中對(duì)應(yīng)的正確實(shí)體對(duì)象的操作。一般是從知識(shí)庫(kù)中選中一些候選的對(duì)象,然后通過相似度將指定對(duì)象鏈接到正確的實(shí)體。流程如下:通過實(shí)體抽取獲取實(shí)體指稱項(xiàng)——通過實(shí)體消歧(解決同名實(shí)體歧義)和共指消解(多個(gè)指稱指向同一實(shí)體進(jìn)行相應(yīng)的合并)——將實(shí)體指稱鏈接到知識(shí)庫(kù)對(duì)應(yīng)實(shí)體。
- 知識(shí)合并:從第三方知識(shí)庫(kù)產(chǎn)品或是已有的結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行知識(shí)的獲取,一般是合并外部知識(shí)庫(kù)和和合并關(guān)系數(shù)據(jù)庫(kù),合并中要避免實(shí)體與關(guān)系的沖突問題,防止不必要的冗余。
5.5、知識(shí)存儲(chǔ)
知識(shí)圖譜主要有兩種存儲(chǔ)方式:一種是基于 RDF 的存儲(chǔ);另一種是基于圖數(shù)據(jù)庫(kù)的存儲(chǔ)。它們之間的區(qū)別如下圖所示。RDF 一個(gè)重要的設(shè)計(jì)原則是數(shù)據(jù)的易發(fā)布以及共享,圖數(shù)據(jù)庫(kù)則把重點(diǎn)放在了高效的圖查詢和搜索上。其次,RDF 以三元組的方式來存儲(chǔ)數(shù)據(jù)而且不包含屬性信息,但圖數(shù)據(jù)庫(kù)一般以屬性圖為基本的表示形式,所以實(shí)體和關(guān)系可以包含屬性,這就意味著更容易表達(dá)現(xiàn)實(shí)的業(yè)務(wù)場(chǎng)景。
知識(shí)存儲(chǔ),就是如何選擇數(shù)據(jù)庫(kù),從選擇層面,我們有圖數(shù)據(jù)庫(kù),有NoSQL的數(shù)據(jù)庫(kù),也有關(guān)系型數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)有很多選擇。具體什么樣的情況下選擇什么樣的數(shù)據(jù)庫(kù)?通常是如果說知識(shí)圖譜的關(guān)系結(jié)構(gòu)非常的復(fù)雜、關(guān)系非常的多,這時(shí)候建議使用這個(gè)圖數(shù)據(jù)庫(kù),比如Neo4J這樣的數(shù)據(jù)庫(kù)。順便了解一下目前主流的幾款圖數(shù)據(jù)庫(kù),Titan、Graph Engine、Neo4J這個(gè)三個(gè)分別都是開源的,然后Titan是Apache旗下的,Graph Engine是MIT的License,Neo4J是GPL開源的,既有商業(yè)版,也有也有開源免費(fèi)版。然后它們的平臺(tái),像Titan是Linux,Graph是windows。而數(shù)據(jù)的支撐量級(jí),像Titan是后端存儲(chǔ),基于Cassandra/Hbase/BDB這樣的分布式存儲(chǔ)引擎,可以支持更大的數(shù)據(jù)量,千億級(jí)的數(shù)據(jù)量級(jí);Neo4J商業(yè)版也可以支持到百億級(jí)的,但是它的非商業(yè)版在數(shù)據(jù)量級(jí)比較大的時(shí)候,一般是在幾千萬級(jí)的時(shí)候就可能會(huì)出現(xiàn)一些問題。
5.6、知識(shí)推理
知識(shí)推理這邊有幾種方法,基于符號(hào)的推理、基于 OWL 本體的推理、基于圖的方法(PRA算法)、基于分布式知識(shí)語(yǔ)義 標(biāo)識(shí)方法(Trans系列模型)、TransR 模型、基于深度學(xué)習(xí)的推理。
知識(shí)圖譜不僅僅是根據(jù)關(guān)系的檢索,更大的核心用途是推理,發(fā)現(xiàn)圖譜中的隱藏關(guān)系,而不是發(fā)現(xiàn)新知識(shí)。
1)通過實(shí)體間的關(guān)系推理相關(guān)關(guān)系
通過多實(shí)體間的關(guān)系,可以推斷其他的關(guān)系,比如張三和李四之間是夫妻關(guān)系,王五是張三的領(lǐng)導(dǎo),王五居住在A城市,我們可以推論李四也居住在A城市。
2)通過實(shí)體間的關(guān)系推理相關(guān)屬性
通過多實(shí)體間的關(guān)系,實(shí)體的屬性值,可以推斷其實(shí)體的屬性值。這個(gè)與通過實(shí)體間的關(guān)系推論關(guān)系道理類似,也可以通過一個(gè)實(shí)體間的關(guān)系、根據(jù)實(shí)體的屬性推斷另一個(gè)實(shí)體的屬性。
在AI中涉及到推理的方法有很多,有基于邏輯的推理,有基于深度學(xué)習(xí)的推——這個(gè)就是基于圖譜的推理,也就是通過關(guān)系、屬性的因素做的推理。
6、知識(shí)圖譜應(yīng)用
????在知識(shí)圖譜的應(yīng)用階段已經(jīng)簡(jiǎn)要說明了通用領(lǐng)域知識(shí)圖譜和專用領(lǐng)域知識(shí)圖譜的應(yīng)用,這里只聚焦其中三項(xiàng)技術(shù):搜素、問答系統(tǒng)、推薦系統(tǒng)。
6.1 搜索
????知識(shí)圖譜依托龐大的數(shù)據(jù)和關(guān)系對(duì),可以對(duì)搜索進(jìn)行增強(qiáng),不但針對(duì)搜索詞展示出最接近的信息,還把相關(guān)的選項(xiàng)也展示出來,提高了查準(zhǔn)率和查全率,另外可以通過圖譜化的展現(xiàn)和互動(dòng)讓用戶更加方便的了解信息。
????一個(gè)語(yǔ)義搜索系統(tǒng)的基本框架包括查詢構(gòu)建、查詢處理、結(jié)果展示、查詢優(yōu)化、語(yǔ)義模型、資源及文檔等。
????具體的應(yīng)用中,如搜索“混凝土”,不僅搜索混凝土,還會(huì)找到其在知識(shí)圖譜中的上位詞,下位詞,同義詞等詞集合,比如砼(同義詞)、輕質(zhì)混凝土(下位詞)等等。
6.2 問答系統(tǒng)(可整合 ChatGPT 語(yǔ)言模型)
????知識(shí)問答是用自然語(yǔ)言的方式與機(jī)器進(jìn)行交互并得到答案,是知識(shí)圖譜的重要應(yīng)用。問答是一種典型的智能行為,圖靈測(cè)試就是看機(jī)器能否做到人一樣的問答效果。問答系統(tǒng)不但要求系統(tǒng)本身能夠理解提問者的語(yǔ)義,還要求根據(jù)知識(shí)圖譜進(jìn)行知識(shí)搜索或知識(shí)推理以形成答案??梢哉f問答系統(tǒng)是信息檢索系統(tǒng)的一種高級(jí)形式,因?yàn)閱柎鹣到y(tǒng)中同樣有查詢式理解和知識(shí)檢索這兩個(gè)重要過程,且與智能搜索中相應(yīng)過程中的相關(guān)細(xì)節(jié)是一致的。
一個(gè)問答系統(tǒng)應(yīng)具備的四大要素:
(1)問題
是問答系統(tǒng)的輸入,通常以問句的形式出現(xiàn)(問答題),也會(huì)采用選擇題、多選題、列舉答案題和填空題等形式。
(2)答案
是問答系統(tǒng)的輸出,除了文本表示的答案(問答題或填空題),有時(shí)也需要輸出一組答案(列舉問答題)、候選答案的選擇(選擇題)、甚至是多媒體信息。
(3)智能體
是問答系統(tǒng)的執(zhí)行者,需要理解問題的語(yǔ)義,掌握并使用知識(shí)庫(kù)解答問題,并最終生成人可讀的答案;
(4)知識(shí)庫(kù)
存儲(chǔ)了問答系統(tǒng)的知識(shí),其形態(tài)可以是文本、數(shù)據(jù)庫(kù)或知識(shí)圖譜。
問答系統(tǒng)框架:
6.3 推薦系統(tǒng)
????推薦系統(tǒng)是我們每天都能接觸到的系統(tǒng),如淘寶的千人千面,網(wǎng)易云音樂的個(gè)性化歌單,目前的個(gè)性化推薦算法中應(yīng)用最廣的是協(xié)同過濾算法。
????協(xié)同過濾分為協(xié)同和過濾兩個(gè)步驟,協(xié)同就是利用群體的行為來做推薦決策,而過濾就是從可行的推薦方案中將用戶最喜歡的方案找出來。通過群體的協(xié)同和每個(gè)用戶是否喜歡推薦的反饋不斷迭代,最終的推薦會(huì)越來越準(zhǔn)確。當(dāng)前協(xié)同過濾算法主要包括基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾,其核心是怎么計(jì)算標(biāo)的物之間的相似度以及用戶之間的相似度。
????將與當(dāng)前用戶最相似的用戶喜歡的標(biāo)的物推薦給該用戶,這就是基于用戶的協(xié)同過濾的核心思想;將用戶操作過的標(biāo)的物最相似的標(biāo)的物推薦給用戶,這就是基于標(biāo)的物的協(xié)同過濾的核心思想。
推薦的過程可以簡(jiǎn)單理解為三個(gè)步驟:召回、過濾、排序。
- 首先系統(tǒng)根據(jù)獲取到的信息,召回適合推薦內(nèi)容,獲取的信息可以是用戶的搜索記錄、購(gòu)買記錄、評(píng)論等。
- 召回的內(nèi)容中有的是這個(gè)用戶不關(guān)注的,需要根據(jù)過濾的條件,將不需要的內(nèi)容進(jìn)行過濾。
- 經(jīng)過過濾產(chǎn)生的推薦集還需要根據(jù)內(nèi)容的相關(guān)度進(jìn)行排序,最后系統(tǒng)根據(jù)相關(guān)度的排序,將內(nèi)容分配到對(duì)應(yīng)的模塊,這樣用戶就能看到自己感興趣的內(nèi)容了。
基于協(xié)同過濾的推薦系統(tǒng),主要有以下問題:
- 數(shù)據(jù)稀疏/長(zhǎng)尾/噪音問題
用于協(xié)同過濾計(jì)算的用戶行為矩陣(用戶和其對(duì)應(yīng)有交互(如購(gòu)買,點(diǎn)贊,收藏等)的物品矩陣),必然是一個(gè)稀疏矩陣,用較小范圍的數(shù)據(jù)推測(cè)較大范圍的數(shù)據(jù),會(huì)存在預(yù)測(cè)不準(zhǔn)確的問題。 - 冷啟動(dòng)問題
對(duì)于新加入的用戶或者物品,系統(tǒng)沒有其歷史交互信息,很難對(duì)其進(jìn)行準(zhǔn)確建模和推薦,相對(duì)應(yīng)的推薦準(zhǔn)確率和多樣性也會(huì)大打折扣。 - 可解釋性
協(xié)同過濾算法側(cè)重輸入和輸出,與神經(jīng)網(wǎng)絡(luò)模型一樣類似于一個(gè)黑盒,計(jì)算模型提煉出的有效特征是什么很難說明,即決策的依據(jù)模糊,缺乏可解釋性。
????知識(shí)圖譜可以針對(duì)這些問題進(jìn)行改善,知識(shí)圖譜可以用來表示實(shí)體之間的關(guān)系,如推薦系統(tǒng)中物品與物品、用戶與物品、用戶與用戶之間的關(guān)系。文章來源:http://www.zghlxwxcb.cn/news/detail-505587.html
7、圖譜建設(shè)的一些經(jīng)驗(yàn)
我們?cè)谥R(shí)圖譜建設(shè)當(dāng)中的一些經(jīng)驗(yàn):文章來源地址http://www.zghlxwxcb.cn/news/detail-505587.html
- 第一,界定好范圍,就是要有一個(gè)明確的場(chǎng)景和問題的定義,不能說為了知識(shí)圖譜而知識(shí)圖譜。如果沒有想清楚知識(shí)圖譜有什么樣的應(yīng)用的場(chǎng)景,或者能解決什么樣的問題,這樣的知識(shí)圖譜是比較難以落地的。一些明確的場(chǎng)景,比如解決商品數(shù)據(jù)的搜索問題,或者從產(chǎn)品說明書里面做相關(guān)問題的回答。
- 第二,做好schema的定義,就是上面講到的對(duì)于schema或者本體的定義。第一步確定好場(chǎng)景和問題以后,就基于這樣的場(chǎng)景或者問題,再進(jìn)行相關(guān)領(lǐng)域的schema的定義。定義這個(gè)領(lǐng)域里概念的層次結(jié)構(gòu)、概念之間的關(guān)系的類型,這樣做是確保整個(gè)知識(shí)圖譜是比較嚴(yán)謹(jǐn)?shù)?,知識(shí)的準(zhǔn)確性是比較可靠的。知識(shí)的模型的定義,或者schema的定義,大部分情況下是通過這個(gè)領(lǐng)域的知識(shí)專家的參與,自上而下的方式去定義的。
- 第三,數(shù)據(jù)是知識(shí)圖譜構(gòu)建基礎(chǔ)。數(shù)據(jù)的梳理就比較重要,最需要什么樣的數(shù)據(jù)?依賴于我們要解決的問題是什么,或者我們的應(yīng)用場(chǎng)景是什么?基于問題和場(chǎng)景,梳理出領(lǐng)域相關(guān)的問題、相關(guān)的數(shù)據(jù),包括結(jié)構(gòu)化的數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、無結(jié)構(gòu)化的數(shù)據(jù),結(jié)合百科跟這個(gè)領(lǐng)域相關(guān)的數(shù)據(jù),領(lǐng)域的詞典,或者領(lǐng)域?qū)<业慕?jīng)驗(yàn)的規(guī)則。
- 第四,不要重復(fù)去造輪子,很多百科的數(shù)據(jù)和開放知識(shí)圖譜的數(shù)據(jù),是可以融合到我們的領(lǐng)域知識(shí)圖譜中。
- 第五,要有驗(yàn)證和反饋機(jī)制,需要有管理后臺(tái),用戶可以不斷的和知識(shí)圖譜系統(tǒng)進(jìn)行交互,不斷的進(jìn)行確認(rèn)和驗(yàn)證,確保知識(shí)圖譜每一步推理和計(jì)算都是準(zhǔn)確的。
- 第六,知識(shí)圖譜構(gòu)建是持續(xù)迭代的系統(tǒng)工程,不可能一蹴而就。
到了這里,關(guān)于知識(shí)圖譜相關(guān)概念整理的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!