模型化- 數(shù)字化轉(zhuǎn)型的重要基石?
? ? ?在各行各業(yè)推行數(shù)字化轉(zhuǎn)型過程中,構(gòu)建信息化模型十分重要,它是數(shù)字化轉(zhuǎn)型的基石。事實上,數(shù)字化轉(zhuǎn)型的核心是“萬物皆模型”,在工業(yè)領(lǐng)域,以德國為主導(dǎo)的工業(yè)4.0 發(fā)展進程中,標(biāo)準(zhǔn)信息模型的構(gòu)建是主要工作之一。他們提出了資產(chǎn)管理殼模型的概念和一系列標(biāo)準(zhǔn)。并且著力于各種物理設(shè)備,軟件服務(wù)等數(shù)字化模型的構(gòu)建。步伐穩(wěn)健又迅速。在產(chǎn)品研發(fā)階段重點發(fā)展基于AutomationML語言的建模,而現(xiàn)場控制領(lǐng)域正逐步推廣OPCUA 信息化模型和協(xié)議的應(yīng)用。
? ? 所有的信息模型幾乎都是采用了形式化語言描述的結(jié)構(gòu)化數(shù)據(jù)。并且清晰地定義了模型的語義。使信息模型能夠被機器和軟件準(zhǔn)確地理解和一致性性訪問。主要的描述語言是XML 語言,鑒于JSON語言的處理簡潔性,也有部分模型使用JSON格式描述。
共識-語言的基礎(chǔ)
? ? ? ? 語言的核心是語法和語義。 對于人類自然語言而言,語法和語義都不是非常規(guī)范的。有時候是模糊的含義和簡化的語法。人類依靠“社會俗稱規(guī)約”相互理解。但是在大語言模型(LLM)還沒有出現(xiàn)之前,機器仍然無法準(zhǔn)確地使用自然語言相互交流。于是人類創(chuàng)建了各種形式化語言,它們具有嚴(yán)格的語法和語義定義。這種形式化語言是人類自然語言的一個子集。消除了自然語言的二義性。
? 機器之間交換信息的方式也受到嚴(yán)格的定義,這便是通信協(xié)議(protocol)。因此,語法,語義和協(xié)議是機器交流信息的三要素。
? ? ?推廣一種形式化機器語言的關(guān)鍵是語言的標(biāo)準(zhǔn)化及其推廣。使用者之間達成共識。流行的機器之間的語言包括 modebus,TCP/IP,CAN,OPC UA ,,AutomationML,工業(yè)4.0 知產(chǎn)管理殼等等語言和協(xié)議。
萬物皆模型-并非易事
? ? ? ? 從技術(shù)的角度來看,構(gòu)建各種資產(chǎn)的數(shù)字化模型并不存在什么障礙?,F(xiàn)代IT技術(shù)提供了各種方法和工具。但是實現(xiàn)“萬物皆模型”的目標(biāo)卻并非易事。
? ? ? 采用開放的數(shù)字模型,意味著各利益方打破了原有的護城河,大公司除非找到了新的技術(shù)壁壘,它們不會輕易地?fù)肀ч_放系統(tǒng)。
? ?數(shù)字化模型的生態(tài)沒有形成之前,個別公司或者個別項目中采用基于模型的設(shè)計方法可能比傳統(tǒng)設(shè)計工作量更大。學(xué)習(xí)和采納模型化設(shè)計方法的意愿不足。而且難以達成共識!
? ? ? 由于缺乏廣泛的用戶,模型化設(shè)計的工具軟件短缺。
? ? 構(gòu)建資產(chǎn)數(shù)字化模型需要專業(yè)領(lǐng)域的專家與自動控制與IT行業(yè)專家的通力合作。在德國和歐洲,這些行業(yè)的數(shù)字化模型是由專業(yè)的行業(yè)協(xié)會發(fā)起并組織實施的。而我國的行業(yè)協(xié)會不具備這樣的組織能力。
? ? ? ? ?由此可見,構(gòu)建制造業(yè)資產(chǎn)數(shù)字化模型是一件說說容易,干起來費勁的事情。筆者看來,至今沒有找到可行的方法。
? ? ? ?我們需要尋找一種方法,實現(xiàn)便捷,低成本,大批量地構(gòu)建數(shù)字化模型。只有模型庫非常豐富之后,人們才會喜歡使用基于模型的設(shè)計,生態(tài)才會形成。
大語言模型LLM-建模的新工具
? ? ? ? 大語言模型的出現(xiàn),極大地提升了機器理解人類自然語言的能力。人們似乎看到了希望,是否能夠直接使用自然語言提示大語言模型自動建立資產(chǎn)的數(shù)字化模型呢?
? ? ?人們普遍對LLM 的能力預(yù)期過高,讓它回答刁鉆的問題,一旦chatGPT答非所問,又對LLM失去了信心。對于LLM 編程寫代碼這樣的事情同樣是如此,一開始就讓它直接寫計算機程序。對于LLM 產(chǎn)生的錯誤再嘲笑一番。
? ? ?令人遺憾的是目前大模型目前還不能完成這項工作。由于工業(yè)領(lǐng)域的資產(chǎn)描述內(nèi)容繁多,準(zhǔn)確性和一致性要求非常高。而大語言模型構(gòu)建的模型會出現(xiàn)一定概率的差異性。
?????????
中間語言-AI時代的建模方法
? ? 語言大模型基于模型模板(template)構(gòu)建模型。而不是基于schema或者元模型規(guī)范來建立模型。因此,除非有大量的模板供LLM 學(xué)習(xí),直接生成形式化的模型比較困難。
????????同樣地,LLM 生成程序代碼也是基于代碼的實例來構(gòu)建代碼的。由于網(wǎng)絡(luò)上程序代碼比較多,所以效果要好一點,但是如果需要實現(xiàn)比較復(fù)雜的控制算法,它就無能為力了,除非是已有的標(biāo)準(zhǔn)算法。目前的許多程序代碼沒有詳細的注解和描述,LLM 能夠?qū)W習(xí)語言的語法,卻難以理解語義。
? ? ?以筆者的觀點,如果要讓LLM 生成形式化的模型文本或者復(fù)雜的程序代碼,使用中間語言更加有效。
????????所謂中間語言(模型)是指一個介于自然語言和形式化語言之間的語言,它有利于從自然語言描述轉(zhuǎn)換,有能夠轉(zhuǎn)化成為標(biāo)準(zhǔn)化的機器可讀的程序或者模型。
? ? LLM 的出現(xiàn)使機器理解自然語言的能力大幅度提升,它對語言的語法要求降低了,另一方面,自然語言能夠表達語義明確的內(nèi)容,比如:
- 我要吃飯
- 我想吃飯
- 我想要吃飯
? ? ? 這三句話表達的含義是一致的,明確的。所以說,自然語言完全能夠準(zhǔn)確的描述事物(模型),只是需要有一定的表達能力和邏輯性(或者說限制)就可以了。要比計算機的形式化語言的簡單的多。使用中間語言建立自然語言和機器語言之間的橋梁是可行的方法。
? ??
? ? ? ? ?LLM 最擅長的是自然語言的理解和生成,但是它要完成復(fù)雜的AI能力,仍然需要使用各種傳統(tǒng)的IT工具,比如網(wǎng)絡(luò)搜索,數(shù)據(jù)庫,軟件工具。才能完成復(fù)雜的AI任務(wù)。所謂智能體是通過自然語言連接起來的工具鏈(langchain)實現(xiàn)的,我們已有的所有IT技術(shù)是AI的基礎(chǔ)。其中包括工業(yè)自動化行業(yè)的各種標(biāo)準(zhǔn),建模方法和理論。
? ? ? 許多人沒有將大語言模型和大語言模型的應(yīng)用程序區(qū)分開來,其實許多所謂的大模型是大模型的應(yīng)用,它通過大模型調(diào)用各種軟件工具實現(xiàn)的神奇能力。所以說,并不是由于LLM 的出現(xiàn),其它技術(shù)都歇菜了,程序員要失業(yè)了。IT 工程師的作用依然非常重要,我們?yōu)長LM 提供新的工具,讓它能夠做的更多,更好。
中間語言有如下幾個特點:
- 簡單的結(jié)構(gòu)化形式語言
????????比如使用JSON 格式或者其他DSL 語言描述。這種結(jié)構(gòu)化模型能夠通過程序轉(zhuǎn)化為機器可讀的形式化模型。能夠通過程序轉(zhuǎn)化為標(biāo)準(zhǔn)化的數(shù)字模型或者代碼,例如管理殼,OPCUA 模型,計算機代碼等。在轉(zhuǎn)化過程中,根據(jù)模型的規(guī)范,自動添加規(guī)范中要求的語義、語法細節(jié)。
- 代碼或者模型中增加了比較多的自然語言描述(Description)
? ? ? ?有利于LLM 理解模型或者語言模型的含義,幫助LLM 準(zhǔn)確地生成基于中間語言的代碼或者模型。
在中間模型中,每個對象,屬性都要增加描述(Description)例如
? ?current=? ? ?{
? ? ? ? ? ? value:10"
? ? ? ? ? ? description :"current of motor Driver"
? ? ? ? ? ?unit:"A"
? ? ? ? }
?同樣地,在程序代碼中的每個函數(shù)也需要描述,例如
? ?一個獲取天氣的函數(shù)function get_weather(locaton)需要下面的描述
? {
? ? ? ? ? ? "name": "weather",
? ? ? ? ? ? "description": "當(dāng)需要了解天氣時調(diào)用 需要 位置參數(shù)",
? ? ? ? ? ? "parameters": {
? ? ? ? ? ? ? ? "type": "object",
? ? ? ? ? ? ? ? "properties": {
? ? ? ? ? ? ? ? ? ? "location": {
? ? ? ? ? ? ? ? ? ? ? ? "type": "string",
? ? ? ? ? ? ? ? ? ? ? ? "description": "輸入您想要了解天氣的位置。 示例:無錫",
? ? ? ? ? ? ? ? ? ? },
? ? ? ? ? ? ? ? },
? ? ? ? ? ? ? ? "required": ["location"],
? ? ? ? ? ? },
? ? ? ? }
LLM 通過描述理解語義,未來的程序?qū)τ凇叭祟悺钡目勺x性又非常重要了,這一次是LLM的可讀性。
- ? ?能夠轉(zhuǎn)換成標(biāo)準(zhǔn)的模型
? ?中間語言是形式化結(jié)構(gòu)型語言,通過添加細節(jié),能夠使用軟件工具轉(zhuǎn)換成標(biāo)準(zhǔn)化的模型文本。 ? 比如OPC UA 和資產(chǎn)管理殼(AAS)。
????????這種方法已經(jīng)被人采納過,例如OPCUA 的NodeSet2 格式非常復(fù)雜,OPCUA 基金會設(shè)計了一種ModelDesign的中間模型,通過基金會提供的UAModelCompier 軟件生成C# 代碼和NodeSet2.xml。ModelDesign便于人工編寫和其它程序輸出。
? ?由此可見,中間語言是介于自然語言與計算機語言之間的一種“高級”語言。中間語言和模型的另一個優(yōu)點是它能夠生成各種程序設(shè)計語言的代碼和模型。
初步的實驗
在下面的實驗中,我們將分三步進行:文章來源:http://www.zghlxwxcb.cn/news/detail-858000.html
- 基于工業(yè)4.0 的資產(chǎn)管理殼的數(shù)據(jù)模型,設(shè)計一種資產(chǎn)模型(中間模型)
- 將自然語言編寫的資產(chǎn)模型描述通過LLM 生成中間模型
- 設(shè)計一個軟件工具將中間模型轉(zhuǎn)換成標(biāo)準(zhǔn)的AAS XML 文檔
(待續(xù))文章來源地址http://www.zghlxwxcb.cn/news/detail-858000.html
到了這里,關(guān)于漫談AI 時代的信息模型的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!