如果每封電子郵件、每個帶有訂單、發(fā)票、投訴、錄用請求或工作申請的 PDF 都可以翻譯成機器可讀的數(shù)據(jù),會怎樣?然后可以由 ERP / CRM / LMS / TMS 自動處理嗎?無需編程特殊接口。
聽起來很神奇?它確實有一些魔力。但最近已成為可能。
解決方案是大型語言模型(LLM)。它們與人類辦公室工作人員類似,能夠將電子郵件轉換為結構化數(shù)據(jù),而無需或只有很少的學習樣本。電子郵件、PDF 或文檔被視為訂單、投標、提醒。并找到并提取具體數(shù)據(jù)。例如,對于運輸訂單請求,客戶、托盤數(shù)量、重量、取貨地點、取貨時間、交貨地點。
然后,附加的業(yè)務算法(這不是由模型完成的)可以根據(jù)結構化數(shù)據(jù)預過濾查詢,直接處理它(例如回答它)或將其作為結構化輸入提供給人工代理,也可能使用進一步處理的建議。
什么是大型語言模型以及我們?yōu)槭裁匆P心?
近年來,大型語言模型的發(fā)展是機器學習領域的一個重要里程碑。這些模型的特點是能夠用自然語言回答問題、創(chuàng)建文本、總結文本、將其翻譯成其他語言或語言游戲,或者生成代碼,而所有這一切都無需腳本,即無需專門編程將用戶輸入與機器輸出鏈接起來的算法。這些模型不僅能產生句法(拼寫、語法)正確的輸出,而且還能夠在語義上正確解決困難的語言任務。大模型有很多,最著名的包括 GPT-3 (OpenAI)、BERT、T5 (Google) 或 Wu Dao (北京人工智能研究院)、MT-NLG (微軟)。
大模型在回答問題、繼續(xù)或總結文本方面表現(xiàn)出驚人的技能。在許多情況下,他們的技能甚至超過了人類溝通伙伴。以下是三個 LLM 能力的一些示例:GPT-3 davinci、AI21 studio j1-jumbo、Macaw 11B。所有任務都沒有經過專門培訓,也沒有編寫響應腳本。相反,這些都是零射擊能力的例子:無需經過專門訓練就能做某事的能力。
還可以生成結構化數(shù)據(jù),例如簡單的程序:
這些模型通常也能夠處理其他廣泛使用的語言,但沒有一個能像英語一樣處理。
LLMS如何運作?
大模型正確回答了所有問題。這怎么可能?
快速瀏覽大型語言模型的基礎知識:最強大的系統(tǒng)是 Transformer 模型,其核心由深度學習模型(一種特定類型的神經網絡)組成,并配備了注意力機制。它們能夠處理順序輸入(例如文本)并產生相應的輸出。他們基本上是根據(jù)統(tǒng)計數(shù)據(jù)來做到這一點的:最可能的延續(xù)是什么(問題的答案、對話中的下一個話語、開始的文本的完成)?— 這意味著,他們的響應并不像 Siri、Alexa 或其他語音助手目前那樣基于用戶意圖與答案的固定映射。
這些模型在各個維度上都很大:它們現(xiàn)在通常包含超過 1000 億個參數(shù)。簡而言之,參數(shù)是神經元之間的權重,隨著模型學習而調整。這些模型使用數(shù)百兆字節(jié)的主要公開數(shù)據(jù)(例如維基百科和類似的大型語料庫)進行訓練。培訓內容相當于十萬多本書的規(guī)模。換個角度來看:一個人一生讀完5000本書是很困難的。這些模型的生態(tài)足跡也是巨大的:據(jù)估計,最成功的大模型的初始訓練消耗的能量相當于駕駛汽車往返月球所需的能量。對于大模型來說,數(shù)量在某種程度上轉化為質量。目前的成就是通過十倍的努力才取得的,
資料來源: https:?//huggingface.co/blog/large-language-models
較新的大模型的一個特點是——如上面的例子所示——它們可以在沒有特定任務學習的情況下提供對輸入的響應。他們的產出僅依賴于他們的基礎訓練。與人類類似,這些模型具有多功能性,能夠理解并正確對話或響應單次訓練(單個練習示例)、少次訓練(幾個示例)甚至無示例所教授的新語言游戲根本不。這是新的、革命性的。早期的模型經過精心訓練,只能完成一項工作,并且只能處理單一任務:下棋、識別可疑的銀行活動、在圖片中查找人臉等。
當然,這里也可以進行一些微調,即使用額外的樣本輸入和輸出來訓練特定作業(yè)的模型。這也類似于人類的語言習得:經過大約20年的童年和青少年時期的基本訓練,我們可以聊天、爭論、進行哲學思考、撒謊、計算、旋轉、分析或布道。但為了在高而具體的專業(yè)水平上做到這一點,我們學習法律、量子物理學、會計、心理學或神學。
模型得分的一個有趣領域是文本分析。在下面的示例中,我們告訴模型要做什么,并給出兩個示例:iPhone 和 Serrano ham。對于第三個輸入(蘋果酒),模型本身設法提供正確的答案(少量學習)。
還可以分析更多結構化數(shù)據(jù)。下面的例子(同樣基于少量鏡頭學習)展示了一種沒有數(shù)據(jù)庫和 SQL 的數(shù)據(jù)庫查詢,而是簡單地基于語言技能。類似于人類能夠做的事情。
具有大型語言模型的自動化設置
如何利用語言模型將非結構化數(shù)據(jù)轉換為結構化數(shù)據(jù)并自動處理?我們自己的實踐經驗中的一個實施示例將證明這一點。(- 當然,我們絕對不是唯一處理這些問題的人,另請參閱本文)。
A. 模型的設置(POC 1)
問題:我們收到可能采用不同語言的非結構化郵件,作為傳輸?shù)膱髢r請求,并嘗試將它們轉換為結構化數(shù)據(jù)。
為了做到這一點,我們?yōu)槟P吞峁┝艘恍┯柧殬颖荆◣资綆装賯€樣本)。樣本應該盡可能多樣化,以便模型學會處理全方位的請求。樣本還應涵蓋詢價以外的意圖:例如,有關正在進行的裝運的查詢或投訴,以幫助模型區(qū)分正確的分類。訓練樣本包括電子郵件或 PDF 文本的有效負載以及要輸出的結構化數(shù)據(jù)。任何可以通過簡單腳本從電子郵件中提取且不需要機器學習的數(shù)據(jù)都應提前刪除,例如發(fā)件人地址或收件人地址。輸入應包含真實數(shù)據(jù),未經手動清理,但包含拼寫錯誤、口語時間和所有可能的語言。目標數(shù)據(jù)不必采用獨立格式(JSON 等)才能啟動。轉換可以再次通過簡單的算法完成。
這些數(shù)據(jù)用于調整模型,然后該模型可用于識別和處理任意數(shù)量的其他查詢。
您的應用程序應該使用哪種基本模型?這個問題不太容易回答,應該分為幾個子問題:
1. 哪種型號、哪種配置、哪種設置可提供最佳效果?
2. 我可以在我想要的設置(在自己的云、SaaS 解決方案等中運行)和我的要求(例如隱私、數(shù)據(jù)主權)中運行哪種模型?
3. 哪種模型的總擁有成本最低(固定成本和基于請求的成本)?
如果從問題 2 和問題 3 的角度來看,多個模型位于相關集中,則應使用不同的設置來測試這些模型。為了找到最佳解決方案,您應該首先在一些訓練和少量測試數(shù)據(jù)的基礎上測試模型,然后通過更多數(shù)據(jù)取得成功。機器處理的范圍仍然可以改變,某些查詢類別或某些數(shù)據(jù)可能在評估第一結果之后被集成或刪除。
如果此操作成功并且您為業(yè)務目的獲得了足夠高的正確答案率,則可以采取下一步。哪個比率足夠可以根據(jù)應用而變化,可以是 60%、80% 或 98%。為了獲得可以在以后的生產操作中重現(xiàn)的結果,在試驗期間分離訓練和測試數(shù)據(jù)非常重要。
B. 集成到整體E2E解決方案中(POC 2)
集成到更大的框架中可以如下所示:模型生成的數(shù)據(jù)首先進行后處理:大模型沒有地圖功能,他們無法將“Werk Stocken Continental AG”(原文如此)等地址信息轉換為路線計算的地址,就像他們無法將“下周三上午 10 點”這樣的日期轉換為“30.03.2022 10:00h”。
處理后的數(shù)據(jù)鏈接到簡單腳本生成的數(shù)據(jù),并傳遞給自動回答查詢的業(yè)務算法。無法自動處理的請求仍會路由到手動處理它們的人員。這可以包括以下情況:
- 該模型認識到這不是征求建議書。
- 模型或腳本算法認識到它們無法將此請求轉換為數(shù)據(jù)。
- 從技術上講,業(yè)務算法無法處理生成的數(shù)據(jù)。
- 盡管有完整的數(shù)據(jù)集可用,但仍無法自動答復該請求,因為例如不清楚特定客戶、關系、日期或負載是否可以履行,或者因為根本無法提出價格。
如果所生成的數(shù)據(jù)可以被自動處理,則它可以例如被簡單地饋送到系統(tǒng)(例如運輸管理系統(tǒng))中并且可以在那里立即被處理。例如,可以通過電子郵件生成完整的招標——僅基于業(yè)務算法。這種解決方案的迷人之處在于,對模型的可能誤解不會導致在內容、價格或公司履約風險方面存在本質錯誤的報價。相反,報價總是正確的。在最壞的情況下,它只是與請求的確切目標不對應。該解決方案可以使用類似于生產目標映像的操作設置進行測試,例如并行操作:郵件繼續(xù)進入生產系統(tǒng),同時在測試設置中處理郵件的克隆并評估結果。這里的處理和操作設置的問題很快就會顯現(xiàn)出來。
C. 測試、軟啟動和進一步步驟
如果步驟 2 成功,那么首先軟啟動系統(tǒng)是有意義的,例如,僅將其應用于有限的客戶群,然后在出現(xiàn)問題時重新調整?;蛘咦屜到y(tǒng)一開始就在人工監(jiān)督下運行(電子郵件在發(fā)送前進行檢查)。如果系統(tǒng)成功且穩(wěn)定,則可以逐步擴大自動化的范圍和程度。
系統(tǒng)還應在運行期間進一步優(yōu)化,例如通過重新訓練未正確識別的請求并發(fā)送以進行手動處理。
根據(jù)應用的不同,自動化程度可以從開始時的 80% 擴展到后期的 90% 或 95%。
使用大模型的自動化具有三大優(yōu)勢:
- 能夠讓合適的團隊解決對人類來說更令人興奮、高利潤和與增長相關的問題。
- 在銷售、客戶支持等方面部署的人力方面,處理效率大幅提高。
- 由于更快的響應和避免查詢停滯,提高了服務質量
與創(chuàng)建特定于客戶的 EDI 連接等手動自動化方法不同,基于 LLM 的自動化為跨客戶流程自動化付費。投資價值不會因接口規(guī)范的變化或客戶關系的變化而損失。它還可以針對 B2B 客戶的長尾,甚至無法為其構建特定接口的 B2C 客戶實施?;诖竽P偷慕鉀Q方案通常可以而且應該與主要合作伙伴的 EDI 解決方案相結合。
長期前景
我們概述了一個場景,其中可能是系統(tǒng)生成的人工輸入(來自 ERP 系統(tǒng)的詢價)進入 LLM 支持的系統(tǒng)。響應返回給人類,然后由人類委托或發(fā)布。從長遠來看,我們可以想象進一步的場景:如果我們在發(fā)送方和接收方都有一個支持LLM的系統(tǒng),那么整個對賬過程可以在很大程度上實現(xiàn)自動化,例如,在客戶的ERP系統(tǒng)和承包商的TMS系統(tǒng)之間。一個系統(tǒng)發(fā)送詢價,TMS 發(fā)送投標,ERP 選擇其中之一并發(fā)送訂單,TMS 確認并將訂單發(fā)送至履行。因此,無需指定接口,與任何合作伙伴的多向自動通信都將變得簡單可行。
大模型的多功能性使他們能夠像人工代理一樣處理不同格式和結構化的請求類型。
最初,處理請求的可能范圍和質量肯定只能在第一級支持級別上實現(xiàn)。需要可靠地識別更復雜或無法答復的請求,然后將其路由到人工二級處理。文章來源:http://www.zghlxwxcb.cn/news/detail-628512.html
盡管如此,大量的時間節(jié)省和流程加速將是積極的影響。此外,系統(tǒng)可以通過對它們尚未/尚未可靠回答的查詢進行訓練來自動或半自動改進。文章來源地址http://www.zghlxwxcb.cn/news/detail-628512.html
到了這里,關于如何使用大模型處理生活繁瑣的工作的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!