關(guān)鍵字: [Amazon Web Services re:Invent 2023, Neo4j, Knowledge Graph Construction, Natural Language Processing, Financial Data Extraction, Chatbot Question Answering, Graph Databases]
本文字?jǐn)?shù): 1000, 閱讀完需: 5 分鐘
視頻
如視頻不能正常播放,請(qǐng)前往bilibili觀看本視頻。>> https://www.bilibili.com/video/BV1tj411L7GW
導(dǎo)讀
將生成式AI與知識(shí)圖譜相結(jié)合可以增強(qiáng)語(yǔ)言理解能力,生成更符合上下文的響應(yīng)。這豐富了信息檢索和基于上下文的推理,并提高了整體用戶體驗(yàn)。在這個(gè)閃電演講中,探索Amazon Bedrock的應(yīng)用,用于解析半結(jié)構(gòu)化數(shù)據(jù),在Neo4j中自動(dòng)創(chuàng)建知識(shí)圖譜。了解如何將這個(gè)知識(shí)圖譜與聊天機(jī)器人集成,提高可靠性和準(zhǔn)確性。這個(gè)演示由Neo4j提供,Neo4j是亞馬遜云科技的合作伙伴。
演講精華
以下是小編為您整理的本次演講的精華,共700字,閱讀時(shí)間大約是4分鐘。如果您想進(jìn)一步了解演講內(nèi)容或者觀看演講全文,請(qǐng)觀看演講完整視頻或者下面的演講原文。
Anthony Prasad詳細(xì)闡述了大型語(yǔ)言模型(LLM)在文本生成和應(yīng)用構(gòu)建方面的應(yīng)用所面臨的挑戰(zhàn)。據(jù)他統(tǒng)計(jì),盡管現(xiàn)成的LLM能夠連接到數(shù)據(jù)源并提取100%的可用數(shù)據(jù),但它們生成的輸出中,高達(dá)50%的時(shí)間存在錯(cuò)誤、幻覺(jué)和缺乏上下文。這是因?yàn)橹貜?fù)模板的過(guò)度使用,以及LLM無(wú)法理解語(yǔ)義上下文。他提供了一個(gè)客戶用例示例,展示了LLM在回答足球相關(guān)問(wèn)題時(shí)卻生成了一個(gè)關(guān)于籃球的回答,強(qiáng)調(diào)了其回答的不相關(guān)性。此外,他還注意到LLM有40%的時(shí)間會(huì)使用填充詞來(lái)完成文本輸出。
為了解決這些問(wèn)題,Anthony強(qiáng)調(diào)利用Neo4j知識(shí)圖來(lái)輔助LLM。通過(guò)關(guān)注輸入?yún)?shù)驅(qū)動(dòng)的特定任務(wù),可以對(duì)LLM進(jìn)行微調(diào),從而將準(zhǔn)確性提高60%。將LLM根植于知識(shí)圖中可以消除幻覺(jué)和偏見(jiàn)達(dá)75%。Neo4j支持語(yǔ)義搜索和關(guān)系向量搜索,提供了超出僅提取數(shù)據(jù)點(diǎn)的30%的可見(jiàn)性。圖形結(jié)構(gòu)允許用戶遍歷關(guān)系并理解100%的上下文,而LLM只能輸出文本。
Anthony提供了一個(gè)示例架構(gòu),包括兩個(gè)階段:將數(shù)據(jù)攝入到Neo4j的知識(shí)圖中,然后消費(fèi)這些數(shù)據(jù)來(lái)驅(qū)動(dòng)應(yīng)用程序,如聊天機(jī)器人。演示使用了包含資產(chǎn)經(jīng)理持倉(cāng)信息的真實(shí)世界金融SEC備案數(shù)據(jù)。Amazon SageMaker Studio調(diào)用Bedrock處理所有備案文件并在Neo4j中構(gòu)建完整的知識(shí)圖譜。
他提到,提示工程可以從數(shù)據(jù)中提取特定信息,精度提高80%。演示的聊天機(jī)器人通過(guò)獲取用戶問(wèn)題,將其傳遞給LLM,將其轉(zhuǎn)換為針對(duì)Neo4j的Cypher查詢,在知識(shí)圖上運(yùn)行,然后將結(jié)果以自然語(yǔ)言的形式概括。這結(jié)合了LLM的知識(shí)和來(lái)自Neo4j的關(guān)系數(shù)據(jù),以提供獨(dú)立使用任何一種技術(shù)都無(wú)法實(shí)現(xiàn)的見(jiàn)解。
Ben Lackey的演示案例通過(guò)一個(gè)實(shí)際金融應(yīng)用場(chǎng)景展示了如何將知識(shí)圖譜與語(yǔ)言模型相結(jié)合以提供更多信息和準(zhǔn)確的見(jiàn)解。在演示過(guò)程中,Lackey使用了實(shí)際的財(cái)務(wù)文件樣本,并通過(guò)Bedrock和提示來(lái)提取公司名和股票持有等實(shí)體信息,準(zhǔn)確率比不使用提示時(shí)提高了75%。提取的知識(shí)被加載到Neo4j知識(shí)圖譜中,然后由聊天機(jī)器人界面查詢以回答相關(guān)問(wèn)題。這成功地結(jié)合了語(yǔ)言模型的能力與Neo4j的關(guān)系數(shù)據(jù),提供了諸如資產(chǎn)經(jīng)理的主要持股和哪些公司持有FANG股票等信息。
這個(gè)演示展示了一個(gè)從美國(guó)證券交易委員會(huì)(SEC)發(fā)布的文件中提取數(shù)據(jù)的用例。這些文件包含了資產(chǎn)管理公司如果管理資產(chǎn)超過(guò)10億美元就必須每季度提交的披露報(bào)告。報(bào)告列出了如Fidelity和Vanguard等公司的所有股票和持股情況。Bedrock使用XML和表格混合數(shù)據(jù)處理這些復(fù)雜的文件,以提取關(guān)鍵實(shí)體并將其加載到Neo4j中,以構(gòu)建金融行業(yè)知識(shí)圖譜。
在知識(shí)圖譜之上的聊天機(jī)器人界面可以回答結(jié)合了對(duì)FANG股票等概念的行業(yè)知識(shí)和來(lái)自Neo4j的資產(chǎn)管理公司的實(shí)際持股數(shù)據(jù)的問(wèn)題。這展示了將語(yǔ)言模型的能力與領(lǐng)域特定的現(xiàn)實(shí)世界知識(shí)相結(jié)合以提供更準(zhǔn)確的信息的可能性。
總之,這個(gè)視頻演示清楚地說(shuō)明了單獨(dú)應(yīng)用語(yǔ)言模型可能存在的陷阱,以及將它們建立在知識(shí)圖譜如Neo4j上的巨大價(jià)值。通過(guò)將語(yǔ)言模型與結(jié)構(gòu)化的關(guān)系知識(shí)相結(jié)合,可以克服關(guān)于偏見(jiàn)和幻覺(jué)的限制,從而實(shí)現(xiàn)更智能的應(yīng)用。這一實(shí)際案例強(qiáng)調(diào)了知識(shí)圖譜和語(yǔ)言模型在構(gòu)建下一代具有增強(qiáng)準(zhǔn)確性的AI系統(tǒng)中的協(xié)同作用。
下面是一些演講現(xiàn)場(chǎng)的精彩瞬間:
在本屆re:Invent期間,Neo4j公司的Ben Lackey將進(jìn)行一場(chǎng)現(xiàn)場(chǎng)演示。
Amara Bedrock的云計(jì)算B2LM技術(shù)能夠提取數(shù)據(jù)并對(duì)其進(jìn)行加密處理,從而在電子商務(wù)網(wǎng)站上實(shí)現(xiàn)個(gè)性化推薦。
此外,還將展示一款使用Amazon SageMaker Studio和Bedrock共同構(gòu)建的聊天機(jī)器人應(yīng)用程序。
通過(guò)一鍵部署功能,SageMaker Studio可以輕松運(yùn)行從存儲(chǔ)庫(kù)克隆的機(jī)器學(xué)習(xí)項(xiàng)目。
本次演講還將強(qiáng)調(diào)檢查包含預(yù)期復(fù)雜信息的政府?dāng)?shù)據(jù)文件的重要性。
通過(guò)結(jié)合LLM和Neo4j,可以實(shí)現(xiàn)超越各自單獨(dú)實(shí)現(xiàn)的功能。
最后,將介紹亞馬遜云科技與亞馬遜市場(chǎng)之間的合作伙伴關(guān)系,以便用戶能輕松部署解決方案。
總結(jié)
該視頻探討了利用Neo4j圖和Amazon Bedrock構(gòu)建更精確語(yǔ)言模型的方法。傳統(tǒng)的模型可能會(huì)產(chǎn)生誤解且缺乏上下文。將模型建立在諸如Neo4j這樣的知識(shí)圖基礎(chǔ)上有助于消除誤解和偏見(jiàn)。Neo4j支持基于語(yǔ)義的向量嵌入搜索,這使得能夠遍歷關(guān)系而不僅僅是提取數(shù)據(jù)點(diǎn)。
演示展示了兩個(gè)主要的工作流程。首先,通過(guò)Bedrock將金融數(shù)據(jù)輸入到Neo4j知識(shí)圖中,同時(shí)提取元數(shù)據(jù),如經(jīng)理姓名和資產(chǎn)詳細(xì)信息。其次,一個(gè)聊天機(jī)器人查詢圖形以回答自然語(yǔ)言問(wèn)題。聊天機(jī)器人將其自身的知識(shí)與圖形數(shù)據(jù)相結(jié)合。例如,它知道什么是FANG股票,并能查出擁有這些股票的經(jīng)理有哪些。聊天機(jī)器人通過(guò)Bedrock將問(wèn)題轉(zhuǎn)換成Cypher查詢。圖形查詢的結(jié)果被綜合成自然語(yǔ)言回復(fù)。這展示出將語(yǔ)言模型與結(jié)構(gòu)化知識(shí)圖相結(jié)合的強(qiáng)大之處。
演講原文
https://blog.csdn.net/just2gooo/article/details/134860681
想了解更多精彩完整內(nèi)容嗎?立即訪問(wèn)re:Invent 官網(wǎng)中文網(wǎng)站!
2023亞馬遜云科技re:Invent全球大會(huì) - 官方網(wǎng)站
點(diǎn)擊此處,一鍵獲取亞馬遜云科技全球最新產(chǎn)品/服務(wù)資訊!
點(diǎn)擊此處,一鍵獲取亞馬遜云科技中國(guó)區(qū)最新產(chǎn)品/服務(wù)資訊!
即刻注冊(cè)亞馬遜云科技賬戶,開(kāi)啟云端之旅!
【免費(fèi)】亞馬遜云科技“100 余種核心云服務(wù)產(chǎn)品免費(fèi)試用”
【免費(fèi)】亞馬遜云科技中國(guó)區(qū)“40 余種核心云服務(wù)產(chǎn)品免費(fèi)試用”
亞馬遜云科技是誰(shuí)?
亞馬遜云科技(Amazon Web Services)是全球云計(jì)算的開(kāi)創(chuàng)者和引領(lǐng)者,自 2006 年以來(lái)一直以不斷創(chuàng)新、技術(shù)領(lǐng)先、服務(wù)豐富、應(yīng)用廣泛而享譽(yù)業(yè)界。亞馬遜云科技可以支持幾乎云上任意工作負(fù)載。亞馬遜云科技目前提供超過(guò) 200 項(xiàng)全功能的服務(wù),涵蓋計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、數(shù)據(jù)分析、機(jī)器人、機(jī)器學(xué)習(xí)與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、媒體,以及應(yīng)用開(kāi)發(fā)、部署與管理等方面;基礎(chǔ)設(shè)施遍及 31 個(gè)地理區(qū)域的 99 個(gè)可用區(qū),并計(jì)劃新建 4 個(gè)區(qū)域和 12 個(gè)可用區(qū)。全球數(shù)百萬(wàn)客戶,從初創(chuàng)公司、中小企業(yè),到大型企業(yè)和政府機(jī)構(gòu)都信賴(lài)亞馬遜云科技,通過(guò)亞馬遜云科技的服務(wù)強(qiáng)化其基礎(chǔ)設(shè)施,提高敏捷性,降低成本,加快創(chuàng)新,提升競(jìng)爭(zhēng)力,實(shí)現(xiàn)業(yè)務(wù)成長(zhǎng)和成功。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-808624.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-808624.html
到了這里,關(guān)于使用Neo4j知識(shí)圖譜為亞馬遜Bedrock應(yīng)用程序提供動(dòng)力的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!