企業(yè)知識庫
原理就是把文檔變?yōu)橄蛄繑?shù)據(jù)庫,然后搜索向量數(shù)據(jù)庫,把相似的數(shù)據(jù)和問題作為prompt,
輸入到大模型,再利用GPT強大的自然語言處理、推理和分析等方面的能力將答案返回給用戶
什么是langchain?
langchain是一個強大的框架,旨在幫助開發(fā)人員使用語言模型構(gòu)建端到端的應(yīng)用程序。它提供了一套工具、組件和接口,可簡化創(chuàng)建由大型語言模型 (LLM) 和聊天模型提供支持的應(yīng)用程序的過程。LangChain 可以輕松管理與語言模型的交互,將多個組件鏈接在一起,并集成額外的資源,例如 API 和數(shù)據(jù)庫。
AI私有知識庫
一種利用langchain思想實現(xiàn)的基于本地知識庫的問答應(yīng)用
詳細(xì)流程實現(xiàn):
文檔的處理:
- 本地文檔 進(jìn)行加載獲取到text文字內(nèi)容
- 將獲取的text進(jìn)行切割分段(一般是采用文字500字切割,且上下文檔有關(guān)聯(lián)100字)
- 分段segment進(jìn)行向量化存儲到向量存儲中
query查詢的處理
- 對提問的問題query進(jìn)行向量化embedding
- 查詢向量存儲匹配的文檔(一般有相似度的查詢與設(shè)置,比較好用)
- 查詢的文檔與問題、歷史記錄等組成prompt
- prompt(一般會設(shè)置中文化且設(shè)置回答等限制)請求LLM大模型
- 最終返回結(jié)果給用戶
最后最終方案
本人和公司都是Java系的開發(fā),但langchain是python的框架,最后采用了如下的方案:…
麻蛋,還得給它改python代碼 (頭皮發(fā)麻)Azure AI 是微軟的一個python開源解決方案,但我們是Java體系,便只使用azure AI LLM大模型的功能,和向量embedding的存儲,提問查詢功能,其他的功能都采用Java來實現(xiàn),如對象存儲、文檔加載、文檔切割、格式轉(zhuǎn)化等等文章來源:http://www.zghlxwxcb.cn/news/detail-673320.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-673320.html
到了這里,關(guān)于langchain ChatGPT AI私有知識庫的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!