国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Elasticsearch:什么是檢索增強生成 (RAG)?

這篇具有很好參考價值的文章主要介紹了Elasticsearch:什么是檢索增強生成 (RAG)?。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

檢索增強生成 (RAG) 定義

檢索增強生成 (RAG) 是一種利用來自私有或?qū)S袛?shù)據(jù)源的信息來補充文本生成的技術。 它將旨在搜索大型數(shù)據(jù)集或知識庫的檢索模型與大型語言模型 (LLM) 等生成模型相結合,后者獲取該信息并生成可讀的文本響應。

檢索增強生成可以通過添加來自其他數(shù)據(jù)源的上下文并通過培訓補充 LLMs 的原始知識庫來提高搜索體驗的相關性。 這增強了大型語言模型的輸出,而無需重新訓練模型。 其他信息來源的范圍包括 LLM 未受過培訓的互聯(lián)網(wǎng)上的新信息、專有業(yè)務背景或?qū)儆谄髽I(yè)的機密內(nèi)部文件。

RAG 對于問答和內(nèi)容生成等任務很有價值,因為它使生成式 AI系統(tǒng)能夠使用外部信息源來生成更準確和上下文感知的響應。 它實現(xiàn)搜索檢索方法(通常是語義搜索或混合搜索)來響應用戶意圖并提供更相關的結果。

rag增強檢索,Elasticsearch,AI,Elastic,elasticsearch,大數(shù)據(jù),搜索引擎,人工智能,全文檢索,數(shù)據(jù)庫

那么,什么是信息檢索呢?

信息檢索(information retrieval - IR)是指從知識源或數(shù)據(jù)集中搜索和提取相關信息的過程。 這很像使用搜索引擎在互聯(lián)網(wǎng)上查找信息。 你輸入查詢,系統(tǒng)會檢索并向你顯示最有可能包含你正在查找的信息的文檔或網(wǎng)頁。

信息檢索涉及對大型數(shù)據(jù)集進行有效索引和搜索的技術; 這使得人們更容易從大量可用數(shù)據(jù)中訪問他們需要的特定信息。 除了網(wǎng)絡搜索引擎之外,IR 系統(tǒng)還經(jīng)常用于數(shù)字圖書館、文檔管理系統(tǒng)和各種信息訪問應用程序。

AI 語言模型的演變

rag增強檢索,Elasticsearch,AI,Elastic,elasticsearch,大數(shù)據(jù),搜索引擎,人工智能,全文檢索,數(shù)據(jù)庫

多年來,人工智能語言模型已經(jīng)發(fā)生了顯著的發(fā)展:

  • 在 20 世紀 50 年代和 1960 年代,該領域還處于起步階段,基本的基于規(guī)則的系統(tǒng)對語言的理解有限。
  • 20 世紀 70 年代和 80 年代引入了專家系統(tǒng):這些系統(tǒng)編碼了人類解決問題的知識,但語言能力非常有限。
  • 20 世紀 90 年代見證了統(tǒng)計方法的興起,這些方法使用數(shù)據(jù)驅(qū)動的方法來完成語言任務。
  • 到 2000 年代,支持向量機(在高維空間中對不同類型的文本數(shù)據(jù)進行分類)等機器學習技術已經(jīng)出現(xiàn),盡管深度學習仍處于早期階段。
  • 2010 年代標志著深度學習的重大轉變。 Transformer 架構通過使用注意力機制改變了自然語言處理,這使得模型在處理輸入序列時能夠關注輸入序列的不同部分。

如今,Transformer 模型處理數(shù)據(jù)的方式可以通過預測單詞序列中接下來出現(xiàn)的單詞來模擬人類語音。 這些模型徹底改變了該領域,并導致了 LLM 的興起,例如谷歌的 BERT(來自 Transformers 的雙向編碼器表示)。

我們看到大量預訓練模型和專為特定任務設計的專用模型的組合。 RAG 等模型繼續(xù)受到關注,將生成式 AI 語言模型的范圍擴展到標準訓練的限制之外。 2022 年,OpenAI 推出了 ChatGPT,這可以說是最著名的基于 Transformer 架構的 LLM。 它的競爭對手包括基于聊天的基礎模型,例如 Google Bard 和微軟的 Bing Chat。 Meta 的 LLaMa 2 不是消費者聊天機器人,而是開源 LLM,熟悉 LLM 工作原理的研究人員可以免費使用。

rag增強檢索,Elasticsearch,AI,Elastic,elasticsearch,大數(shù)據(jù),搜索引擎,人工智能,全文檢索,數(shù)據(jù)庫

檢索增強生成如何工作?

檢索增強生成是一個多步驟過程,從檢索開始,然后導致生成。 下面是它的工作原理:

檢索

  • RAG 以輸入查詢開始。 這可能是用戶的問題或任何需要詳細響應的文本。
  • 檢索模型從知識庫、數(shù)據(jù)庫或外部源(或同時從多個源)獲取相關信息。 模型搜索的位置取決于輸入查詢的要求。 現(xiàn)在,檢索到的信息可作為模型所需的任何事實和上下文的參考源。
  • 檢索到的信息被轉換為高維空間中的向量。 這些知識向量存儲在向量數(shù)據(jù)庫中。
  • 檢索模型根據(jù)檢索到的信息與輸入查詢的相關性對檢索到的信息進行排名。 選擇得分最高的文檔或段落進行進一步處理。

生成

  • 接下來,生成模型(例如 LLM)使用檢索到的信息生成文本響應。
  • 生成的文本可能會經(jīng)過額外的后處理步驟,以確保其語法正確且連貫。
  • 總體而言,這些響應更準確,并且在上下文中更有意義,因為它們是由檢索模型提供的補充信息塑造的。 這種能力在公共互聯(lián)網(wǎng)數(shù)據(jù)不足的專業(yè)領域尤其重要。

檢索增強生成的好處

與孤立工作的語言模型相比,檢索增強生成有幾個好處。 以下是它改進文本生成和響應的幾種方法:

  • RAG 確保你的模型可以訪問最新的事實和相關信息,因為它可以定期更新其外部參考。 這確保了它生成的響應包含可能與進行查詢的用戶相關的最新信息。 你還可以實施文檔級安全性來控制對數(shù)據(jù)流中數(shù)據(jù)的訪問并限制對特定文檔的安全權限。
  • RAG 是一種更具成本效益的選擇,因為它需要更少的計算和存儲,這意味著你不必擁有自己的 LLM 或花費時間和金錢來微調(diào)你的模型。
  • 聲稱準確性是一回事,但實際證明它是另一回事。 RAG 可以引用其外部來源并將其提供給用戶以支持他們的響應。 如果他們選擇這樣做,用戶就可以評估來源以確認他們收到的響應是準確的。
  • 雖然 LLM 支持的聊天機器人可以制作比以前的腳本響應更加個性化的答案,但 RAG 可以更加定制其答案。 這是因為它能夠在通過衡量意圖綜合答案時使用搜索檢索方法(通常是語義搜索)來引用一系列上下文信息點。
  • 當面對未經(jīng)訓練的復雜查詢時, LLM 有時會 “產(chǎn)生幻覺”,提供不準確的答案。 通過將其響應與相關數(shù)據(jù)源的附加參考結合起來,RAG 可以更準確地響應模糊的查詢。
  • RAG 模型用途廣泛,可應用于一系列自然語言處理任務,包括對話系統(tǒng)、內(nèi)容生成和信息檢索。
  • 偏見可能是任何人造人工智能中的一個問題。 通過依靠經(jīng)過審查的外部來源,RAG 可以幫助減少其反應中的偏見。

檢索增強生成與微調(diào)

檢索增強生成和微調(diào) (fine-tunning) 是訓練人工智能語言模型的兩種不同方法。 雖然 RAG 將廣泛的外部知識檢索與文本生成結合起來,但微調(diào)側重于用于不同目的的狹窄數(shù)據(jù)范圍。

在微調(diào)過程中,預訓練模型會根據(jù)專門數(shù)據(jù)進行進一步訓練,以使其適應任務子集。 它涉及根據(jù)新數(shù)據(jù)集修改模型的權重和參數(shù),使其能夠?qū)W習特定于任務的模式,同時保留初始預訓練中的知識。

微調(diào)可用于各種人工智能。 一個基本的例子是在識別互聯(lián)網(wǎng)上的貓照片的背景下學習識別小貓。 在基于語言的模型中,除了文本生成之外,微調(diào)還可以幫助完成文本分類、情感分析和命名實體識別等工作。 然而,這個過程可能非常耗時且昂貴。 RAG 加快了流程,并以更少的計算和存儲需求整合了這些成本。

由于 RAG 可以訪問外部資源,因此當任務需要合并來自 Web 或企業(yè)知識庫的實時或動態(tài)信息以生成明智的響應時,RAG 特別有用。 微調(diào)具有不同的優(yōu)勢:如果手頭的任務定義明確并且目標是單獨優(yōu)化該任務的性能,則微調(diào)可能非常有效。 這兩種技術的優(yōu)點是不必為每項任務從頭開始培訓 LLM。

檢索增強生成的挑戰(zhàn)和局限性

雖然 RAG 具有顯著的優(yōu)勢,但它也面臨著一些挑戰(zhàn)和限制:

  • RAG 依賴于外部知識。 如果檢索到的信息不正確,它可能會產(chǎn)生不準確的結果。
  • RAG 的檢索組件涉及搜索大型知識庫或網(wǎng)絡,這可能在計算上昂貴且緩慢 - 盡管仍然比微調(diào)更快且更便宜。
  • 無縫集成檢索和生成組件需要仔細的設計和優(yōu)化,這可能會導致訓練和部署方面的潛在困難。
  • 在處理敏感數(shù)據(jù)時,從外部來源檢索信息可能會引起隱私問題。 遵守隱私和合規(guī)性要求也可能會限制 RAG 可以訪問的來源。 但是,這可以通過文檔級訪問來解決,你可以在其中向特定角色授予訪問和安全權限。
  • RAG 基于事實準確性。 它可能難以生成富有想象力或虛構的內(nèi)容,這限制了其在創(chuàng)意內(nèi)容生成中的使用。

檢索增強生成的未來趨勢

檢索增強生成的未來趨勢集中在使 RAG 技術更高效、更適應各種應用。 以下是一些值得關注的趨勢:

個性化

RAG 模型將繼續(xù)納入用戶特定的知識。 這將使他們能夠提供更加個性化的響應,特別是在內(nèi)容推薦和虛擬助理等應用程序中。

可定制的行為

除了個性化之外,用戶本身還可以更好地控制 RAG 模型的行為和響應方式,以幫助他們獲得所需的結果。

可擴展性

RAG 模型將能夠處理比目前更大量的數(shù)據(jù)和用戶交互。

混合模式

RAG 與其他人工智能技術(例如強化學習)的集成將允許更通用和上下文感知的系統(tǒng),可以同時處理各種數(shù)據(jù)類型和任務。

實時、低延遲部署

隨著 RAG 模型檢索速度和響應時間的提高,它們將更多地用于需要快速響應的應用程序(例如聊天機器人和虛擬助手)。

使用 Elasticsearch 檢索增強生成

借助 Elasticsearch Relevance Engine,你可以為生成式 AI 應用程序、網(wǎng)站、客戶或員工體驗構建支持 RAG 的搜索。 Elasticsearch 提供了一個全面的工具包,使你能夠:

  • 存儲和搜索專有數(shù)據(jù)和其他外部知識庫以從中獲取上下文
  • 使用多種方法從你的數(shù)據(jù)生成高度相關的搜索結果:文本、向量、混合或語義搜索
  • 為你的用戶創(chuàng)建更準確的響應和更有吸引力的體驗

了解 Elasticsearch 如何為你的企業(yè)改進生成式 AI文章來源地址http://www.zghlxwxcb.cn/news/detail-762876.html

到了這里,關于Elasticsearch:什么是檢索增強生成 (RAG)?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內(nèi)容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • RAG檢索式增強技術是什么——OJAC近嶼智能帶你一探究竟

    RAG檢索式增強技術是什么——OJAC近嶼智能帶你一探究竟

    Look!??我們的大模型商業(yè)化落地產(chǎn)品 ??更多AI資訊請????關注 Free三天集訓營助教在線為您火熱答疑??????? RAG(Retrieval-Augmented Generation)模型是一個創(chuàng)新的自然語言處理(NLP)技術,它結合了傳統(tǒng)的信息檢索方法和現(xiàn)代的生成式語言模型,旨在通過引入外部知識源來

    2024年02月01日
    瀏覽(35)
  • TS版LangChain實戰(zhàn):基于文檔的增強檢索(RAG)

    LangChain是一個以 LLM (大語言模型)模型為核心的開發(fā)框架,LangChain的主要特性: 可以連接多種數(shù)據(jù)源,比如網(wǎng)頁鏈接、本地PDF文件、向量數(shù)據(jù)庫等 允許語言模型與其環(huán)境交互 封裝了Model I/O(輸入/輸出)、Retrieval(檢索器)、Memory(記憶)、Agents(決策和調(diào)度)等核心組件

    2024年02月05日
    瀏覽(20)
  • 機器學習周刊 第4期:動手實戰(zhàn)人工智能、計算機科學熱門論文、免費的基于ChatGPT API的安卓端語音助手、每日數(shù)學、檢索增強 (RAG) 生成技術綜述

    機器學習周刊 第4期:動手實戰(zhàn)人工智能、計算機科學熱門論文、免費的基于ChatGPT API的安卓端語音助手、每日數(shù)學、檢索增強 (RAG) 生成技術綜述

    機器學習周刊第4期聚焦了AI實戰(zhàn)教程、熱門計算機科學論文、基于ChatGPT的安卓端語音助手、數(shù)學定理分享以及前沿的檢索增強(RAG)生成技術綜述。

    2024年02月02日
    瀏覽(35)
  • Elasticsearch:特定領域的生成式 AI - 預訓練、微調(diào)和 RAG

    Elasticsearch:特定領域的生成式 AI - 預訓練、微調(diào)和 RAG

    作者:來自 Elastic?Steve Dodson 有多種策略可以將特定領域的知識添加到大型語言模型 (LLM) 中,并且作為積極研究領域的一部分,正在研究更多方法。 對特定領域數(shù)據(jù)集進行預訓練和微調(diào)等方法使 LLMs 能夠推理并生成特定領域語言。 然而,使用這些 LLM 作為知識庫仍然容易產(chǎn)生

    2024年02月19日
    瀏覽(21)
  • Elasticsearch 混合檢索優(yōu)化大模型 RAG 任務

    Elasticsearch 混合檢索優(yōu)化大模型 RAG 任務

    Elastic 社區(qū)在自然語言處理上面做的很不錯官方博客更新速度也很快,現(xiàn)階段大模型的應用場景主要在 Rag 和 Agent 上,國內(nèi) Rag(Retrieval-Augmented Generation 檢索增強生成) 的尤其多,而搜索對于 Elasticsearch 來說是強項特別是 8.9 之后的版本提供了 ESRE 模塊(集成了高級相關性排序

    2024年04月25日
    瀏覽(26)
  • AI數(shù)據(jù)技術02:RAG數(shù)據(jù)檢索

    ????????在人工智能的動態(tài)環(huán)境中,檢索增強生成(RAG)已成為游戲規(guī)則的改變者,徹底改變了我們生成文本和與文本交互的方式。RAG 使用大型語言模型?(LLM) 等工具將信息檢索的強大功能與自然語言生成無縫結合,為內(nèi)容創(chuàng)建提供了一種變革性的方法。 ????????在

    2024年02月03日
    瀏覽(25)
  • Prompt、RAG、微調(diào)還是重新訓練?選擇正確的生成式 AI 的方法指南

    Prompt、RAG、微調(diào)還是重新訓練?選擇正確的生成式 AI 的方法指南

    ?? CSDN 葉庭云 : https://yetingyun.blog.csdn.net/ 這篇博客試圖根據(jù)一些常見的可量化指標,為您選擇適合您用例的生成式人工智能方法提供指導。 生成式 AI 正在以驚人的速度發(fā)展,許多組織都在嘗試利用這項先進技術來解決業(yè)務問題。雖然有很多流行的方法可供選擇,但是當涉

    2024年02月11日
    瀏覽(39)
  • 為什么先進的 RAG 方法對 AI 的未來至關重要?

    為什么先進的 RAG 方法對 AI 的未來至關重要?

    每日推薦一篇專注于解決實際問題的外文,精準翻譯并深入解讀其要點,助力讀者培養(yǎng)實際問題解決和代碼動手的能力。 原文標題:Why Are Advanced RAG Methods Crucial for the Future of AI? 原文地址:https://medium.com/towards-data-science/why-are-advanced-rag-methods-crucial-for-the-future-of-ai-462e0dc5a208 為

    2024年03月10日
    瀏覽(33)
  • AI大模型的制作:RAG和向量數(shù)據(jù)庫,分別是什么?

    AI大模型的制作:RAG和向量數(shù)據(jù)庫,分別是什么?

    目錄 一、什么是 AI 大模型 二、RAG 三、向量數(shù)據(jù)庫 四、如何制作一個好的?AI 大模型 AI大模型是指具有大規(guī)模參數(shù)和復雜結構的人工智能模型。傳統(tǒng)的機器學習模型通常有限的參數(shù)量,而AI大模型則通過增加參數(shù)量和層數(shù)來提升模型的表達能力和性能。這種模型通常使用深度

    2024年02月05日
    瀏覽(27)
  • Elasticsearch:使用 Open AI 和 Langchain 的 RAG - Retrieval Augmented Generation (一)

    Elasticsearch:使用 Open AI 和 Langchain 的 RAG - Retrieval Augmented Generation (一)

    最近看了一個同事的幾個視頻。他總結的很好。在使用 LangChain 時,根據(jù) LangChain 的官方文檔?https://integrations.langchain.com/vectorstores,目前有三種方法可以進行使用:ElasticVectorSearch,ElasticsearchStore 及?ElasticKnnSearch。 我們從上面的 小紅心 來看,Elasticsearch 無疑是最受歡迎的向量

    2024年02月03日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包