国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文)

這篇具有很好參考價(jià)值的文章主要介紹了Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

在session上下文中,捕獲用戶的搜索意圖,是一件較為復(fù)雜和困難的事情。

一起看一下人大的這篇論文?Large Language Models Know Your Contextual Search Intent: A Prompting Framework for Conversational Search

?

會(huì)話中的搜索意圖和query改寫

人大的論文中提出了一個(gè)簡(jiǎn)單而有效的提示框架,稱為L(zhǎng)LM4CS,以利用LLM作為搜索意圖解釋器來(lái)促進(jìn)會(huì)話搜索。具體來(lái)說(shuō),我們首先提示LLM在多個(gè)視角下生成較短的查詢重寫和較長(zhǎng)的假設(shè)響應(yīng),然后將這些生成的內(nèi)容聚合成一個(gè)集成的表示,以穩(wěn)健地表示用戶的真實(shí)搜索意圖。在我們的框架下,我們提出三種具體的提示方法和聚合方法,并進(jìn)行廣泛的評(píng)估三個(gè)廣泛使用的會(huì)話搜索基準(zhǔn),包括CAsT-19(道爾頓等人,2020),CAsT-20(道爾頓等人,2021),和CAsT-21(道爾頓等人,2022)),全面調(diào)查llm對(duì)話搜索的有效性。

論文核心內(nèi)容

論文中嗎,主要解決的是從上下文的會(huì)話信息中,提取信息,已補(bǔ)充和改寫最新的query。解決上下文的關(guān)聯(lián)問題。

論文中提到了三種重寫的方式,如下圖所示。

Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文),RAG,ES搜索優(yōu)化,query Rewrite,如何在上下文中捕獲搜索意圖,召回提升

  • 第一種REW是直接把歷史的qa和當(dāng)前query一起送給模型,然后讓模型給出重寫后的query。
  • 第二種RTR是把歷史的qa和當(dāng)前query一起送給模型,然后讓模型給出重寫后的query。并給出一個(gè)回答。把回答的內(nèi)容和和重寫后的query一起構(gòu)造成新的query。這里論文中雖然沒有提到,但是在谷歌和微軟的相關(guān)論文中,由于生成的答案通常比重寫后的query要長(zhǎng),索引要把重寫后的query重復(fù)拼接5次,然后再拼接上回答的內(nèi)容,最后構(gòu)成最終的query。
  • 第三種RAR是把歷史的qa和當(dāng)前query一起送給模型,然后讓模型給出重寫后的query。并給出一個(gè)回答。這里可以生成多個(gè)問題和多個(gè)回答。也就是可以把復(fù)雜的問題進(jìn)行拆解。

?

額外地生成假設(shè)的響應(yīng)和正確地聚合多個(gè)生成的結(jié)果對(duì)于提高搜索性能是至關(guān)重要的!

?

論文中提及的query重寫方法如何使用?

最簡(jiǎn)單的方法是,將會(huì)話中的每一個(gè)qa對(duì)都當(dāng)做內(nèi)容,和當(dāng)前的query一起送給LLM。并給LLM一個(gè)提示,讓LLM根據(jù)這些內(nèi)容去重寫query。

Prompt指令如下,讓LLM知道是從上下文中,獲取信息。

For an information-seeking dialog, please help reformulate the question into rewrite that 
can fully express the user‘s information needs without the need of context, but also 
generate an informative response to answer the question.

給LLM幾個(gè)重寫的示例
示例中包含了query,和重寫的原因,以及重寫后的query,最后是LLM針對(duì)query的一個(gè)簡(jiǎn)短的回答。

I will give you several example multi-turn dialogs, where each turn contains a question, a
response, and a rewrite. The rewrite part begins with a sentence explaining the reason for 
the rewrite.
Example #1:
Question: What should I consider when buying a phone?
Rewrite: This is the first turn. So the question should be rewritten as: What should I 
consider when buying a phone?
Response: The design of the phone and the overall …
Question: Cool. Which one would you recommend?
Rewrite: Based on Turn 1, you are inquiring about what should be considered when 
buying a phone. So the question should be rewritten as: Cool. Which smartphone would 
you recommend for me?
Response: Just because a phone has everything…
…
Example #2:

?輸入如下:

Your Task (only questions and responses are given):
Context:
Question: What was the basis of the Watergate scandal?
Response: ...
Question: …
Response: …
…
Current Question: So what happened to Nixon?
Rewrite: So what happened to Nixon after the events of the Watergate scandal?
(Now, you should give me the rewrite and an informative response of the **Current 
Question** based on the **Context**. The output format should always be: Rewrite: 
$Reason. So the question should be rewritten as: $Rewrite\nResponse: $Response. Go 
ahead!)

模型輸入如下

Rewrite: Based on all previous turns, Nixon was badly involved in the Watergate scandal. 
So the question should be rewritten as: So what happened to Nixon after the events of the 
Watergate scandal?
Response: With the mounting evidence and loss…

會(huì)話數(shù)據(jù)

C t = (q 1 , r 1 , ..., q t ? 1 , r t ? 1 )?
一般回話都是由N個(gè) query和響應(yīng)構(gòu)成的。根據(jù)模型的可輸入長(zhǎng)度的限制,則可以根據(jù)滑動(dòng)窗口的方式,選取最鄰近的一些query響應(yīng)對(duì)。

思維鏈

思維鏈(CoT)(Wei et al.,2020)誘導(dǎo)大型語(yǔ)言模型將一個(gè)推理任務(wù)分解為多個(gè)中間步驟,從而釋放它們更強(qiáng)的推理能力。在這項(xiàng)工作中,我們還研究了整合推理用戶真實(shí)搜索意圖的思維鏈?zhǔn)欠窨梢蕴岣咧貙懞晚憫?yīng)生成的質(zhì)量。

意圖聚合

將LLM多次的生成的Rewrite query 和 假設(shè)性回答進(jìn)行聚合
在一個(gè)會(huì)話中,可能包含了多次問答。每次都有一個(gè)Rewrite query 和 假設(shè)性回答。我們可以稱做qa對(duì)。
第一種意圖聚合方式: MaxProb
對(duì)于? REW ,沒有假設(shè)性回答。所以可以直接用生成的Rewrite query。對(duì)于 RTR和RAR,則使用(q的向量 + 假設(shè)性回答的向量)/2
?
第二種意圖聚合方式: Self-Consistency (SC)
對(duì)于? REW ,沒有假設(shè)性回答。先算所有生成的Rewrite query 的平均值(叫做中心向量)。然后再算每一個(gè)Rewrite query和中心向量的點(diǎn)積。
第三種意圖聚合方式:使用平均值 Mean
對(duì)于? REW ,沒有假設(shè)性回答。所以可以直接用生成的Rewrite query。注意這里是多輪的query的平均值。最后用平均值,作為搜索意圖,去進(jìn)行搜索。

效果如何

首先,RAR和RTR提示方法的性能明顯優(yōu)于REW提示,這表明生成的假設(shè)響應(yīng)可以有效地補(bǔ)充較短的查詢重寫,從而提高檢索性能。然而,即使是與現(xiàn)有基線相比,即使是簡(jiǎn)單的REW提示也可以實(shí)現(xiàn)相當(dāng)有競(jìng)爭(zhēng)力的性能,特別是在更具挑戰(zhàn)性的CAsT-20和CAsT-21數(shù)據(jù)集上,它顯示了顯著的優(yōu)勢(shì)(例如,CAsT-20上0.380vs.0.350,CAsT-21上0.465vs.0.385)。這些積極的結(jié)果進(jìn)一步突出了利用LLM進(jìn)行對(duì)話搜索的顯著優(yōu)勢(shì)。

Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文),RAG,ES搜索優(yōu)化,query Rewrite,如何在上下文中捕獲搜索意圖,召回提升

其次,在聚合方法方面,Mean和SC始終優(yōu)于MaxProb。這些結(jié)果表明,僅僅依賴于語(yǔ)言模型的頂級(jí)預(yù)測(cè)可能不能提供足夠的可靠性。相反,利用多個(gè)結(jié)果的集體強(qiáng)度被證明是一個(gè)更好的選擇。此外,我們觀察到,平均聚合方法,它將所有生成的內(nèi)容融合到最終的搜索意圖向量中(公式11),并不始終優(yōu)于SC(例如,在CAsT-20上),它實(shí)際上只融合了一個(gè)重寫和一個(gè)響應(yīng)。

?Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文),RAG,ES搜索優(yōu)化,query Rewrite,如何在上下文中捕獲搜索意圖,召回提升

再看一下思維鏈CoT對(duì)結(jié)果的影響

可以明顯看到,不管是在哪種意圖聚合方式下,啟用思維鏈,幾乎總是有正向的效果。

Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文),RAG,ES搜索優(yōu)化,query Rewrite,如何在上下文中捕獲搜索意圖,召回提升?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-827545.html

到了這里,關(guān)于Query Rewrite —— 基于大模型的query擴(kuò)展改寫,綜合考慮上下文信息(人大論文)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【uniapp】獲取url中的參數(shù)this.$route.query或this.$mp.query

    在uniapp中獲取url中的參數(shù)值可以通過 this.$route.query 或者 this.$mp.query 來(lái)獲取。 假設(shè)你要獲取url中的code參數(shù),可以使用以下代碼: 或者 其中,第一種方法適用于h5、APP和微信小程序等平臺(tái),而第二種方法只適用于微信小程序平臺(tái)。

    2024年02月14日
    瀏覽(20)
  • 【SCI一區(qū)】考慮P2G和碳捕集設(shè)備的熱電聯(lián)供綜合能源系統(tǒng)優(yōu)化調(diào)度模型(Matlab代碼實(shí)現(xiàn))

    【SCI一區(qū)】考慮P2G和碳捕集設(shè)備的熱電聯(lián)供綜合能源系統(tǒng)優(yōu)化調(diào)度模型(Matlab代碼實(shí)現(xiàn))

    ? ???????? 歡迎來(lái)到本博客 ???????? ??博主優(yōu)勢(shì): ?????? 博客內(nèi)容盡量做到思維縝密,邏輯清晰,為了方便讀者。 ?? 座右銘: 行百里者,半于九十。 ?????? 本文目錄如下: ?????? 目錄 ??1 概述 ??2 運(yùn)行結(jié)果 2.1 模式1? 2.2 模式2? 2.3 模式3 2.4 模式

    2024年02月04日
    瀏覽(22)
  • ElasticSearch【query語(yǔ)法】

    介紹ES 的query子句的語(yǔ)法,query子句主要用于編寫查詢條件,類似SQL中的where語(yǔ)句。 query子句主要用來(lái)編寫類似SQL的Where語(yǔ)句,支持布爾查詢(and/or)、IN、全文搜索、模糊匹配、范圍查詢(大于小于)。 通過match實(shí)現(xiàn)全文搜索,全文搜索的后面有單獨(dú)的章節(jié)講解,這里大家只要

    2024年02月08日
    瀏覽(28)
  • 【ElasticSearch】query語(yǔ)法

    介紹ES 的query子句的語(yǔ)法,query子句主要用于編寫查詢條件,類似SQL中的where語(yǔ)句。 query子句主要用來(lái)編寫類似SQL的Where語(yǔ)句,支持布爾查詢(and/or)、IN、全文搜索、模糊匹配、范圍查詢(大于小于)。 通過match實(shí)現(xiàn)全文搜索,全文搜索的后面有單獨(dú)的章節(jié)講解,這里大家只要

    2024年02月09日
    瀏覽(24)
  • DataFrame.query()--Pandas

    DataFrame.query()--Pandas

    Pandas 中的一個(gè)函數(shù),用于在 DataFrame 中執(zhí)行查詢操作。這個(gè)方法會(huì)返回一個(gè)新的 DataFrame,其中包含符合查詢條件的數(shù)據(jù)行。請(qǐng)注意,query 方法只能用于篩選行,而不能用于篩選列。 參數(shù) 含義 expr 查詢字符串;對(duì)于不是有效python變量名的列名:如:UnitPrice(USD),需要將列名

    2024年02月11日
    瀏覽(22)
  • css - Media Query

    css - Media Query

    使用bootstrap的grid system可以在一個(gè)較為粗糙的范圍得到較好的響應(yīng)性,但是通過viewport可以看到網(wǎng)站在具體哪個(gè)像素點(diǎn)處變得丑陋,再通過css media query來(lái)精細(xì)調(diào)整網(wǎng)頁(yè)布局。 ?可以通過media query來(lái)提高網(wǎng)頁(yè)移動(dòng)響應(yīng)能力。

    2024年02月15日
    瀏覽(21)
  • Elasticsearch Query DSL

    Elasticsearch Query DSL

    這里使用的 Elasticsearch 的版本為 7.12.1 。 1.1 文檔(Document) ElasticSearch 是面向文檔的,文檔是所有可搜索數(shù)據(jù)的最小單位,例如 MySQL 的一條數(shù)據(jù)記錄。 文檔會(huì)被序列化成為 json 格式,保存在 ElasticSearch 中。 每個(gè)文檔都有一個(gè)唯一 ID,例如 MySQL 中的主鍵 ID。 JSON文檔 一篇文檔包

    2024年02月15日
    瀏覽(18)
  • Elasticsearch:Geoshape query

    Elasticsearch:Geoshape query

    Geoshape 查詢可以用于過濾使用 geo_shape 或 geo_point 類型索引的文檔。 geo_shape 查詢使用與 geo_shape 或 geo_point 映射相同的索引來(lái)查找具有與查詢形狀相關(guān)的形狀的文檔,并使用指定的空間關(guān)系:相交(intersect)、包含(contained)、包含(within)或不相交 (disjoin)。 該查詢支持兩種定

    2024年02月22日
    瀏覽(17)
  • Elasticsearch:DSL Query

    Elasticsearch:DSL Query

    Elasticsearch提供了基于JSON的DSL(Domain Specific Language)來(lái)定義查詢。常見的查詢類型包括: 查詢所有:查詢出所有的數(shù)據(jù),一般測(cè)試用,例如:match_all,但有分頁(yè)限制,一次20條左右 全文檢索(full text)查詢:利用分詞器對(duì)用戶輸入內(nèi)容分詞,然后去倒排索引庫(kù)中匹配。常見的有兩種

    2024年02月10日
    瀏覽(48)
  • [match_phrase_prefix] query does not support [zero_terms_query] 問題解決

    @[TOC][match_phrase_prefix] query does not support [zero_terms_query] 問題解決 elasticsearch版本 :7.8 客戶端elasticsearch : 7.12.1 報(bào)錯(cuò)代碼 match_phrase_prefix在Elasticsearch 7.10版本后才支持zero_terms_query選項(xiàng) https://github.com/elastic/elasticsearch/issues/58468

    2024年02月16日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包