国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ES 向量搜索 function score 報(bào)錯(cuò)

這篇具有很好參考價(jià)值的文章主要介紹了ES 向量搜索 function score 報(bào)錯(cuò)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

reason "function score query returned an invalid score: NaN for doc: 17085

原因是向量搜索定義評(píng)分的計(jì)算方法consineSimilarity的計(jì)算過程中需要對(duì)兩個(gè)向量求模

故,如果全文索引中存在全零向量數(shù)據(jù)時(shí),可以將consineSimilarity計(jì)算換成其它向量相似度計(jì)算方法,例如 dotProduct

GET reference/_search
{ "explain": true, 
  "query": {
    "function_score": {
      "query": {
         "multi_match": {
            "query": "清華大學(xué)藝術(shù)系的小明同學(xué)",
            "fields": ["name", "school", "department", "home_address"]
  
          }
      },
      "functions": [
        {
          "script_score": {
            "script": {
              "source": "(cosineSimilarity(params.query_vector, 'text_vector') + 1.0)*0.6", 
              "params": {
                "query_vector": [0.17213014641107321, 0.03529149917147957, 0.021164631815954453, 0.04276578593911642, -0.011539837034197614, -0.040505111467529525, -0.013804620485218865, 0.07954305265937577, -0.03259408482301212, 0.042030898483276985, -0.08187475423584016, 0.02331000497613773, -0.012518793076655677, 0.028751927085989483, -0.0450599553695574, 0.02574408603742391, -0.012067035100387393, 0.08755896933278114, 0.0043671871492196096]
              }
            }
          }
        },
        {
          "field_value_factor": {
            "field": "page_r", 
            "modifier": "log1p", 
            "factor": 100, 
            "missing": 1
          }
        }
      ],
      "score_mode": "max", 
      "boost_mode": "multiply"
    }
  },
  "_source": ["student_id", "school", "name"], 
  "size": 20
}

consineSimilarity替換為文章來源地址http://www.zghlxwxcb.cn/news/detail-606921.html

"source": "(dopProduct(params.query_vector, 'text_vector') + 1.0)*0.6", 

到了這里,關(guān)于ES 向量搜索 function score 報(bào)錯(cuò)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 自然語言處理(四):全局向量的詞嵌入(GloVe)

    自然語言處理(四):全局向量的詞嵌入(GloVe)

    全局向量的詞嵌入(Global Vectors for Word Representation),通常簡(jiǎn)稱為GloVe,是一種用于將詞語映射到連續(xù)向量空間的詞嵌入方法。它旨在捕捉詞語之間的語義關(guān)系和語法關(guān)系,以便在自然語言處理任務(wù)中能夠更好地表示詞語的語義信息。 GloVe的設(shè)計(jì)基于兩個(gè)觀察結(jié)果:共現(xiàn)矩陣(

    2024年02月11日
    瀏覽(24)
  • 自然語言處理-詞向量模型-Word2Vec

    自然語言處理-詞向量模型-Word2Vec

    通常數(shù)據(jù)的維度越高,能提供的信息也就越多,從而計(jì)算結(jié)果的可靠性就更值得信賴 如何來描述語言的特征呢,通常都在詞的層面上構(gòu)建特征,Word2Vec就是要把詞轉(zhuǎn)換成向量 假設(shè)現(xiàn)在已經(jīng)拿到一份訓(xùn)練好的詞向量,其中每一個(gè)詞都表示為50維的向量 如果在熱度圖中顯示,結(jié)果

    2024年02月09日
    瀏覽(26)
  • 【自然語言處理】理解詞向量、CBOW與Skip-Gram模型

    【自然語言處理】理解詞向量、CBOW與Skip-Gram模型

    由于計(jì)算機(jī)不能直接對(duì)各種字符進(jìn)行運(yùn)算,為此需要將詞的表示進(jìn)行一些轉(zhuǎn)換。因此,在自然語言處理中,通常需要對(duì)輸入的語料進(jìn)行一些預(yù)處理: 其中,如何對(duì)詞匯進(jìn)行表示是很關(guān)鍵的問題,糟糕的表示方法容易導(dǎo)致所謂的 “Garbage in, garbage out”。 對(duì)詞匯的表示,常見的

    2024年02月08日
    瀏覽(18)
  • 2.自然語言處理NLP:詞映射為向量——詞嵌入(word embedding)

    2.自然語言處理NLP:詞映射為向量——詞嵌入(word embedding)

    1. 什么是詞嵌入(word2vec) : 把詞映射為向量(實(shí)數(shù)域)的技術(shù) 2. 為什么不采用one-hot向量: one-hot詞向量無法準(zhǔn)確表達(dá)不同詞之間的相似度,eg:余弦相似度,表示夾角之間的余弦值,無法表達(dá)不同詞之間的相似度。 3. word2vec主要包含哪兩個(gè)模型 跳字模型: 基于某個(gè)詞生成

    2024年02月06日
    瀏覽(32)
  • ai智能搜索生產(chǎn)實(shí)現(xiàn)(低門檻實(shí)現(xiàn)自然語言搜索)

    ai智能搜索生產(chǎn)實(shí)現(xiàn)(低門檻實(shí)現(xiàn)自然語言搜索)

    目錄 實(shí)現(xiàn)思路 原始數(shù)據(jù)預(yù)處理 自然語言處理 業(yè)務(wù)處理 總體架構(gòu) 調(diào)優(yōu) 話術(shù)調(diào)優(yōu) 自然語言搜索是一種搜索方式,用戶可以以自然語言的形式提問或描述他們正在尋找的信息,而不是使用特定的查詢語法或。簡(jiǎn)單來說,就是用戶可以用日常的對(duì)話方式來進(jìn)行搜索。 這種

    2024年03月19日
    瀏覽(30)
  • Elasticsearch的全文搜索和自然語言處理

    Elasticsearch是一個(gè)開源的搜索和分析引擎,基于Lucene庫,具有高性能、可擴(kuò)展性和實(shí)時(shí)性。它廣泛應(yīng)用于企業(yè)級(jí)搜索、日志分析、實(shí)時(shí)數(shù)據(jù)處理等領(lǐng)域。本文將涵蓋Elasticsearch的全文搜索和自然語言處理相關(guān)知識(shí),包括核心概念、算法原理、最佳實(shí)踐和實(shí)際應(yīng)用場(chǎng)景。 2.1 Elast

    2024年02月21日
    瀏覽(25)
  • 自然語言處理從入門到應(yīng)用——LangChain:索引(Indexes)-[向量存儲(chǔ)器(Vectorstores)]

    分類目錄:《大模型從入門到應(yīng)用》總目錄 LangChain系列文章: 基礎(chǔ)知識(shí) 快速入門 安裝與環(huán)境配置 鏈(Chains)、代理(Agent:)和記憶(Memory) 快速開發(fā)聊天模型 模型(Models) 基礎(chǔ)知識(shí) 大型語言模型(LLMs) 基礎(chǔ)知識(shí) LLM的異步API、自定義LLM包裝器、虛假LLM和人類輸入LLM(

    2024年02月12日
    瀏覽(186)
  • 自然語言處理從入門到應(yīng)用——全局向量的詞嵌入:GloVe(Global Vectors for Word Representation)詞向量

    分類目錄:《自然語言處理從入門到應(yīng)用》總目錄 無論是基于神經(jīng)網(wǎng)絡(luò)語言模型還是word2vec的詞向量預(yù)訓(xùn)練方法,本質(zhì)上都是利用文本中詞與詞在局部上下文中的共現(xiàn)信息作為自監(jiān)督學(xué)習(xí)信號(hào)。除此之外,另一類常用于估計(jì)詞向量的方法是基于矩陣分解的方法,例如潛在語義

    2024年02月09日
    瀏覽(23)
  • 自然語言處理從入門到應(yīng)用——靜態(tài)詞向量預(yù)訓(xùn)練模型:神經(jīng)網(wǎng)絡(luò)語言模型(Neural Network Language Model)

    自然語言處理從入門到應(yīng)用——靜態(tài)詞向量預(yù)訓(xùn)練模型:神經(jīng)網(wǎng)絡(luò)語言模型(Neural Network Language Model)

    分類目錄:《自然語言處理從入門到應(yīng)用》總目錄 《自然語言處理從入門到應(yīng)用——自然語言處理的語言模型(Language Model,LM)》中介紹了語言模型的基本概念,以及經(jīng)典的基于離散符號(hào)表示的N元語言模型(N-gram Language Model)。從語言模型的角度來看,N元語言模型存在明顯

    2024年02月09日
    瀏覽(21)
  • 自然語言處理14-基于文本向量和歐氏距離相似度的文本匹配,用于找到與查詢語句最相似的文本

    大家好,我是微學(xué)AI,今天給大家介紹一下自然語言處理實(shí)戰(zhàn)項(xiàng)目14-基于文本向量和歐氏距離相似度的文本匹配,用于找到與查詢語句最相似的文本。NLP中的文本匹配是指通過計(jì)算文本之間的相似度來找到與查詢語句最相似的文本。其中一種常用的方法是基于文本向量和歐氏

    2024年02月15日
    瀏覽(19)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包