国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【HBZ分享】ES的評分score機(jī)制的原理

這篇具有很好參考價(jià)值的文章主要介紹了【HBZ分享】ES的評分score機(jī)制的原理。希望對大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

score類型

  1. 基礎(chǔ)評分boost,默認(rèn)2.2,
  2. 逆向文檔頻率值(IDF):表示該詞再文檔中(ES中)出現(xiàn)的次數(shù)越多,表示越不重要,評分越低
  3. 關(guān)鍵詞在文檔中出現(xiàn)的頻率(TF):表示該詞在文檔中出現(xiàn)的頻率,頻率越高表示越重要,評分越高
    注意: IDF是出現(xiàn)次數(shù)越多,則評分越低, 而TF是出現(xiàn)次數(shù)越高,則評分越高,一正一反

score評分機(jī)制的計(jì)算

  1. boost × idf × tf
  2. 字段的權(quán)重 × 逆向文檔頻率的值 × 關(guān)鍵詞在文檔中出現(xiàn)的頻率值

ES查詢時(shí)帶上評分計(jì)算

加上explain 和mysql查看索引使用情況是同一個(gè)詞
GET /test_index/_search?explain=true

如何自定義評分機(jī)制

  1. 權(quán)重配置: 通過指定boost基礎(chǔ)評分,來定制總評分, 查詢請求如下,需要指定boost,來定制哪個(gè)詞查詢基礎(chǔ)分更大,即相同頻率下該次就會評分更高,會放在前面
GET /test_index/_search
{
	"query": {
		"bool": {
			"should": [
				{
					"match": {
						"summary": {"query": "boot", "boost": 1} // 指定查boot的基礎(chǔ)評分boost = 1, 不指定boost則默認(rèn)2.2
					}
				}, 
				{
					"match": {
						"summary": {"query": "java", "boost": 3} // 指定查boot的基礎(chǔ)評分boost = 3, 不指定boost則默認(rèn)2.2
					}
				}, 
				{
					"match": {
						"summary": {"query": "cloud", "boost": 1} // 指定查boot的基礎(chǔ)評分boost = 1, 不指定boost則默認(rèn)2.2
					}
				},
				{
					"match": {
						"summary": {"query": "spring", "boost": 1} // 指定查boot的基礎(chǔ)評分boost = 1, 不指定boost則默認(rèn)2.2
					}
				}, 
			]
		}
	}
}
  1. 公式定制化: ES提供了一些內(nèi)置評分函數(shù)(BM25), 根據(jù)需要進(jìn)行參數(shù)調(diào)整,或者使用自定義評分函數(shù)來實(shí)現(xiàn)
  2. 自定義評分插件

文章來源地址http://www.zghlxwxcb.cn/news/detail-639068.html

到了這里,關(guān)于【HBZ分享】ES的評分score機(jī)制的原理的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • ElasticSearch[八]:自定義評分功能、使用場景講解以及 function_score常用的字段解釋

    ElasticSearch[八]:自定義評分功能、使用場景講解以及 function_score常用的字段解釋

    基本介紹 ES 的使用中,ES 會對我們匹配文檔進(jìn)行相關(guān)度評分。但對于一些定制化的場景,默認(rèn)評分規(guī)則滿足不了我們的要求。這些定制化場景,ES 也是推出了自定義評分方式來進(jìn)行支持??梢允褂?ES 提供的一些函數(shù),什么可以使用較分來讓我們的評分規(guī)則多樣化。我舉個(gè)大

    2024年01月24日
    瀏覽(22)
  • 【HBZ分享】ES分詞器的拆分規(guī)則 及 算法

    常見的分詞器,如Standard分詞器、Simple分詞器、Whitespace分詞器、IK分詞等,還支持自定義分詞器(比如一些小國家的語言需要自定義分詞器) ES默認(rèn)就是Standard分詞器 標(biāo)記化 :分詞器第一步是將文本拆分成單個(gè)標(biāo)記(tokens), 就是單個(gè)的單詞或中文詞組,這個(gè)標(biāo)記可以是單詞,數(shù)組

    2024年02月06日
    瀏覽(21)
  • ES(6)查詢評分機(jī)制

    基于詞頻和逆文檔詞頻公式簡稱 TF-IDF公式 得分 = boost(權(quán)重) * idf * tf 分?jǐn)?shù)越高查詢到的位置越靠前 Term Frequency: 搜索文本中的各個(gè)詞條(term) 在查詢文本中出現(xiàn)了多少次,次數(shù)越多評分越高 Inverse Document Frequency: 搜索文本中的各個(gè)詞條在整個(gè)索引的所有文檔中出現(xiàn)了多少次,出

    2024年02月15日
    瀏覽(19)
  • elasticsearch[七]:ES評分規(guī)則詳解[查詢評分規(guī)則、自定義評分規(guī)則]

    elasticsearch[七]:ES評分規(guī)則詳解[查詢評分規(guī)則、自定義評分規(guī)則]

    因?yàn)樾枰獙λ阉鹘Y(jié)果進(jìn)行一個(gè)統(tǒng)一化的評分,因此需要仔細(xì)研究 ES 本身的評分規(guī)則從而想辦法把評分統(tǒng)一。 省流:無法確切統(tǒng)一化 之前有說過 ES 的查詢評分原理,那么仔細(xì)思考之后就會發(fā)現(xiàn),長文本搜索對應(yīng)的 score 會比短文本搜索的 score 高很多:score = 單個(gè)分詞評分之和

    2024年01月20日
    瀏覽(26)
  • [HBZ分享] 小米手機(jī)如何解BL鎖

    [HBZ分享] 小米手機(jī)如何解BL鎖

    第一步: 進(jìn)入【設(shè)置—我的設(shè)備–全部參數(shù)–連續(xù)瘋狂的點(diǎn)MIUI版本那一行】 第二步:進(jìn)入【更多設(shè)置–開發(fā)者模式】,打開USB調(diào)試 與 USB安裝 第三步:進(jìn)入【更多設(shè)置–開發(fā)者模式】,進(jìn)入【設(shè)別解鎖狀態(tài)】,在下方有一個(gè)【綁定賬號和設(shè)備】按鈕,點(diǎn)擊這個(gè)按鈕進(jìn)行綁定

    2024年02月07日
    瀏覽(28)
  • 【HBZ分享】TCP可靠性傳輸如何保證的?

    ACK機(jī)制是發(fā)送方與接收方的一個(gè)相互確認(rèn) 客戶端向服務(wù)端發(fā)送連接請求,此時(shí)服務(wù)端要回饋給客戶端ACK,以表示服務(wù)端接到了客戶端請求,這是第一和的第二次握手 客戶端接收到服務(wù)端響應(yīng)后,同樣也要回饋服務(wù)端的響應(yīng),告知服務(wù)端我收到了你的回饋,我們可以進(jìn)行傳輸

    2024年02月10日
    瀏覽(20)
  • Python爬蟲案例分享【爬取豆瓣電影排行榜的電影名稱和評分】

    注意:在運(yùn)行此代碼之前,請確保已安裝 requests 和 beautifulsoup4 庫

    2024年01月19日
    瀏覽(34)
  • 【HBZ分享】高并發(fā)下Redis+Nginx+Lua+Canal架構(gòu)體系設(shè)計(jì)

    設(shè)計(jì)簡單,可以支持普通并發(fā)現(xiàn)的大部分需求,但如果并發(fā)太高,該方案依然無法支撐。 瓶頸卡在tomcat的并發(fā)量低 通過lua直連redis nginx判斷是否從nginx中直接獲取緩存,如果需要獲取,則通過lua直接去redis讀取,并返回,整個(gè)過程不需要經(jīng)歷應(yīng)用程序這層,所以性能很高,單

    2024年02月12日
    瀏覽(47)
  • 分類模型評估(混淆矩陣, precision, recall, f1-score)的原理和Python實(shí)現(xiàn)

    當(dāng)我們已經(jīng)獲取到一個(gè)分類模型的預(yù)測值,可以通過不同指標(biāo)來進(jìn)行評估。 往往衡量二分類模型是基于以下的混淆矩陣概念: True Positive:真實(shí)值為正、預(yù)測值為正(真陽性) False Positive:真實(shí)值為負(fù)、預(yù)測值為正(假陽性) False Negative:真實(shí)值為正、預(yù)測值為負(fù)(假陰性)

    2024年02月04日
    瀏覽(27)
  • ElasticSearch內(nèi)容分享(四):ES搜索引擎

    ElasticSearch內(nèi)容分享(四):ES搜索引擎

    目錄 ES搜索引擎 1. DSL設(shè)置查詢條件 1.1 DSL查詢分類 1.2 全文檢索查詢 1.2.1 使用場景 1.2.2 match查詢 1.2.3 mulit_match查詢 1.3 精準(zhǔn)查詢 1.3.1 term查詢 1.3.2 range查詢 1.4 地理坐標(biāo)查詢 1.4.1 矩形范圍查詢 1.4.2 附近(圓形)查詢 1.5 復(fù)合查詢 1.5.0 復(fù)合查詢歸納 1.5.1 相關(guān)性算分 1.5.2 算分函數(shù)查

    2024年02月05日
    瀏覽(25)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包