国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ES forceMerge 強制段合并為什么會提升檢索性能?

這篇具有很好參考價值的文章主要介紹了ES forceMerge 強制段合并為什么會提升檢索性能?。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

? 根據(jù)以前的測試,forceMerge段合并,將段的個數(shù)合并成一個。帶來了將近一倍的性能提升,測試過程文檔(請參考我的另外一篇文章):ES優(yōu)化實戰(zhàn)- forceMerge搜索提升測試報告_es forcemerge_水的精神的博客-CSDN博客

? 注意,這次測試,只是這對一個長文本字段(就像一篇文章)的檢索測試。假如同時對多個字段做檢索,帶來的性能會好更多!

? 時間已經(jīng)過去了許久,對檢索的原理,對es集群的理解也有了更高的層次。再寫一篇文章,來講講為什么會性能提升。講講段合并的適用場景,以及需要注意的事項。用的好了性能提升很多,用的不好,性能反而降低很多。


能夠提升的原理

在 Elasticsearch 中,Lucene 索引被分為多個段(segments)以提高查詢性能。每個段都是一個完整的 Lucene 索引,包含一部分?jǐn)?shù)據(jù)。當(dāng)一個文檔被添加到索引中時,它會被添加到一個新的段中。這些新的段需要合并到更大的段中,以便更快地執(zhí)行搜索操作。

forceMerge 是 Elasticsearch 提供的一個 API,可以將多個段合并成一個更大的段。這個過程可以通過減少段數(shù)來提高性能,因為

  • 更少的段意味著更少的搜索和查詢操作需要執(zhí)行。
  • 這可以減少內(nèi)存使用
  • 因為段其實就是底層的一個個小文件。將小文件合并成大文件,毋庸置疑的是,去IO 1個G的一個文件,和IO將拆分每個10M的小文件,用的時間肯定是不一樣的。IO一個大文件速度會更快一些。
  • 并減少查詢所需的磁盤 I/O 操作次數(shù)。
  • 根據(jù)lucene的檢索原理,默認(rèn),lucene在段中的檢索,是單線程的。大體的流程是,串性在每個段中執(zhí)行檢索,然后再做結(jié)果的reduce合并。假如將所有的段合并成一個段,那么檢索起來,至少在一個分片中。是不用做數(shù)據(jù)合并的。

當(dāng) Elasticsearch 需要執(zhí)行搜索時,它必須在所有分片的所有段上執(zhí)行查詢。如果分片中包含大量小段,則需要執(zhí)行的查詢次數(shù)將非常多,從而導(dǎo)致搜索性能下降。如果使用 forceMerge 將這些小段合并為更大的段,則查詢次數(shù)將減少,并且查詢性能將得到顯著提高。文章來源地址http://www.zghlxwxcb.cn/news/detail-759796.html

forceMerge注意事項

  • 但是,需要注意的是,forceMerge 操作是一項資源密集型操作,會消耗大量的 CPU、磁盤和內(nèi)存資源。這也是為什么官方默認(rèn)只給一個merge線程。這個過程一定會影響到查詢的性能,寫入的性能。
  • 此外,forceMerge 過程中,需要花費一倍的磁盤空間??梢院唵蔚乃鼤r間上就像是一個reindex過程,在reindex完成之前,你的集群中存放的數(shù)據(jù)它就一定是雙倍的。只有等合并完成,它才會將原來的刪掉。因為它將多個段合并為一個更大的段。這可能會對磁盤空間產(chǎn)生影響,因此需要確保有足夠的磁盤空間可供使用。
  • 一定一定要注意。這項操作,建議只對不變更的數(shù)據(jù)做merge成一個段的操作。因為假如何合并完成后,再有更新,或者新寫入,仍然會產(chǎn)生很多新的段。這會讓檢索性能降低很多。因為forceMerge 是一個強制的操作。但是新加進來的段,根據(jù)合并策略,它是沒有辦法和原來的段合并的!

到了這里,關(guān)于ES forceMerge 強制段合并為什么會提升檢索性能?的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • Elasticsearch 為什么能做到快速檢索?秘密在這里!,Java全棧知識體系

    Elasticsearch 為什么能做到快速檢索?秘密在這里!,Java全棧知識體系

    如果你了解 ES 應(yīng)該知道,ES 可以說是對 Lucene 的一個封裝,里面關(guān)于倒排索引的實現(xiàn)就是通過 lucene 這個 jar 包提供的 API 實現(xiàn)的,所以下面講的關(guān)于倒排索引的內(nèi)容實際上都是 lucene 里面的內(nèi)容。 三、倒排索引 首先我們還不能忘了我們之前提的搜索需求,先看下建立倒排索引

    2024年04月12日
    瀏覽(19)
  • 一文了解以太坊為什么合并及未來升級規(guī)劃

    一文了解以太坊為什么合并及未來升級規(guī)劃

    一、什么是以太坊升級 以太坊升級最初被稱為「ETH 2.0」或「寧靜(Serenity)」,是一次規(guī)劃已久的以太坊網(wǎng)絡(luò)重大升級,將使以太坊網(wǎng)絡(luò)具有更好的可擴展性、安全性和可持續(xù)性。 二、為什么要進行升級 眾所周知,以太坊正面臨著網(wǎng)絡(luò)擁堵、運行節(jié)點門檻高、能源損耗大等

    2023年04月08日
    瀏覽(26)
  • 為什么視頻畫質(zhì)會變差,如何提升視頻畫質(zhì)清晰度。

    為什么視頻畫質(zhì)會變差,如何提升視頻畫質(zhì)清晰度。

    在數(shù)字時代,視頻已經(jīng)成為我們生活中不可或缺的一部分。然而,隨著視頻的傳輸和處理過程中的多次壓縮,畫質(zhì)損失逐漸凸顯,影響了我們對影像的真實感受。為了讓視頻畫質(zhì)更加清晰、逼真,我們需要采取一些措施來保護和修復(fù)視頻畫質(zhì),還原影像的真實之美。 1、錄制

    2024年02月16日
    瀏覽(18)
  • 小紅書沒人點贊是為什么?如何提升筆記點贊

    隨著小紅書規(guī)模的逐漸擴大,活躍用戶的數(shù)量逐漸增多,也會讓很多人產(chǎn)生一種疑問:為什么月活用戶那么多,但是自己的小紅書沒人點贊。今天就來和大家一起談?wù)勥@個問題,小紅書沒人點贊是為什么,有哪些情況會造成這種現(xiàn)象? 一、哪些情況造成小紅書沒人點贊這樣一

    2023年04月15日
    瀏覽(19)
  • 為什么說es是近實時搜索

    首先要理解es的存儲結(jié)構(gòu): 一個index的數(shù)據(jù),分散在多個shard(分片),一個分片又有很多segment(段),es是數(shù)據(jù)不可變模型,更新數(shù)據(jù)只是新增一個版本。 es是怎么寫數(shù)據(jù)的? 每次寫的時候,首先會寫到es的內(nèi)存(每個分片的內(nèi)存),這時寫的數(shù)據(jù)是不可搜索的;然后每個分片默認(rèn)每

    2024年02月11日
    瀏覽(23)
  • ElasticSearch(七):ES查詢速度為什么那么快

    ElasticSearch(七):ES查詢速度為什么那么快

    介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件,詳情信息可以查看文檔: spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容,都會我的Git上同步(GitHub同步)GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引,在對搜索內(nèi)容進行分詞的時候,會根據(jù)搜索內(nèi)容分詞結(jié)

    2023年04月08日
    瀏覽(31)
  • ElasticSearch第七講:ES查詢速度為什么那么快

    ElasticSearch第七講:ES查詢速度為什么那么快

    介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件,詳情信息可以查看文檔: spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容,都會我的Git上同步(GitHub同步)GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引,在對搜索內(nèi)容進行分詞的時候,會根據(jù)搜索內(nèi)容分詞結(jié)

    2023年04月19日
    瀏覽(23)
  • 入門ElasticSearch :為什么選擇ES作為搜索引擎?

    隨著數(shù)據(jù)量的不斷增長,搜索和分析大規(guī)模數(shù)據(jù)集變得越來越重要。傳統(tǒng)數(shù)據(jù)庫在面對這種需求時往往表現(xiàn)不佳,這時候就需要一種專門用于搜索和分析的引擎。ElasticSearch (簡稱ES)就是這樣一款強大的搜索引擎,它具有許多優(yōu)勢,使得它成為許多企業(yè)和開發(fā)者的首選。 簡

    2024年02月09日
    瀏覽(23)
  • ElasticSearch第七講 ES查詢速度為什么那么快

    ElasticSearch第七講 ES查詢速度為什么那么快

    介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件,詳情信息可以查看文檔: spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容,都會我的Git上同步(GitHub同步)GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引,在對搜索內(nèi)容進行分詞的時候,會根據(jù)搜索內(nèi)容分詞結(jié)

    2023年04月25日
    瀏覽(31)
  • Kafka為什么在消息積壓時不能直接通過消費者水平擴容來提升消費速度?

    Kafka為什么在消息積壓時不能直接通過消費者水平擴容來提升消費速度?

    我們知道當(dāng)消息生產(chǎn)者生產(chǎn)的速度快于消費者的消費速度時,會產(chǎn)生大量的消息積壓,大多數(shù)人的想法是增加消費者的數(shù)量來提升消費速度,這個想法在RocketMQ中是可行的,但是在Kafka中不一定可行。為了更方便地分析問題,我們先忽略消費者組的設(shè)計,在增加消費者之前,架

    2024年01月22日
    瀏覽(24)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包