国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<tfoot id="e7tuv"></tfoot>

<optgroup id="e7tuv"></optgroup>

ES forceMerge 強制段合并為什么會提升檢索性能？

2年前作者：水的精神分類：Toy博客閱讀(31)違法舉報

這篇具有很好參考價值的文章主要介紹了ES forceMerge 強制段合并為什么會提升檢索性能？。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

? 根據(jù)以前的測試，forceMerge段合并，將段的個數(shù)合并成一個。帶來了將近一倍的性能提升，測試過程文檔（請參考我的另外一篇文章）：ES優(yōu)化實戰(zhàn)- forceMerge搜索提升測試報告_es forcemerge_水的精神的博客-CSDN博客

? 注意，這次測試，只是這對一個長文本字段（就像一篇文章）的檢索測試。假如同時對多個字段做檢索，帶來的性能會好更多！

? 時間已經(jīng)過去了許久，對檢索的原理，對es集群的理解也有了更高的層次。再寫一篇文章，來講講為什么會性能提升。講講段合并的適用場景，以及需要注意的事項。用的好了性能提升很多，用的不好，性能反而降低很多。

能夠提升的原理

在 Elasticsearch 中，Lucene 索引被分為多個段（segments）以提高查詢性能。每個段都是一個完整的 Lucene 索引，包含一部分?jǐn)?shù)據(jù)。當(dāng)一個文檔被添加到索引中時，它會被添加到一個新的段中。這些新的段需要合并到更大的段中，以便更快地執(zhí)行搜索操作。

forceMerge 是 Elasticsearch 提供的一個 API，可以將多個段合并成一個更大的段。這個過程可以通過減少段數(shù)來提高性能，因為

更少的段意味著更少的搜索和查詢操作需要執(zhí)行。

這可以減少內(nèi)存使用

因為段其實就是底層的一個個小文件。將小文件合并成大文件，毋庸置疑的是，去IO 1個G的一個文件，和IO將拆分每個10M的小文件，用的時間肯定是不一樣的。IO一個大文件速度會更快一些。

并減少查詢所需的磁盤 I/O 操作次數(shù)。

根據(jù)lucene的檢索原理，默認(rèn)，lucene在段中的檢索，是單線程的。大體的流程是，串性在每個段中執(zhí)行檢索，然后再做結(jié)果的reduce合并。假如將所有的段合并成一個段，那么檢索起來，至少在一個分片中。是不用做數(shù)據(jù)合并的。

當(dāng) Elasticsearch 需要執(zhí)行搜索時，它必須在所有分片的所有段上執(zhí)行查詢。如果分片中包含大量小段，則需要執(zhí)行的查詢次數(shù)將非常多，從而導(dǎo)致搜索性能下降。如果使用 forceMerge 將這些小段合并為更大的段，則查詢次數(shù)將減少，并且查詢性能將得到顯著提高。文章來源地址http://www.zghlxwxcb.cn/news/detail-759796.html

forceMerge注意事項

但是，需要注意的是，forceMerge 操作是一項資源密集型操作，會消耗大量的 CPU、磁盤和內(nèi)存資源。這也是為什么官方默認(rèn)只給一個merge線程。這個過程一定會影響到查詢的性能，寫入的性能。

此外，forceMerge 過程中，需要花費一倍的磁盤空間?？梢院唵蔚乃鼤r間上就像是一個reindex過程，在reindex完成之前，你的集群中存放的數(shù)據(jù)它就一定是雙倍的。只有等合并完成，它才會將原來的刪掉。因為它將多個段合并為一個更大的段。這可能會對磁盤空間產(chǎn)生影響，因此需要確保有足夠的磁盤空間可供使用。

一定一定要注意。這項操作，建議只對不變更的數(shù)據(jù)做merge成一個段的操作。因為假如何合并完成后，再有更新，或者新寫入，仍然會產(chǎn)生很多新的段。這會讓檢索性能降低很多。因為forceMerge 是一個強制的操作。但是新加進來的段，根據(jù)合并策略，它是沒有辦法和原來的段合并的！

到了這里，關(guān)于ES forceMerge 強制段合并為什么會提升檢索性能？的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

Elasticsearch 為什么能做到快速檢索？秘密在這里！，Java全棧知識體系
如果你了解 ES 應(yīng)該知道，ES 可以說是對 Lucene 的一個封裝，里面關(guān)于倒排索引的實現(xiàn)就是通過 lucene 這個 jar 包提供的 API 實現(xiàn)的，所以下面講的關(guān)于倒排索引的內(nèi)容實際上都是 lucene 里面的內(nèi)容。三、倒排索引首先我們還不能忘了我們之前提的搜索需求，先看下建立倒排索引
2024年04月12日
瀏覽(19)
一文了解以太坊為什么合并及未來升級規(guī)劃
一、什么是以太坊升級以太坊升級最初被稱為「ETH 2.0」或「寧靜（Serenity）」，是一次規(guī)劃已久的以太坊網(wǎng)絡(luò)重大升級，將使以太坊網(wǎng)絡(luò)具有更好的可擴展性、安全性和可持續(xù)性。二、為什么要進行升級眾所周知，以太坊正面臨著網(wǎng)絡(luò)擁堵、運行節(jié)點門檻高、能源損耗大等
2023年04月08日
瀏覽(26)
為什么視頻畫質(zhì)會變差，如何提升視頻畫質(zhì)清晰度。
在數(shù)字時代，視頻已經(jīng)成為我們生活中不可或缺的一部分。然而，隨著視頻的傳輸和處理過程中的多次壓縮，畫質(zhì)損失逐漸凸顯，影響了我們對影像的真實感受。為了讓視頻畫質(zhì)更加清晰、逼真，我們需要采取一些措施來保護和修復(fù)視頻畫質(zhì)，還原影像的真實之美。 1、錄制
2024年02月16日
瀏覽(18)
小紅書沒人點贊是為什么?如何提升筆記點贊
隨著小紅書規(guī)模的逐漸擴大，活躍用戶的數(shù)量逐漸增多，也會讓很多人產(chǎn)生一種疑問：為什么月活用戶那么多，但是自己的小紅書沒人點贊。今天就來和大家一起談?wù)勥@個問題，小紅書沒人點贊是為什么，有哪些情況會造成這種現(xiàn)象? 一、哪些情況造成小紅書沒人點贊這樣一
2023年04月15日
瀏覽(19)
為什么說es是近實時搜索
首先要理解es的存儲結(jié)構(gòu)：一個index的數(shù)據(jù)，分散在多個shard(分片)，一個分片又有很多segment(段)，es是數(shù)據(jù)不可變模型，更新數(shù)據(jù)只是新增一個版本。 es是怎么寫數(shù)據(jù)的？每次寫的時候，首先會寫到es的內(nèi)存(每個分片的內(nèi)存)，這時寫的數(shù)據(jù)是不可搜索的；然后每個分片默認(rèn)每
2024年02月11日
瀏覽(23)
ElasticSearch(七)：ES查詢速度為什么那么快
介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件，詳情信息可以查看文檔： spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容，都會我的Git上同步（GitHub同步）GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引，在對搜索內(nèi)容進行分詞的時候，會根據(jù)搜索內(nèi)容分詞結(jié)
2023年04月08日
瀏覽(31)
ElasticSearch第七講：ES查詢速度為什么那么快
介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件，詳情信息可以查看文檔： spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容，都會我的Git上同步（GitHub同步）GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引，在對搜索內(nèi)容進行分詞的時候，會根據(jù)搜索內(nèi)容分詞結(jié)
2023年04月19日
瀏覽(23)
入門ElasticSearch ：為什么選擇ES作為搜索引擎？
隨著數(shù)據(jù)量的不斷增長，搜索和分析大規(guī)模數(shù)據(jù)集變得越來越重要。傳統(tǒng)數(shù)據(jù)庫在面對這種需求時往往表現(xiàn)不佳，這時候就需要一種專門用于搜索和分析的引擎。ElasticSearch （簡稱ES）就是這樣一款強大的搜索引擎，它具有許多優(yōu)勢，使得它成為許多企業(yè)和開發(fā)者的首選。簡
2024年02月09日
瀏覽(23)
ElasticSearch第七講 ES查詢速度為什么那么快
介紹給大家一個開源SpringCloud項目。整合了大部分開源中間件，詳情信息可以查看文檔： spring cloud開源組件開發(fā) 另外自己以后博客所講解的代碼內(nèi)容，都會我的Git上同步（GitHub同步）GIT地址 ES使用的數(shù)據(jù)結(jié)構(gòu)是倒排索引，在對搜索內(nèi)容進行分詞的時候，會根據(jù)搜索內(nèi)容分詞結(jié)
2023年04月25日
瀏覽(31)
Kafka為什么在消息積壓時不能直接通過消費者水平擴容來提升消費速度?
我們知道當(dāng)消息生產(chǎn)者生產(chǎn)的速度快于消費者的消費速度時，會產(chǎn)生大量的消息積壓，大多數(shù)人的想法是增加消費者的數(shù)量來提升消費速度，這個想法在RocketMQ中是可行的，但是在Kafka中不一定可行。為了更方便地分析問題，我們先忽略消費者組的設(shè)計，在增加消費者之前，架
2024年01月22日
瀏覽(24)

<i id="x0ezw"><s id="x0ezw"><small id="x0ezw"></small></s></i>

<del id="x0ezw"><thead id="x0ezw"></thead></del>

<tfoot id="x0ezw"></tfoot>