国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<b id="a98qa"><wbr id="a98qa"><center id="a98qa"></center></wbr></b>

<option id="a98qa"><samp id="a98qa"><legend id="a98qa"></legend></samp></option>

<form id="a98qa"><ruby id="a98qa"><tbody id="a98qa"></tbody></ruby></form>

ElasticSearch分頁(yè)查詢緩慢問(wèn)題記錄

2年前作者：尋找桃子的果然分類：Toy博客閱讀(23)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了ElasticSearch分頁(yè)查詢緩慢問(wèn)題記錄。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

ES 分頁(yè)查詢緩慢或全量查詢慢問(wèn)題

背景

前段時(shí)間因?yàn)?strong>數(shù)據(jù)量越來(lái)越大，導(dǎo)致數(shù)據(jù)庫(kù)的查詢壓力越來(lái)越大。所以決定將數(shù)據(jù)刷入到ES中進(jìn)行查詢，以提高查詢速度。想法是好的，測(cè)試環(huán)境也沒(méi)有仔細(xì)測(cè)。心想ES查詢總不會(huì)慢了。再慢能慢到哪里去。放心大膽的上了生產(chǎn)環(huán)境，結(jié)果給我好好的上了一課。

因?yàn)橛腥坎樵償?shù)據(jù)的業(yè)務(wù)，而在我們自己封裝的包里只有封裝好的分頁(yè)查詢方法。按寫(xiě)SQL的思維形式來(lái)想，既然封裝好的ES的基礎(chǔ)包中沒(méi)有全量查詢數(shù)據(jù)的方式，那就分頁(yè)查詢唄，直到全部查詢完畢。應(yīng)該也不會(huì)太慢。再慢能慢過(guò)數(shù)據(jù)庫(kù)嗎？

一旦喜歡上誰(shuí)就別無(wú)所求，只要每天能見(jiàn)到他就已經(jīng)覺(jué)得很慶幸，一輩子很短，如白駒過(guò)隙，轉(zhuǎn)瞬即逝。可這種心情很長(zhǎng)，如高山大川，綿延不絕。 ——《武林外傳》

發(fā)現(xiàn)問(wèn)題

就在上線之后的第二天。突然有人反饋說(shuō)用到了全量查詢的業(yè)務(wù)特別的慢。創(chuàng)建好的任務(wù)要兩三個(gè)小時(shí)以后才執(zhí)行。而在此之前，這個(gè)任務(wù)最多也就是5分鐘也開(kāi)始執(zhí)行了，我先是心頭一緊，心想完了，難道是做了個(gè)負(fù)優(yōu)化。難道查詢ES 真沒(méi)有數(shù)據(jù)庫(kù)快嗎？是不是網(wǎng)絡(luò)問(wèn)題？是不是查詢語(yǔ)句我寫(xiě)的有問(wèn)題影響效率了？

定位問(wèn)題

帶著關(guān)鍵字去生產(chǎn)上查了日志。先查到的是一個(gè)查詢語(yǔ)句的日志?？吹揭院蟪泽@了。語(yǔ)句之大，五六屏放不下。吃驚之后就想，會(huì)不會(huì)是這個(gè)查詢條件放的太多了？導(dǎo)致查詢速率瞬間下降。一方面反思查詢的時(shí)候不應(yīng)該這么查詢，代碼不能這么寫(xiě)。一方面將查詢語(yǔ)句拿出來(lái)，放到ES Head 里面查一下，看看到底有多慢。

查了以后，結(jié)果還是很出乎我的意料的。盡管條件賊老長(zhǎng)，可是ES不愧是ES，還是匹配的很快。200ms左右。這結(jié)果讓我瞬間麻爪，不知該如何繼續(xù)了?？墒侨罩纠锩娲蛴〉拇_實(shí)是兩三分鐘之后才返回了查詢結(jié)果。

突然沒(méi)了方向。那就先查查ES如何來(lái)實(shí)現(xiàn)分頁(yè)或者全量數(shù)據(jù)的查詢。通過(guò) 這篇文章 查到了三種方式：

from size 查詢方式
scroll 深分頁(yè)查詢
searchAfter 深分頁(yè)查詢

三種方式簡(jiǎn)單來(lái)說(shuō)一下區(qū)別：

分頁(yè)方式	特性
from size 查詢	適合小數(shù)據(jù)量的情況（10000-50000的數(shù)據(jù)左右）越往后時(shí)間越長(zhǎng)，性能越差
scroll 查詢	能解決深分頁(yè)問(wèn)題，但是生成了數(shù)據(jù)快照，比較耗費(fèi)資源。由于快照，不支持增量數(shù)據(jù)查詢，不支持跳頁(yè)
searchAfter查詢	能解決深分頁(yè)問(wèn)題，且能實(shí)時(shí)反應(yīng)增刪的數(shù)據(jù)，不支持跳頁(yè)，數(shù)據(jù)需要有唯一的標(biāo)識(shí)

你是藏在云層里的月亮??，也是我窮極一生尋找的寶藏

三種方式的區(qū)別大致如此，詳細(xì)一些，上面的文章或者這篇文章寫(xiě)的還是蠻詳細(xì)的。

看到這里已經(jīng)看到了實(shí)現(xiàn)方式以及區(qū)別，接下來(lái)就是看包里封裝的分頁(yè)查詢邏輯是如何實(shí)現(xiàn)的。

es scroll查詢很慢,elasticsearch,數(shù)據(jù)庫(kù),java
從圖中可以看到，參數(shù)中的from參數(shù) 并沒(méi)有使用，查詢的時(shí)候只是設(shè)置了 offset參數(shù)。那猜測(cè)一下，應(yīng)該是用了第一種 from size 的查詢方式 不過(guò)默認(rèn)from 應(yīng)該設(shè)置了0。這樣看的話，選擇了性能最差的一種，確實(shí)是慢的應(yīng)該了。繼續(xù)往下看，

es scroll查詢很慢,elasticsearch,數(shù)據(jù)庫(kù),java

如果有searchAfter 那么，會(huì)使用searchAfter查詢。否則使用了Scroll查詢。看來(lái)使用from size 方式 的同時(shí)就已經(jīng)在為scroll方式打基礎(chǔ)了。那么我們傳入的from參數(shù) 是什么時(shí)候使用的呢？
es scroll查詢很慢,elasticsearch,數(shù)據(jù)庫(kù),java
繼續(xù)讀代碼，發(fā)現(xiàn)邏輯是，如果第一次使用 from size 方式 查詢的數(shù)據(jù)滿足偏移量，那么就直接返回，否則使用scroll方式繼續(xù)查詢，直到滿足條件為止。

也許是不懂想要的愛(ài)，才會(huì)一再受到傷害。也許是背負(fù)很多次失敗，才能妥善的窺見(jiàn)未來(lái)。那些被心酸辜負(fù)劫走的小幸福，希望他還能認(rèn)識(shí)路，早點(diǎn)回來(lái)

破案了

通過(guò)上面的分析來(lái)看，雖然包里封裝的確實(shí)是，能通過(guò)分頁(yè)查詢到我們需要的數(shù)據(jù)，但是再來(lái)看一下我調(diào)用的地方：
es scroll查詢很慢,elasticsearch,數(shù)據(jù)庫(kù),java
為了查詢到全部的數(shù)據(jù)，我是每次查詢5000條，然后通過(guò)第一次返回的總數(shù)，來(lái)計(jì)算總共要查詢多少次，接著就是循環(huán)修改 頁(yè)碼并且調(diào)用包封裝好的方法。結(jié)果可想而知，慢的原因就出來(lái)了。

當(dāng)我查詢第二頁(yè)的時(shí)候，由于第一頁(yè)的數(shù)據(jù)已經(jīng)不滿足了，也就是用from size 方式查詢的數(shù)據(jù)不夠了，那么就會(huì)使用scroll的方式來(lái)查詢第二頁(yè)。查到之后滿足返回?cái)?shù)據(jù)
當(dāng)我查詢第三頁(yè)的時(shí)候,還是第一頁(yè)的數(shù)據(jù)無(wú)法滿足，那么會(huì)使用scroll的方式來(lái)查詢第二頁(yè)，第二頁(yè)不是想要的，也丟棄了，則用scroll的形式查詢第三頁(yè)。
當(dāng)我查詢第四頁(yè)的時(shí)候 …

所以時(shí)間就是這么變長(zhǎng)的。假如說(shuō)我查詢第10頁(yè)的數(shù)據(jù)，那么前9次的查詢都是無(wú)效的，但是確實(shí)真實(shí)的查詢了。而且越到后面無(wú)效查詢就越多。如果我分頁(yè)分了幾萬(wàn)次，想象一下，那得浪費(fèi)多少次查詢。根本就是指數(shù)級(jí)的增長(zhǎng)浪費(fèi)。這么來(lái)看ES沒(méi)有掛掉已經(jīng)是萬(wàn)幸了。

你像風(fēng)來(lái)了又走，我心滿了又空?！栋肷墶?/p>

解決辦法

既然找到了問(wèn)題所在，那就是打開(kāi)的方式不對(duì)了。所以不能直接使用這樣的分頁(yè)方法。既然想獲取全量的數(shù)據(jù)，那就要么直接使用scroll的方式查詢，要么直接使用searchAfter的形式查詢。經(jīng)過(guò)上面的對(duì)比，我決定使用searchAfter的方式來(lái)實(shí)現(xiàn)全量數(shù)據(jù)查詢。因?yàn)檫@個(gè)看起來(lái)性能更好一些。

當(dāng)使用searchAfter的時(shí)候，就不需要傳遞from屬性了，只需要傳入偏移量。這樣當(dāng)達(dá)到偏移量的時(shí)候，返回對(duì)應(yīng)偏移量的ID

if (offset == curHit) {
	searchAfterStr = myGson.toJson(hit.getSortValues());
	result.setSearchAfter(searchAfterStr);
	break;
}

使用searchAftere需要注意的點(diǎn)：

查詢的數(shù)據(jù)要有唯一的主鍵，如果沒(méi)有業(yè)務(wù)主鍵，用ES自己生成的主鍵也可以。
查詢的時(shí)候要指定排序規(guī)則
不支持跳頁(yè)查詢
查詢要返回最后一條記錄的排序字段的值
下次查詢的searchAfter 要帶上上次查到的最后一條記錄的排序字段的值

示例：（示例并非是我的代碼，是從此文章復(fù)制而來(lái)）

TermQueryBuilder queryBuilder = QueryBuilders.termQuery("age", 24);
Object[] objects= new Object[]{"14"};
//第二次請(qǐng)求，攜帶sort字段的值進(jìn)行查詢。
SearchRequest searchRequest = new SearchRequest();
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(queryBuilder).sort("id",SortOrder.ASC).searchAfter(objects);
searchSourceBuilder.from(0).size(3);
searchRequest.source(searchSourceBuilder);
SearchResponse search = client.search(searchRequest, RequestOptions.DEFAULT);

寫(xiě)在最后

遇到生產(chǎn)問(wèn)題還是要一步一步的排查。其實(shí)最難的是在定位問(wèn)題，找到問(wèn)題所在，問(wèn)題也就自然有了解決的辦法。最后一句話：一般離奇的問(wèn)題，都是由于小的問(wèn)題導(dǎo)致的

你知道什么東西最燦爛嗎？是你的笑容。

參考文章文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-744099.html

ES(elasticsearch) - 三種姿勢(shì)進(jìn)行分頁(yè)查詢
java實(shí)現(xiàn)es的search after查詢（三種方式詳解）
ElasticSearch分頁(yè)search_after和scroll的區(qū)別以及用法
elasticsearch restHighLevelClient 游標(biāo)查詢?nèi)繑?shù)據(jù)示例
Elasticsearch Search Scroll API 查詢?nèi)繑?shù)據(jù)

到了這里，關(guān)于ElasticSearch分頁(yè)查詢緩慢問(wèn)題記錄的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Elasticsearch ES操作：查詢數(shù)據(jù)（全部、分頁(yè)、單條）
查詢條件查詢指定條數(shù) 返回結(jié)果
2024年02月16日
瀏覽(24)
如何解決 Elasticsearch 查詢緩慢的問(wèn)題以獲得更好的用戶體驗(yàn)
作者：Philipp Kahr Elasticsearch Service 用戶的重要注意事項(xiàng)：目前，本文中描述的 Kibana 設(shè)置更改僅限于 Cloud 控制臺(tái)，如果沒(méi)有我們支持團(tuán)隊(duì)的手動(dòng)干預(yù)，則無(wú)法進(jìn)行配置。我們的工程團(tuán)隊(duì)正在努力消除對(duì)這些設(shè)置的限制，以便我們的所有用戶都可以啟用內(nèi)部 APM。本地部署不受
2024年02月14日
瀏覽(16)
ES（Elasticsearch）+SpringBoot實(shí)現(xiàn)分頁(yè)查詢
1.ES介紹 ??ES作為一個(gè)搜索工具，寄托于Lucene之上，提供了方便的數(shù)據(jù)存儲(chǔ)和搜索服務(wù)，一般的用它來(lái)作為網(wǎng)頁(yè)數(shù)據(jù)索引以及存儲(chǔ)用戶畫(huà)像（即用戶標(biāo)簽）數(shù)據(jù)，可以提供復(fù)具有復(fù)雜的查詢條件的服務(wù)。例如在網(wǎng)頁(yè)索引中，通過(guò)倒排的方式索引的方式，對(duì)文檔進(jìn)行分詞存儲(chǔ)，
2024年02月16日
瀏覽(23)
Elasticsearch 使用scroll滾動(dòng)技術(shù)實(shí)現(xiàn)大數(shù)據(jù)量搜索、深度分頁(yè)問(wèn)題和 search
基于scroll滾動(dòng)技術(shù)實(shí)現(xiàn)大數(shù)據(jù)量搜索如果一次性要查出來(lái)比如10萬(wàn)條數(shù)據(jù)，那么性能會(huì)很差，此時(shí)一般會(huì)采取用scroll滾動(dòng)查詢，一批一批的查，直到所有數(shù)據(jù)都查詢完為止。 scroll搜索會(huì)在第一次搜索的時(shí)候，保存一個(gè)當(dāng)時(shí)的視圖快照，之后只會(huì)基于該舊的視圖快照提供數(shù)據(jù)搜
2024年02月14日
瀏覽(18)
ES es Elasticsearch 十三 Java api 實(shí)現(xiàn)搜索分頁(yè)查詢復(fù)雜查詢過(guò)濾查詢 ids查詢等
目錄 Java api 實(shí)現(xiàn)搜索 Pom.xml 建立鏈接搜索全部記錄增加規(guī)則值查某些字段搜索分頁(yè) 全代碼 Ids 搜索搜索Match搜索 multi_match 搜索多字段搜索復(fù)雜查詢 bool查詢 filter? bool 復(fù)雜查詢?cè)黾舆^(guò)濾器查詢復(fù)雜擦好像加排序日志思路參考 api 寫(xiě)法寫(xiě)Java代碼請(qǐng)求條件構(gòu)建層次
2024年02月04日
瀏覽(24)
解決 Elasticsearch 分頁(yè)查詢記錄超過(guò)10000時(shí)異常
查詢結(jié)果中 hits.total.value 值最大為10000的限制解決方法: 1、請(qǐng)求設(shè)置rest_total_hits_as_int=true 注意參數(shù)需要放在請(qǐng)求頭上 2、修改setting的值 ?
2024年02月07日
瀏覽(19)
【問(wèn)題解決】ElasticSearch分頁(yè)查詢時(shí)數(shù)據(jù)順序錯(cuò)亂/不一致的問(wèn)題
問(wèn)題描述：使用ElasticSearch分頁(yè)查詢時(shí)，每次輸入同樣的分頁(yè)參數(shù)以及查詢條件，得到的結(jié)果不一致的問(wèn)題。問(wèn)題分析： ElasticSearch中索引可能是由多個(gè)分片構(gòu)成的，并且每個(gè)分片可能擁有多個(gè)副本，其對(duì)應(yīng)的設(shè)置時(shí)索引建立時(shí)的設(shè)置。 number_of_shards：索引擁有多少個(gè)分片 n
2024年02月02日
瀏覽(28)
ElasticSearch - DSL查詢文檔語(yǔ)法，以及深度分頁(yè)問(wèn)題、解決方案
目錄一、DSL 查詢文檔語(yǔ)法前言 1.1、DSL Query 基本語(yǔ)法 1.2、全文檢索查詢 1.2.1、match 查詢 1.2.2、multi_match 1.3、精確查詢 1.3.1、term 查詢 1.3.2、range 查詢 1.4、地理查詢 1.4.1、geo_bounding_box 1.4.2、geo_distance 1.5、復(fù)合查詢 1.5.1、相關(guān)性算分 1.5.2、function_score 1.5.3、boolean query 1.6、搜索
2024年02月07日
瀏覽(24)
ES scroll查詢的坑點(diǎn)
scroll 查詢是ES中為了解決一次獲取不到全部數(shù)據(jù)的一種解決方案。第一次查詢第二次查詢（第二次查詢，可以不加scroll的失效時(shí)間）第2+n次訪問(wèn)（第三次及之后的查詢必須要加scroll的失效時(shí)間）首次訪問(wèn) 訪問(wèn)后，會(huì)得到部分或全部數(shù)據(jù)和scroll_id. 之后再訪問(wèn) 注意點(diǎn) ：用
2024年02月11日
瀏覽(16)
elasticsearch 7.9.3知識(shí)歸納整理（四）之 java實(shí)現(xiàn)深分頁(yè)scroll
ES對(duì)from+size是有限制的，from和size的和不能超過(guò)1w。超過(guò)后效率十分低下。 ES查詢過(guò)程： ①將用戶的指定的進(jìn)行分詞 ②將詞匯去分詞庫(kù)中進(jìn)行檢索，得到多個(gè)文檔的id ③去各個(gè)分片中拉去數(shù)據(jù)指定的數(shù)據(jù)(耗時(shí)長(zhǎng)) ④將數(shù)據(jù)根據(jù)score進(jìn)行排序(耗時(shí)長(zhǎng)) ⑤根據(jù)from的值將查詢
2024年02月05日
瀏覽(14)