国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<span id="v8jsq"></span>

<mark id="v8jsq"><em id="v8jsq"><kbd id="v8jsq"></kbd></em></mark>

<span id="v8jsq"><xmp id="v8jsq">

ElasticSearch 7.X系列之：檢索性能優(yōu)化實(shí)戰(zhàn)指南

2年前分類(lèi)：Toy博客閱讀(19)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了ElasticSearch 7.X系列之：檢索性能優(yōu)化實(shí)戰(zhàn)指南。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

1、當(dāng)我們?cè)谡f(shuō) Elasticsearch 檢索性能優(yōu)化的時(shí)候，實(shí)際在說(shuō)什么？！

檢索響應(yīng)慢！
并發(fā)檢索用戶(hù)多時(shí)，響應(yīng)時(shí)間不達(dá)標(biāo)
卡死了！
怎么還沒(méi)有出結(jié)果？
怎么這么慢？
為啥競(jìng)品產(chǎn)品的很快就返回結(jié)果了？
宕機(jī)了

等等......

這些都與可能檢索有關(guān)，確切的說(shuō)和檢索性能有關(guān)。

檢索性能的優(yōu)化涉及知識(shí)點(diǎn)比較零散，我以官方文檔的檢索性能優(yōu)化部分作為大框架和主線(xiàn)，結(jié)合實(shí)戰(zhàn)經(jīng)驗(yàn)和咨詢(xún)經(jīng)驗(yàn)用通俗易懂的語(yǔ)言做下解讀。

2、內(nèi)存要給到位

Elasticsearch 嚴(yán)重依賴(lài)文件系統(tǒng)緩存來(lái)加快搜索速度。通常，你應(yīng)該確保至少有一半的可用內(nèi)存進(jìn)入文件系統(tǒng)緩存，以便 Elasticsearch 可以將索引的熱點(diǎn)區(qū)域保留在物理內(nèi)存中。

線(xiàn)上環(huán)境還見(jiàn)過(guò)2核4G配置的，基本上跑不了太多數(shù)據(jù)量。

3、磁盤(pán)必要時(shí)換 SSD

對(duì)寫(xiě)入速度有超高要求的，SSD就是“祥瑞”。

SSD 成本考慮可能不能一步到位，但至少得是普通機(jī)械磁盤(pán)。

切記盡量不用：NFS 或 SMB 遠(yuǎn)程文件系統(tǒng)。

4、CPU 考慮核數(shù)和線(xiàn)程數(shù)

在并發(fā)寫(xiě)入或查詢(xún)量大之后，就會(huì)出現(xiàn) CPU 打滿(mǎn)的情況。

可以?xún)?yōu)化的空間就是：基于CPU 核數(shù)合理調(diào)節(jié)線(xiàn)程池和隊(duì)列的大小。

5、數(shù)據(jù)建模要合理

多表關(guān)聯(lián)非 Elasticsearch 所擅長(zhǎng)。換句話(huà)說(shuō)，Elasticsearch 支持多表關(guān)聯(lián)方式有限。

像 Mysql 中的動(dòng)不動(dòng)幾個(gè)表的 join 操作，在 Elasticsearch 要考慮必要性和實(shí)現(xiàn)復(fù)雜度。

Elasticsearch 多表關(guān)聯(lián)僅限于如下幾種：

父子文檔 join：適用于子文檔頻繁更新場(chǎng)景。
nested 嵌套類(lèi)型：適用于子文檔相對(duì)固定、更新頻率低的場(chǎng)景。
大寬表拉伸存儲(chǔ)：本質(zhì)空間換時(shí)間。
業(yè)務(wù)層面自己結(jié)合檢索后的返回結(jié)果，自己實(shí)現(xiàn)關(guān)聯(lián)。

且：Nested 可以使查詢(xún)慢幾倍，而父子 Join 類(lèi)型可以使查詢(xún)慢數(shù)百倍。

大家在建模的時(shí)候多考慮，如果不刻意建模全部使用默認(rèn)字段，看看可能帶來(lái)的“災(zāi)難”性的后果，反過(guò)來(lái)就能理解建模的重要性。

6、盡可能減少檢索字段數(shù)目

query_string 或 multi_match 查詢(xún)目標(biāo)的字段越多，速度就越慢。

提高多個(gè)字段搜索速度的常用技術(shù)是在索引時(shí)將它們的值借助 copy_to 復(fù)制到單個(gè)字段中，然后在搜索時(shí)使用該字段。

copy_to 實(shí)現(xiàn)了 1 帶 2 、1 帶 3 甚至 1 帶 N 的效果。

7、合理設(shè)置 size 大小

在檢索請(qǐng)求的時(shí)候 size 值設(shè)置很大，會(huì)導(dǎo)致命中數(shù)據(jù)量大，可能會(huì)帶來(lái)嚴(yán)重的性能問(wèn)題。

建議：合理設(shè)置分頁(yè) size 值。如果著實(shí)數(shù)據(jù)量大考慮：scroll 或者 search_after 實(shí)現(xiàn)。

8、多使用寫(xiě)入前預(yù)處理操作

我之前的文章講情感分析區(qū)間查詢(xún)的時(shí)候，其實(shí)本質(zhì)就三個(gè)區(qū)間：負(fù)面、正面、中性。

如果用 range_query 區(qū)間檢索勢(shì)必會(huì)慢。

建模的時(shí)候，可以考慮數(shù)據(jù)寫(xiě)入的時(shí)候，轉(zhuǎn)成：-1、0、1 的 keyword 類(lèi)型值。

將 range_query 的范圍檢索變成了基于倒排索引的精準(zhǔn)查找 term query，效率自然會(huì)提升。

能借助 ingest 預(yù)處理完成的，不要放到后面借助 script + update_by_query。

使用過(guò) script + update_by_query的自然知道有多苦。

看到這里有同感的老鐵可以留言說(shuō)一下感受。

9、能用 keyword 字段類(lèi)型就不要使用其他

如果一個(gè)字段可以設(shè)置為：number 數(shù)值類(lèi)型字段也可以設(shè)置為 keyword 類(lèi)型。在建模階段可以參考如下考慮方式實(shí)現(xiàn)建模選型。

得看你的應(yīng)用場(chǎng)景，如果涉及 range query 推薦 number 類(lèi)型，具體可以：integer、long 或者其他數(shù)值類(lèi)型。

如果僅是精準(zhǔn)匹配 term 級(jí)別的檢索，那 keyword 就能搞定。

如果還感覺(jué)兩種都有可能，建議設(shè)置：keyword 和 number 雙類(lèi)型，借助 fields 實(shí)現(xiàn)。

fields 組合類(lèi)型實(shí)現(xiàn)參考如下：

PUT?test_0001
{
??"mappings":?{
????"properties":?{
??????"age":{
????????"type":"integer",
????????"fields":?{
??????????"keyword":{
????????????"type":"keyword"
??????????}
????????}
??????}
????}
??}
}

10、盡量規(guī)避使用腳本

如果可能，請(qǐng)避免使用：

基于腳本的排序
基于腳本的聚合
基于script_score 查詢(xún)

painless 腳本翻譯為中文是：“無(wú)痛”。

但，用過(guò)你就知道有多痛。

第一：不是很好用，很多示例，官方文檔也沒(méi)有窮盡所有樣例，需要花時(shí)間摸索。
第二：性能問(wèn)題，解決問(wèn)題一時(shí)爽，線(xiàn)上一跑“悔斷腸”。

那，不讓用，線(xiàn)上的確需要咋辦？

盡量前置寫(xiě)入的時(shí)候結(jié)合 ingest + script 實(shí)現(xiàn)。

如果對(duì)寫(xiě)入指標(biāo)要求沒(méi)有那么高，通過(guò)稍微增大寫(xiě)入的時(shí)間間接提高了檢索效率，何樂(lè)而不為？

11、日期做舍入處理，能間接利用緩存

GET?index/_search
{
??"query":?{
????"constant_score":?{
??????"filter":?{
????????"range":?{
??????????"my_date":?{
????????????"gte":?"now-1h/m",
????????????"lte":?"now/m"
??????????}
????????}
??????}
????}
??}
}

“/m” 的方式能有效利用時(shí)間緩存。

12、有效使用 filter 緩存

在 Elasticsearch 查詢(xún)中有效使用 filter 過(guò)濾器可以顯著提高搜索性能。

filter 過(guò)濾優(yōu)勢(shì)體現(xiàn)在：

緩存。
和query 相比，不需要計(jì)算評(píng)分，所以更快。

13、對(duì)歷史索引數(shù)據(jù)使用段合并

前提：基于時(shí)間切分索引，對(duì)于相對(duì)冷的數(shù)據(jù)，訪(fǎng)問(wèn)密集型沒(méi)有那么高的數(shù)據(jù)，推薦使用段合并。

切記：不要對(duì)正在寫(xiě)入數(shù)據(jù)的索引進(jìn)行段合并。

7.X 版本可以借助 ILM 索引生命周期管理實(shí)現(xiàn)。

14、啟用 eager global ordinals 提升高基數(shù)聚合性能

適用場(chǎng)景：高基數(shù)聚合。

高基數(shù)聚合場(chǎng)景中的高基數(shù)含義：一個(gè)字段包含很大比例的唯一值。

global ordinals 的本質(zhì)是：?jiǎn)⒂?eager_global_ordinals 時(shí)，會(huì)在刷新（refresh）分片時(shí)構(gòu)建全局序號(hào)。這將構(gòu)建全局序號(hào)的成本從搜索階段轉(zhuǎn)移到了數(shù)據(jù)索引化（寫(xiě)入）階段。

PUT?my-index-000001
{
??"mappings":?{
????"properties":?{
??????"tags":?{
????????"type":?"keyword",
????????"eager_global_ordinals":?true
??????}
????}
??}
}

15、預(yù)熱文件系統(tǒng)緩存

如果重新啟動(dòng)運(yùn)行 Elasticsearch 的機(jī)器，文件系統(tǒng)緩存將是空的，因此操作系統(tǒng)將索引的熱點(diǎn)區(qū)域加載到內(nèi)存中需要一些時(shí)間，以便快速搜索操作。

可以使用 index.store.preload 設(shè)置根據(jù)文件擴(kuò)展名明確告訴操作系統(tǒng)哪些文件應(yīng)該立即加載到內(nèi)存中。

PUT?/my-index-000001
{
??"settings":?{
????"index.store.preload":?["nvd",?"dvd"]
??}
}

在 lucene 中，

nvd 是指：全文檢索文件；
dvd 是指：用于聚合排序的列存文件。

16、合理使用 index sort 邊寫(xiě)入邊排序機(jī)制

PUT?my-index-000001
{
??"settings":?{
????"index":?{
??????"sort.field":?"date",?
??????"sort.order":?"desc"??
????}
??},
??"mappings":?{
????"properties":?{
??????"date":?{
????????"type":?"date"
??????}
????}
??}
}

這個(gè)配置相信你一看就懂，發(fā)生在寫(xiě)入前，創(chuàng)建索引的時(shí)候設(shè)定的排序字段。

本質(zhì)：通過(guò)降低寫(xiě)入速度間接提升檢索速度。

17、通過(guò) perference 優(yōu)化緩存利用率

perference 用在兩次檢索結(jié)果不一致的時(shí)候，本質(zhì)是：主、副本分片數(shù)據(jù)不一致導(dǎo)致的，有半路由的機(jī)制。

合理使用 perference 參數(shù)能優(yōu)化緩存使用率。

18、設(shè)置合理的分片數(shù)和副本數(shù)

主分片的設(shè)置需要結(jié)合：集群數(shù)據(jù)節(jié)點(diǎn)規(guī)模、全部數(shù)據(jù)量和日增數(shù)據(jù)量等綜合維度給出值，一般建議：設(shè)置為數(shù)據(jù)節(jié)點(diǎn)的1-3倍。

分片不宜過(guò)小、過(guò)碎。有很多小分片可能會(huì)導(dǎo)致大量的網(wǎng)絡(luò)調(diào)用和線(xiàn)程開(kāi)銷(xiāo)，這會(huì)嚴(yán)重影響搜索性能。

副本數(shù)不是越多越好？

在許多情況下，擁有更多副本有助于提高搜索性能。但是不代表副本越多越好。

增加副本的前提是考慮：磁盤(pán)存儲(chǔ)空間的容量上限和磁盤(pán)警戒水位線(xiàn)。本質(zhì)還是以空間換時(shí)間。

一般非高可用場(chǎng)景，基本一個(gè)副本足夠。

官方給出了合理副本大小的公式供參考：

如果你的集群有 num_nodes 個(gè)節(jié)點(diǎn)、num_primaries 主分片，并且你希望最多同時(shí)處理 max_failures 個(gè)節(jié)點(diǎn)故障，那么適合你的副本數(shù)為：

?max(max_failures,?ceil(num_nodes?/?num_primaries)?-?1)

19、避免使用 wildcard 檢索

避免使用 wildcard 通配符檢索，尤其是前綴通配符查詢(xún)。

我自己早些年線(xiàn)上環(huán)境實(shí)現(xiàn)曾經(jīng)大量使用：wildcard，導(dǎo)致客戶(hù)現(xiàn)場(chǎng)演示宕機(jī)，我自己因此也寫(xiě)了“檢討書(shū)”，血淋淋的教訓(xùn)再次告訴大家。

幾年后回頭看當(dāng)時(shí)為什么選型 wildcard？復(fù)盤(pán)原因小結(jié)如下：

MySql 的使用慣性。

MySql 中 select * from table where title like ‘%長(zhǎng)津湖%'。順理成章的認(rèn)為 Elasticsearch 中的 wildcard 也能實(shí)現(xiàn)類(lèi)型功能。

對(duì) Elasticsearch 不求甚解。

能簡(jiǎn)單使用且測(cè)試環(huán)境小樣沒(méi)有問(wèn)題，直接更新線(xiàn)上環(huán)節(jié)?？蛻?hù)現(xiàn)場(chǎng)數(shù)據(jù)一多，直接崩潰。

為達(dá)目的，功能優(yōu)先，沒(méi)有考慮性能。

產(chǎn)品經(jīng)理要求字段中存在的字符都能檢索出來(lái)。

Elasticsearch 本質(zhì)是倒排索引提高檢索效率，如果分詞詞典不完備，除非 ngram 逐個(gè)字符細(xì)粒度分詞，否則幾乎做不到的。

wildcard 功能方面必然能滿(mǎn)足，但是性能問(wèn)題當(dāng)時(shí)沒(méi)有做大量測(cè)試。

沒(méi)有對(duì) Elasticseearch 全局認(rèn)識(shí)

全局看，Elasticsearch 就那么幾種類(lèi)型，全文檢索類(lèi)型、精準(zhǔn)匹配類(lèi)型是重頭戲。

當(dāng)時(shí)選型的時(shí)候，摸著石頭過(guò)河，拿起石頭就用，結(jié)果石頭有“刺“，把手給扎了。

更好的方式應(yīng)該是：全局認(rèn)識(shí)，有幾種類(lèi)型石頭？哪里有石頭？石頭應(yīng)用場(chǎng)景是什么？我的業(yè)務(wù)需要哪種類(lèi)型的石頭？

后面優(yōu)化的方案就是：字詞混合索引 + match_phrase 短語(yǔ)匹配實(shí)現(xiàn)，一方面保證了匹配的精準(zhǔn)性，另一方面保證了召回率。

20、謹(jǐn)慎使用 Regex 正則檢索

正則檢索也會(huì)有響應(yīng)慢及性能問(wèn)題，要謹(jǐn)慎使用。

21、謹(jǐn)慎使用全量聚合和多重嵌套聚合

聚合的本質(zhì)是不精準(zhǔn)的，原因在于主、副本分片數(shù)據(jù)的不一致性。

對(duì)于實(shí)時(shí)性業(yè)務(wù)數(shù)據(jù)，每分、每秒都有數(shù)據(jù)寫(xiě)入的，要考慮數(shù)據(jù)在變化，聚合結(jié)果也會(huì)隨之變化。

我在業(yè)務(wù)開(kāi)發(fā)中使用全量聚合的目的是規(guī)避聚合結(jié)果的不精準(zhǔn)性，但是帶來(lái)的則是性能問(wèn)題。

多重嵌套聚合隨之嵌套層數(shù)的增多，復(fù)雜度也會(huì)激增，檢索響應(yīng)速度會(huì)變慢甚至帶來(lái)性能問(wèn)題。

22、設(shè)置合理的 Timeout 時(shí)間

超時(shí)參數(shù)和在參數(shù)后終止在執(zhí)行大量搜索或結(jié)果數(shù)據(jù)龐大時(shí)非常有用。

在 python 客戶(hù)端或者 java 客戶(hù)端連接的時(shí)候都建議設(shè)置好 Timeout 值。

23、合理設(shè)置刪除文檔的方式

當(dāng)數(shù)據(jù)量非常大了之后怎么辦？?jī)煞N方式做一下對(duì)比：

方式一：大索引存儲(chǔ)。

數(shù)據(jù)量大了之后，刪除部分索引數(shù)據(jù)，借助：delete_by_uery 實(shí)現(xiàn)。

方式二：冷熱集群架構(gòu)+基于時(shí)間切分索引。

必要時(shí)候，刪除較早日期的索引，借助：delete 實(shí)現(xiàn)。

方式一本質(zhì)是邏輯刪除，數(shù)據(jù)看似刪除了，但磁盤(pán)空間短期內(nèi)會(huì)暴增。待段合并后，才會(huì)物理刪除。

方式二本質(zhì)是物理刪除，刪除索引會(huì)立即釋放磁盤(pán)。

所以，當(dāng)磁盤(pán)空間吃緊，尤其到了警戒水位線(xiàn)：85%、90%、95%之后。

方式二刪除：穩(wěn)、準(zhǔn)、狠。而方式一相對(duì)“磨磨唧唧、娘娘們們”，非必要不推薦。

參考

https://www.elastic.co/guide/en/elasticsearch/reference/master/tune-for-search-speed.html

https://opster.com/blogs/improve-elasticsearch-search-performance/

https://opster.com/elasticsearch-glossary/elasticsearch-slow-search-query-guide/

https://medium.com/analytics-vidhya/improving-elasticsearch-query-performance-3b59c6b15a97

https://opster.com/elasticsearch-glossary/elasticsearch-increase-search-speed/文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-403744.html

到了這里，關(guān)于ElasticSearch 7.X系列之：檢索性能優(yōu)化實(shí)戰(zhàn)指南的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

POSTGRESQL(PG) 性能優(yōu)化之like全文檢索優(yōu)化
使用like操作可以進(jìn)行字符串比較，全文檢索等，性能相對(duì)比較差，有些情況下可以通過(guò)建立索引來(lái)提升性能。下面我們通過(guò)使用TPCH orders表作為例子，來(lái)進(jìn)行說(shuō)明。但是請(qǐng)注意， not like是不能用任何索引的，BTREE不支持!=操作，只能進(jìn)行=和范圍查找。 TPCH orders表的定義如下，
2024年02月05日
瀏覽(21)
ElasticSearch 實(shí)戰(zhàn)：ElasticSearch文檔全文檢索
Elasticsearch 實(shí)戰(zhàn)：Elasticsearch 文檔全文檢索全文檢索是 Elasticsearch 的核心功能之一，它允許用戶(hù)對(duì)文本內(nèi)容進(jìn)行高效的模糊搜索、詞組匹配、同義詞處理、停用詞過(guò)濾等操作。以下是如何進(jìn)行文檔全文檢索的詳細(xì)步驟： **1. **全文匹配查詢(xún)（Match Query）最基礎(chǔ)的全文檢索查詢(xún)是
2024年04月11日
瀏覽(29)
Elasticsearch 混合檢索優(yōu)化大模型 RAG 任務(wù)
Elastic 社區(qū)在自然語(yǔ)言處理上面做的很不錯(cuò)官方博客更新速度也很快，現(xiàn)階段大模型的應(yīng)用場(chǎng)景主要在 Rag 和 Agent 上，國(guó)內(nèi) Rag（Retrieval-Augmented Generation 檢索增強(qiáng)生成）的尤其多，而搜索對(duì)于 Elasticsearch 來(lái)說(shuō)是強(qiáng)項(xiàng)特別是 8.9 之后的版本提供了 ESRE 模塊（集成了高級(jí)相關(guān)性排序
2024年04月25日
瀏覽(26)
Elasticsearch實(shí)戰(zhàn)（一）：Springboot實(shí)現(xiàn)Elasticsearch統(tǒng)一檢索功能
Elasticsearch實(shí)戰(zhàn)（一）：Springboot實(shí)現(xiàn)Elasticsearch統(tǒng)一檢索功能 Elasticsearch實(shí)戰(zhàn)（二）：Springboot實(shí)現(xiàn)Elasticsearch自動(dòng)漢字、拼音補(bǔ)全，Springboot實(shí)現(xiàn)自動(dòng)拼寫(xiě)糾錯(cuò) Elasticsearch實(shí)戰(zhàn)（三）：Springboot實(shí)現(xiàn)Elasticsearch搜索推薦 Elasticsearch實(shí)戰(zhàn)（四）：Springboot實(shí)現(xiàn)Elasticsearch指標(biāo)聚合與下鉆分析
2024年02月12日
瀏覽(20)
一起學(xué)Elasticsearch系列-寫(xiě)入和檢索調(diào)優(yōu)
本文已收錄至Github，推薦閱讀 ?? Java隨想錄微信公眾號(hào)：Java隨想錄當(dāng)涉及到大規(guī)模數(shù)據(jù)存儲(chǔ)和檢索時(shí)，Elasticsearch以其快速、高效和強(qiáng)大的搜索能力而聞名，并被廣泛應(yīng)用于各種場(chǎng)景，例如日志分析、全文搜索和實(shí)時(shí)數(shù)據(jù)分析。然而，并不是只要將數(shù)據(jù)存入ES就可以立即獲
2024年02月03日
瀏覽(25)
【elasticsearch實(shí)戰(zhàn)】知識(shí)庫(kù)文件系統(tǒng)檢索工具FSCrawler
最近有一個(gè)需求需要建設(shè)一個(gè)知識(shí)庫(kù)文檔檢索系統(tǒng)，這些知識(shí)庫(kù)物料附件的文檔居多，有較多文檔格式如：PDF, Open Office, MS Office等，需要將這些格式的文件轉(zhuǎn)化成文本格式，寫(xiě)入elasticsearch 的全文檢索索引，方便搜索。我這里介紹一種工具不考慮文件原來(lái)格式，但能方便將轉(zhuǎn)
2024年02月22日
瀏覽(20)
Elasticsearch 8.X 檢索實(shí)戰(zhàn)調(diào)優(yōu)錦囊 001
對(duì)于精準(zhǔn)匹配的查詢(xún)，不關(guān)注評(píng)分結(jié)果，只關(guān)注數(shù)據(jù)是否滿(mǎn)足檢索需求。可以考慮用 filter “包裹一層”，如處理時(shí)間范圍檢索，Elasticsearch 能緩存部分結(jié)果。但，要說(shuō)明的是更換時(shí)間窗口，換不同時(shí)間段檢索，原有緩存不起作用。關(guān)于 filter 的緩存效果，官方文檔如是說(shuō)：
2024年02月01日
瀏覽(24)
Langchain 與 Elasticsearch：創(chuàng)新數(shù)據(jù)檢索的融合實(shí)戰(zhàn)
在信息爆炸的時(shí)代，有效地檢索和處理數(shù)據(jù)變得至關(guān)重要。Langchain 和 Elasticsearch 的結(jié)合，為我們提供了一個(gè)強(qiáng)大的工具，以更智能的方式進(jìn)行數(shù)據(jù)檢索和分析。作為一名擁有多年 Elasticsearch 實(shí)戰(zhàn)經(jīng)驗(yàn)的技術(shù)博主，我將在本文中詳細(xì)介紹這兩種技術(shù)的整合應(yīng)用。 Langchain是一個(gè)
2024年01月19日
瀏覽(25)
Elasticsearch實(shí)戰(zhàn)之處理郵件附件進(jìn)行進(jìn)行內(nèi)容全文檢索
目錄一、系統(tǒng)環(huán)境和軟件要求二、軟件說(shuō)明三、定義文本抽取管道(pipeline) 四、建立索引設(shè)置文檔結(jié)構(gòu)映射五、插入文檔六、查詢(xún)文檔需求是將本地郵件內(nèi)容以及PDF，EXCEL，WORD等附件內(nèi)容進(jìn)行處理，保存到ES數(shù)據(jù)庫(kù)，實(shí)現(xiàn)郵件內(nèi)容及附件內(nèi)容的全文檢索。一、系統(tǒng)環(huán)境和
2024年02月13日
瀏覽(18)
【業(yè)務(wù)功能篇90】微服務(wù)-springcloud-檢索服務(wù)-ElasticSearch實(shí)戰(zhàn)運(yùn)用-DSL語(yǔ)句
??商品檢索頁(yè)面我們放在search服務(wù)中處理，首頁(yè)我們需要在mall-search服務(wù)中支持Thymeleaf。添加對(duì)應(yīng)的依賴(lài) 然后我們拷貝模板文件到template目錄下，然后不要忘記添加Thymeleaf的名稱(chēng)空間需要把相關(guān)的靜態(tài)資源文件拷貝到Nginx服務(wù)中。目錄結(jié)構(gòu)是：/mydata/nginx/html/static/search/ 我們
2024年02月10日
瀏覽(30)

<label id="79uq4"><noframes id="79uq4">

<noscript id="79uq4"><cite id="79uq4"></cite></noscript>

<input id="79uq4"><p id="79uq4"></p></input>