国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<form id="5jx8k"><strike id="5jx8k"><nobr id="5jx8k"></nobr></strike></form>

<delect id="5jx8k"></delect>

Elasticsearch：實(shí)用指南

2年前作者：Elastic 中國(guó)社區(qū)官方博客分類(lèi)：Toy博客閱讀(19)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Elasticsearch：實(shí)用指南。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Elasticsearch：實(shí)用指南

我們將更多地討論使用 Elasticsearch 的最佳實(shí)踐。這些做法是一般性建議，可以應(yīng)用于任何用例。讓我們開(kāi)始吧。

Bulk Requests

批量 API 使得在單個(gè) API 調(diào)用中執(zhí)行許多索引/刪除操作成為可能。這可以大大增加索引速度。每個(gè)子請(qǐng)求都是獨(dú)立執(zhí)行的，因此一個(gè)子請(qǐng)求的失敗不會(huì)影響其他子請(qǐng)求的成功。如果任何請(qǐng)求失敗，頂級(jí)錯(cuò)誤標(biāo)志設(shè)置為 true，錯(cuò)誤詳細(xì)信息將在相關(guān)請(qǐng)求下報(bào)告。

索引數(shù)據(jù)的多線(xiàn)程客戶(hù)端

發(fā)送批量請(qǐng)求的單個(gè)線(xiàn)程不太可能最大化 Elasticsearch 集群的索引容量。為了使用集群的所有資源，你應(yīng)該從多個(gè)線(xiàn)程或進(jìn)程發(fā)送數(shù)據(jù)。除了更好地利用集群的資源之外，這應(yīng)該有助于降低每次 fsync 的成本。索引數(shù)據(jù)和事務(wù)日志都會(huì)定期刷新到磁盤(pán)。多線(xiàn)程數(shù)據(jù)越多，同步到磁盤(pán)的數(shù)據(jù)越多，減少I(mǎi)/O，提高性能。

index.refresh_interval

默認(rèn)情況下，Elasticsearch 每秒定期刷新索引，但僅限于在過(guò)去 30 秒內(nèi)收到一個(gè)或更多搜索請(qǐng)求的索引。如果你沒(méi)有搜索流量或搜索流量很少（例如，每一次搜索請(qǐng)求少于一個(gè)），這是最佳配置 5 分鐘）并希望優(yōu)化索引速度。此行為旨在在不執(zhí)行搜索的默認(rèn)情況下自動(dòng)優(yōu)化批量索引。為了選擇退出此行為，請(qǐng)明確設(shè)置刷新間隔。另一方面，如果你的索引遇到常規(guī)搜索請(qǐng)求，則此默認(rèn)行為意味著 Elasticsearch 將每 1 秒刷新一次你的索引。如果你有能力增加文檔被索引和文檔變?yōu)榭伤阉髦g的時(shí)間量，將 index.refresh_interval 增加到一個(gè)更大的值，例如 30s，可能有助于提高索引速度，同時(shí)也允許有一定的搜索行為。如果你在索引的時(shí)候，完全不考慮有搜索數(shù)據(jù)的可能，你可以直接把這個(gè)刷新間隔設(shè)置為 -1。

自動(dòng)生成 IDs

當(dāng)索引一個(gè)具有顯式 id 的文檔時(shí)，Elasticsearch 需要檢查同一個(gè)分片中是否已經(jīng)存在具有相同 id 的文檔，這是一個(gè)代價(jià)高昂的操作，并且隨著索引的增長(zhǎng)而變得更加昂貴。通過(guò)使用自動(dòng)生成的 ID，ElasticSearch 可以跳過(guò)此檢查，從而加快索引速度。

index.translog.sync_interval

這個(gè)參數(shù)決定了 translog 被 fsync 到磁盤(pán)并提交的頻率，與寫(xiě)操作無(wú)關(guān)。默認(rèn)為 5 秒。不允許小于 100 毫秒的值。

index.translog.flush_threshold_size

Translog 存儲(chǔ)所有尚未安全地持久化在 Lucene 中的操作（即，不是 Lucene 提交點(diǎn)的一部分）。盡管這些操作可用于讀取，但如果分片停止且必須恢復(fù)，則需要重放這些操作。此設(shè)置控制這些操作的最大總大小，以防止恢復(fù)時(shí)間過(guò)長(zhǎng)。一旦達(dá)到最大大小，就會(huì)發(fā)生刷新，生成一個(gè)新的 Lucene 提交點(diǎn)。默認(rèn)為 512 MB。

大文件

大型文檔會(huì)給網(wǎng)絡(luò)、內(nèi)存使用和磁盤(pán)帶來(lái)更多壓力。索引大型文檔可以使用一定數(shù)量的內(nèi)存，該內(nèi)存量是文檔原始大小的倍數(shù)。鄰近搜索（例如短語(yǔ)查詢(xún)）和突出顯示也變得更加昂貴，因?yàn)樗鼈兊某杀局苯尤Q于原始文檔的大小。

顯式設(shè)置索引映射

Elasticsearch 可以動(dòng)態(tài)創(chuàng)建映射，但它可能不適合所有場(chǎng)景。例如，Elasticsearch 5.x 中默認(rèn)的字符串字段映射都是 “keyword” 和 “text” 類(lèi)型。在很多情況下是不必要的。

Index Mapping — Nested Types

與父文檔中的字段相比，對(duì)嵌套字段的查詢(xún)速度較慢。匹配嵌套字段的檢索增加了額外的減速。一旦更新包含嵌套字段的文檔的任何字段，無(wú)論是否更新嵌套字段，所有底層 Lucene 文檔（父文檔及其所有嵌套子文檔）都需要標(biāo)記為已刪除和重寫(xiě)。除了減慢我們的更新速度之外，這樣的操作還會(huì)產(chǎn)生垃圾，以便稍后通過(guò)段合并進(jìn)行清理。

Index Mapping

禁用 _all 字段將所有其他字段的值連接到一個(gè)字符串中。它比其他字段需要更多的 CPU 和磁盤(pán)空間。大多數(shù)用例不需要 _all 字段。你可以使用 copy_to 參數(shù)連接多個(gè)字段。 _all 字段在 Elasticsearch 6.0 及更高版本中默認(rèn)禁用。要禁用早期版本中的 _all 字段，請(qǐng)將 enabled 設(shè)置為 false。

使用索引模板

索引模板定義分片數(shù)量、副本和映射等設(shè)置，你可以在創(chuàng)建新索引時(shí)自動(dòng)應(yīng)用這些設(shè)置。 Elasticsearch 根據(jù)與索引名稱(chēng)匹配的索引模式將模板應(yīng)用于新索引。

使用副本實(shí)現(xiàn)可擴(kuò)展性和彈性

Elasticsearch 旨在始終可用并根據(jù)你的需求進(jìn)行擴(kuò)展。它通過(guò)自身的分布式設(shè)計(jì)來(lái)做到這一點(diǎn)。你可以向集群添加節(jié)點(diǎn)以增加容量，Elasticsearch 會(huì)自動(dòng)將你的數(shù)據(jù)和查詢(xún)負(fù)載分布到所有可用節(jié)點(diǎn)上。為了使 Elasticsearch 具有高可用性，其索引需要具備適當(dāng)?shù)娜蒎e(cuò)能力。這可以使用副本分片來(lái)實(shí)現(xiàn)。副本分片是主分片的副本。副本提供數(shù)據(jù)的冗余副本，以防止硬件故障并增加處理讀取請(qǐng)求（如搜索或檢索文檔）的能力。

分片大小

分片是幕后的 Lucene 索引，它使用文件句柄、內(nèi)存和 CPU 周期。 ES 中索引的默認(rèn)分片策略是 5 個(gè)主分片和一個(gè)副本。選擇多個(gè)分片的目的是在集群中的所有數(shù)據(jù)節(jié)點(diǎn)上均勻分布一個(gè)索引。但是，這些碎片不應(yīng)該太大或太多。一個(gè)好的經(jīng)驗(yàn)法則是嘗試將分片大小保持在 10–50 GB 之間。大分片會(huì)使 Elasticsearch 難以從故障中恢復(fù)，但由于每個(gè)分片都使用一定量的 CPU 和內(nèi)存，因此擁有太多小分片會(huì)導(dǎo)致性能問(wèn)題和內(nèi)存不足錯(cuò)誤。

在多個(gè)數(shù)據(jù)節(jié)點(diǎn)中保持索引的分片數(shù)，這些節(jié)點(diǎn)具有相同的大小并跨節(jié)點(diǎn)分布

通過(guò)模板設(shè)置主分片計(jì)數(shù)，將每個(gè)主分片的最大容量設(shè)定為 50GB（日志分析）或最大 30GB（搜索用例）。數(shù)據(jù)節(jié)點(diǎn)之間的分片分配將根據(jù) 2 個(gè)重要規(guī)則進(jìn)行。

相同索引的主分片和副本分片不會(huì)分配在同一個(gè)數(shù)據(jù)節(jié)點(diǎn)上。

根據(jù)節(jié)點(diǎn)上可用的分片數(shù)量或均衡集群中所有節(jié)點(diǎn)中每個(gè)索引的分片數(shù)量，將分片放置在節(jié)點(diǎn)上。另請(qǐng)注意，可能會(huì)有較大的分片分配給某些節(jié)點(diǎn)而較小的分片分配給其他節(jié)點(diǎn)。建議索引的分片數(shù)（主+副本）應(yīng)該是數(shù)據(jù)節(jié)點(diǎn)數(shù)的倍數(shù)。比方說(shuō)，你有一個(gè) 4 節(jié)點(diǎn)的集群，索引的總分片（主 + 副本）應(yīng)該是 4 或 8 或 12 等。這確保數(shù)據(jù)在節(jié)點(diǎn)之間均勻分布。

索引生命周期管理

Elasticsearch：實(shí)用指南

如果你要處理時(shí)間序列數(shù)據(jù)，則不想將所有內(nèi)容連續(xù)轉(zhuǎn)儲(chǔ)到單個(gè)索引中。取而代之的是，你可以定期將數(shù)據(jù)滾動(dòng)到新索引，以防止數(shù)據(jù)過(guò)大而又緩慢又昂貴。隨著索引的老化和查詢(xún)頻率的降低，你可能會(huì)將其轉(zhuǎn)移到價(jià)格較低的硬件上，并減少分片和副本的數(shù)量。

要在索引的生命周期內(nèi)自動(dòng)移動(dòng)索引，可以創(chuàng)建策略來(lái)定義隨著索引的老化對(duì)索引執(zhí)行的操作。索引生命周期策略在與 Beats 數(shù)據(jù)發(fā)件人一起使用時(shí)特別有用，Beats 數(shù)據(jù)發(fā)件人不斷將運(yùn)營(yíng)數(shù)據(jù)（例如指標(biāo)和日志）發(fā)送到 Elasticsearch。當(dāng)現(xiàn)有索引達(dá)到指定的大小或期限時(shí)，你可以自動(dòng)滾動(dòng)到新索引。這樣可以確保所有索引具有相似的大小，而不是每日索引，其大小可以根 beats 數(shù)和發(fā)送的事件數(shù)而有所不同。

讓我們通過(guò)動(dòng)手操作場(chǎng)景跳入索引生命周期管理（Index cycle management: ILM）。本文章將利用你可能不熟悉的ILM獨(dú)有的許多新概念。我們先用一個(gè)示例來(lái)展示。本示例的目標(biāo)是建立一組索引，這些索引將封裝來(lái)自時(shí)間序列數(shù)據(jù)源的數(shù)據(jù)。我們可以想象有一個(gè)像Filebeat這樣的系統(tǒng)，可以將文檔連續(xù)索引到我們的書(shū)寫(xiě)索引中。我們希望在索引達(dá)到 50 GB，或文檔的數(shù)量超過(guò)10000，或已在30天前創(chuàng)建索引后對(duì)其進(jìn)行 rollover，然后在90天后刪除該索引。

按日期組織索引數(shù)據(jù)

對(duì)于大多數(shù)日志記錄或監(jiān)控用例，我們可以將索引組織為每天、每周或每月，然后我們可以得到一個(gè)指定日期范圍的索引列表。 Elasticsearch 只需要查詢(xún)較小的數(shù)據(jù)集而不是整個(gè)數(shù)據(jù)集。此外，當(dāng)數(shù)據(jù)過(guò)期時(shí)，收縮/刪除舊索引也很容易。我們可以參考文章 “Elasticsearch：使用 ingest pipeline 來(lái)管理索引名稱(chēng)” 來(lái)管理索引名稱(chēng)。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-482638.html

到了這里，關(guān)于Elasticsearch：實(shí)用指南的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀(guān)點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

AI輔寫(xiě)疑似度檢測(cè)：使用PaperPass的七個(gè)實(shí)用指南
大家好，今天來(lái)聊聊AI輔寫(xiě)疑似度檢測(cè)：使用論智AI的七個(gè)實(shí)用指南，希望能給大家提供一點(diǎn)參考。以下是針對(duì)論文AI輔寫(xiě)率高的情況，提供一些修改建議和技巧，可以借助此類(lèi)工具：還有： AI輔寫(xiě)疑似度檢測(cè)：使用論智AI的七個(gè)實(shí)用指南隨著人工智能技術(shù)的迅猛發(fā)展，AI輔寫(xiě)
2024年02月19日
瀏覽(35)
AI摳圖使用指南：Stable Diffusion WebUI Rembg實(shí)用技巧
? 摳圖是圖像處理工具的一項(xiàng)必備能力，可以用在重繪、重組、更換背景等場(chǎng)景。最近我一直在探索 Stable Diffusion WebUI 的各項(xiàng)能力，那么 SD WebUI 的摳圖能力表現(xiàn)如何呢？這篇文章就給大家分享一下。作為一個(gè)生成式AI，SD本身并沒(méi)有精細(xì)的摳圖控制能力，它需要借助插件來(lái)實(shí)
2024年02月14日
瀏覽(26)
ChatGPT 和 Elasticsearch：分面、過(guò)濾和更多上下文
作者：Luca Wintergerst 在最近的一篇博客文章中，我們討論了 ChatGPT 和 Elasticsearch? 如何協(xié)同工作以幫助更有效地管理專(zhuān)有數(shù)據(jù)。通過(guò)利用 Elasticsearch 的搜索功能和 ChatGPT 的上下文理解，我們演示了如何改進(jìn)結(jié)果。在這篇文章中，我們討論如何通過(guò)添加分面（facets）、過(guò)濾和附
2024年02月12日
瀏覽(28)
Elasticsearch：數(shù)據(jù)攝取中的使用指南
數(shù)據(jù)攝取是利用 Elasticsearch 的全部潛力進(jìn)行高效搜索和分析的關(guān)鍵步驟。在本文中，我們將探討幾個(gè)常用的基本實(shí)踐，以確保將無(wú)縫且有效的數(shù)據(jù)攝取到 Elasticsearch 中。通過(guò)遵循這些指南，你可以?xún)?yōu)化數(shù)據(jù)攝取流程，并在你的部署中最大限度地發(fā)揮 Elasticsearch 的優(yōu)勢(shì)。在將
2024年02月09日
瀏覽(17)
AI換臉FaceFusion2.4.0整合包發(fā)布！優(yōu)化換臉?biāo)俣龋「喔咔迥Ｐ?！附指南（WIN/MAC）
大家好，今天給大家分享下FaceFusion2.4.0最新版本，此版本重點(diǎn)優(yōu)化了換臉?biāo)俣群驮黾恿烁嗳四槞z測(cè)器。我也針對(duì)上個(gè)版本出現(xiàn)的問(wèn)題進(jìn)行了一些調(diào)整。老規(guī)矩，整合包在文章末尾自取。 Windows win10/win11 支持純CPU模式支持N卡GPU模式 Mac M1/M2/M3系列芯片 Intel芯片同時(shí)運(yùn)行多個(gè)
2024年04月09日
瀏覽(32)
Elasticsearch：我們?nèi)绾窝莼幚矶M(jìn)制文檔格式
作者：來(lái)自 Elastic?Sean Story 從二進(jìn)制文件中提取內(nèi)容是一個(gè)常見(jiàn)的用例。一些 PDF 文件可能非常龐大 — 考慮到幾 GB 甚至更多。Elastic 在處理此類(lèi)文檔方面已經(jīng)取得了長(zhǎng)足的進(jìn)步，今天，我們很高興地介紹我們的新工具 —— 數(shù)據(jù)提取服務(wù)：發(fā)布于 8.9 版本，截至目前，沒(méi)有報(bào)
2024年04月10日
瀏覽(28)
PyCharm程序調(diào)試實(shí)用指南
PyCharm程序調(diào)試實(shí)用指南 PyCharm是一款Python開(kāi)發(fā)神器，它的程序調(diào)試功能可以幫助我們快速定位代碼中的問(wèn)題并進(jìn)行修復(fù)。在進(jìn)行Python開(kāi)發(fā)時(shí)，程序出現(xiàn)問(wèn)題時(shí)需要快速定位問(wèn)題所在，否則我們可能會(huì)陷入一些無(wú)解的問(wèn)題當(dāng)中，浪費(fèi)很多時(shí)間。在這篇文章中，我們將學(xué)習(xí)如何使
2024年02月09日
瀏覽(18)
【MySQL約束】數(shù)據(jù)管理實(shí)用指南
數(shù)據(jù)庫(kù)約束的概念：數(shù)據(jù)庫(kù)的約束是關(guān)系型數(shù)據(jù)庫(kù)的一個(gè)重要的功能，它提供了一種“校驗(yàn)數(shù)據(jù)”合法性的機(jī)制，能夠保證數(shù)據(jù)的“完整性”、“準(zhǔn)確性”和“正確性” 數(shù)據(jù)庫(kù)的約束： not null：不能存儲(chǔ) null 值 unique：保證某列的每行必須有唯一值 default：規(guī)定沒(méi)有給列賦值
2024年02月02日
瀏覽(25)
Elasticsearch：什么是向量和向量存儲(chǔ)數(shù)據(jù)庫(kù)，我們?yōu)槭裁搓P(guān)心？
Elasticsearch 從 7.3 版本開(kāi)始支持向量搜索。從 8.0 開(kāi)始支持帶有 HNSW 的 ANN 向量搜索。目前 Elasticsearch 已經(jīng)是全球下載量最多的向量數(shù)據(jù)庫(kù)。它允許使用密集向量和向量比較來(lái)搜索文檔。向量搜索在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有許多重要的應(yīng)用。有效存儲(chǔ)和檢索向量的數(shù)據(jù)庫(kù)對(duì)于
2024年02月08日
瀏覽(31)
我們?nèi)绾卧?Elasticsearch 8.6、8.7 和 8.8 中加速數(shù)據(jù)攝入
作者：Adrien Grand, Joe Gallo, Tyler Perkins 正如你們中的一些人已經(jīng)注意到的，Elasticsearch 8.6、8.7 和 8.8 在各種數(shù)據(jù)集上帶來(lái)了良好的索引加速，從簡(jiǎn)單的到繁重的 KNN 向量，以及攝取管道繁重的攝取工作負(fù)載。攝取涉及許多組件 —— 運(yùn)行攝取管道、反轉(zhuǎn)內(nèi)存中的數(shù)據(jù)、刷新
2024年02月15日
瀏覽(23)

<style id="jlfm3"></style>