国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

elasticsearch知識庫

2年前作者：千篇不一律分類：Toy博客閱讀(33)違法舉報

這篇具有很好參考價值的文章主要介紹了elasticsearch知識庫。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

crud

// 新增文檔
RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(
                new HttpHost("localhost", 9200, "http")));
IndexRequest request = new IndexRequest("index");
request.id("1"); // 指定文檔id
String jsonString = "{" +
        "\"name\":\"John\"," +
        "\"age\":30," +
        "\"city\":\"New York\"" +
        "}";
request.source(jsonString, XContentType.JSON);
IndexResponse response = client.index(request, RequestOptions.DEFAULT);
System.out.println(response);
client.close();

// 獲取文檔
RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(
                new HttpHost("localhost", 9200, "http")));
GetRequest getRequest = new GetRequest("index", "1");
GetResponse getResponse = client.get(getRequest, RequestOptions.DEFAULT);
String sourceAsString = getResponse.getSourceAsString();
System.out.println(sourceAsString);
client.close();

// 更新文檔
RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(
                new HttpHost("localhost", 9200, "http")));
UpdateRequest request = new UpdateRequest("index", "1");
String jsonString = "{" +
        "\"name\":\"John Doe\"," +
        "\"age\":35," +
        "\"city\":\"Los Angeles\"" +
        "}";
request.doc(jsonString, XContentType.JSON);
UpdateResponse response = client.update(request, RequestOptions.DEFAULT);
System.out.println(response);
client.close();

// 刪除文檔
RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(
                new HttpHost("localhost", 9200, "http")));
DeleteRequest request = new DeleteRequest("index", "1");
DeleteResponse response = client.delete(request, RequestOptions.DEFAULT);
System.out.println(response);
client.close();

es查詢緩存

es查詢緩存

索引路由

Elasticsearch的路由（Routing）特性
在Elasticsearch中，一個索引被分為多個分片，每個分片包含了部分索引數(shù)據(jù)。當我們進行查詢時，Elasticsearch會將查詢請求發(fā)送到每個分片上執(zhí)行查詢操作，然后將結果合并返回給客戶端。
而路由查詢是一種特殊的查詢方式，它允許我們在查詢時指定一個路由鍵來確定查詢應該在哪個分片上執(zhí)行。這樣，查詢就只會在該路由鍵所對應的分片上執(zhí)行，從而避免了在所有分片上執(zhí)行查詢的開銷。
舉個例子，假設我們有一個名為“my_index”的索引，它被分為3個分片，每個分片的路由鍵分別為0、1、2。我們想要查詢該索引中“title”字段包含“elasticsearch”關鍵字的文檔，這時我們可以使用路由查詢來提高查詢效率。
如果我們不使用路由查詢，查詢請求會被發(fā)送到所有3個分片上，每個分片都會執(zhí)行查詢操作，并將結果返回給客戶端。這樣就會產(chǎn)生大量的網(wǎng)絡和計算開銷。
而如果我們使用路由查詢，我們可以在查詢時指定一個路由鍵，如“1”，這樣查詢請求就只會被發(fā)送到路由鍵為1的分片上執(zhí)行查詢操作，其他分片則不會參與查詢。這樣就可以減少查詢的開銷，提高查詢效率。

路由查詢
路由查詢是指在查詢時指定特定的路由鍵，使得查詢只在指定路由鍵所在的分片上執(zhí)行。這種查詢方式可以提高查詢的效率，特別是在分布式環(huán)境下，因為查詢只會在一個分片上執(zhí)行，避免了在所有分片上執(zhí)行查詢的開銷。
使用路由查詢需要在查詢時指定路由鍵，例如：

// 設置routing，加速搜索，一般使用用戶id類似的字段填充
//	indexRequest.routing(String.valueOf(i));

GET /my_index/my_type/_search?routing=key_value
{
  "query": {
    "match": {
      "title": "elasticsearch"
    }
  }
}

無路由查詢
無路由查詢是指在查詢時不指定路由鍵，查詢會在所有分片上執(zhí)行。這種查詢方式適用于單個分片的數(shù)據(jù)量不大的情況下，因為查詢會在所有分片上執(zhí)行，可能會增加查詢的開銷。
使用無路由查詢不需要指定路由鍵，例如：

GET /my_index/my_type/_search
{
  "query": {
    "match": {
      "title": "elasticsearch"
    }
  }
}

索引ID

Elasticsearch中的每個文檔都有一個唯一的ID，這個ID是由Elasticsearch自動生成的，也可以手動指定。Elasticsearch的索引ID有以下作用：

唯一標識文檔
文檔的ID是文檔在索引中的唯一標識符，它可以用于對文檔進行查找、更新、刪除等操作。如果文檔沒有指定ID，則Elasticsearch會自動生成一個唯一的ID。

索引性能優(yōu)化
Elasticsearch通過ID來分配文檔到不同的分片中，并且在分片之間分配副本。如果文檔ID是隨機生成的，則導致文檔分布不均勻，從而導致性能下降。因此，最好為文檔指定一個有序的ID，如時間戳或自增數(shù)字等，這樣可以讓文檔分布更均勻，提高索引的性能。

避免重復插入
Elasticsearch需要文檔ID來避免在插入文檔時重復插入。如果插入的文檔ID已經(jīng)存在，則Elasticsearch會將新文檔覆蓋已有文檔，而不是插入新文檔。因此，為文檔指定一個唯一的ID可以避免重復插入。
總之，索引ID在Elasticsearch中有著非常重要的作用，它不僅僅是文檔的唯一標識符，還可以對索引性能進行優(yōu)化，并且可以避免文檔的重復插入。因此，在實際使用中，我們應該根據(jù)具體需求來選擇是否手動指定文檔ID。文章來源地址http://www.zghlxwxcb.cn/news/detail-407813.html

到了這里，關于elasticsearch知識庫的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領支付寶紅包贊助服務器費用

【LangChain學習】基于PDF文檔構建問答知識庫（一）前期準備
這系列主要介紹如何使用LangChain大模型，結合ChatGPT3.5，基于PDF文檔構建專屬的問答知識庫。 LangChain 和 OpenAI 本身可支持 Nodejs 和 Python 兩個版本，筆者后續(xù)的介紹主要用到Python版本，如果有需要Nodejs版本的同學，也可以給我留言，因為Nodejs版本我也實現(xiàn)了。 Python 版本為 ≥
2024年02月13日
瀏覽(101)
基于LangChain+LLM的本地知識庫問答：從企業(yè)單文檔問答到批量文檔問答
過去半年，隨著ChatGPT的火爆，直接帶火了整個LLM這個方向，然LLM畢竟更多是基于過去的經(jīng)驗數(shù)據(jù)預訓練而來，沒法獲取最新的知識，以及各企業(yè)私有的知識為了獲取最新的知識，ChatGPT plus版集成了bing搜索的功能，有的模型則會調(diào)用一個定位于 “鏈接各種AI模型、工具”的
2024年02月07日
瀏覽(46)
一款私有化部署的企業(yè)級在線文檔和知識庫
項目介紹基礎說明：無憂企業(yè)文檔是JVS體系下的一款企業(yè)協(xié)同在線文檔，主要服務客群為企業(yè)用戶，解決企業(yè)內(nèi)部文檔編輯、知識沉淀、知識協(xié)同等痛點。項目主要采用Java開發(fā)，基礎框架采用JVS（spring cloud+Vue）適用場景：適用于企業(yè)、團隊，提供在線筆記、知識沉淀、在
2024年02月10日
瀏覽(28)
【elasticsearch實戰(zhàn)】知識庫文件系統(tǒng)檢索工具FSCrawler
最近有一個需求需要建設一個知識庫文檔檢索系統(tǒng)，這些知識庫物料附件的文檔居多，有較多文檔格式如：PDF, Open Office, MS Office等，需要將這些格式的文件轉(zhuǎn)化成文本格式，寫入elasticsearch 的全文檢索索引，方便搜索。我這里介紹一種工具不考慮文件原來格式，但能方便將轉(zhuǎn)
2024年02月22日
瀏覽(20)
【高級RAG技巧】在大模型知識庫問答中增強文檔分割與表格提取
文檔分割是一項具有挑戰(zhàn)性的任務，它是任何知識庫問答系統(tǒng)的基礎。高質(zhì)量的文檔分割結果對于顯著提升問答效果至關重要，但是目前大多數(shù)開源庫的處理能力有限。這些開源的庫或者方法缺點大致可以羅列如下：只能處理文本，無法提取表格中的內(nèi)容缺乏有效的分割策
2024年04月22日
瀏覽(24)
使用 ElasticSearch 作為知識庫，存儲向量及相似性搜索
在當今大數(shù)據(jù)時代，快速有效地搜索和分析海量數(shù)據(jù)成為了許多企業(yè)和組織的重要需求。 Elasticsearch 作為一款功能強大的分布式搜索和分析引擎，為我們提供了一種優(yōu)秀的解決方案。除了傳統(tǒng)的文本搜索， Elasticsearch 還引入了向量存儲的概念，以實現(xiàn)更精確、更高效的相似性
2024年02月10日
瀏覽(27)
基于ChatGPT的文檔知識庫客服系統(tǒng)-支持上傳網(wǎng)址/文本/docx等數(shù)據(jù)
現(xiàn)在，很多公司都有自己的內(nèi)容知識庫，會產(chǎn)生大量的碎片話的內(nèi)部知識，但是這樣內(nèi)部知識難以整合搜索。我開發(fā)的文檔知識庫客服系統(tǒng) gofly.v1kf.com ，可以應用于企業(yè)內(nèi)部知識庫管理，用戶可以使用自然語言提問，讓ChatGPT自動歸納總結企業(yè)知識信息，幫助員工快速獲取所
2024年02月02日
瀏覽(33)
使用 ElasticSearch 作為知識庫，存儲向量及相似性搜索_elasticsearch cosinesimilarity(1)
下面基于上篇文章使用到的 Chinese-medical-dialogue-data 中文醫(yī)療對話數(shù)據(jù)作為知識內(nèi)容進行實驗。本篇實驗使用 ES 版本為： 7.14.0 二、Chinese-medical-dialogue-data 數(shù)據(jù)集 GitHub 地址如下： https://github.com/Toyhom/Chinese-medical-dialogue-data 數(shù)據(jù)分了 6 個科目類型：數(shù)據(jù)格式如下所示：其中
2024年04月11日
瀏覽(30)
【LangChain學習】基于PDF文檔構建問答知識庫（三）實戰(zhàn)整合 LangChain、OpenAI、FAISS等
接下來，我們開始在web框架上整合 LangChain、OpenAI、FAISS等。因為項目是基于PDF文檔的，所以需要一些操作PDF的庫，我們這邊使用的是PyPDF2 傳入 pdf 文件路徑，返回 pdf 文檔的文本內(nèi)容。首先我們需要將第一步拿到的本文內(nèi)容拆分，我們使用的是?RecursiveCharacterTextSplitter ，默認
2024年02月13日
瀏覽(97)
開源大模型ChatGLM2-6B 2. 跟著LangChain參考文檔搭建LLM+知識庫問答系統(tǒng)
租用了1臺GPU服務器，系統(tǒng) ubuntu20，Tesla V100-16GB （GPU服務器已經(jīng)關機結束租賃了） SSH地址：* 端口：17520 SSH賬戶：root 密碼：Jaere7pa 內(nèi)網(wǎng)： 3389 ，外網(wǎng)：17518 VNC地址：* 端口：17519 VNC用戶名：root 密碼：Jaere7pa 硬件需求，ChatGLM-6B和ChatGLM2-6B相當。量化等級?? ?最低 GPU 顯存 F
2024年02月03日
瀏覽(32)