国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Elasticsearch中使用IK分詞配置

2年前作者：人生重啟分類(lèi)：Toy博客閱讀(18)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Elasticsearch中使用IK分詞配置。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

在 Elasticsearch 中，可以使用 IK 分詞器來(lái)替代默認(rèn)的 text 類(lèi)型。IK 分詞器是一個(gè)開(kāi)源的中文分詞器，支持中文分詞和英文分詞。

要將默認(rèn)的 text 類(lèi)型修改為 IK 分詞器，需要進(jìn)行以下步驟：

安裝 IK 分詞器插件：

下載 IK 分詞器插件，可以從 GitHub 上的 elasticsearch-analysis-ik 頁(yè)面下載最好下載與ES版本相同的IK版本文件。
將下載的插件解壓縮到 Elasticsearch 的插件目錄中。（插件目錄在ES的根目錄下的plugins）

創(chuàng)建索引并指定 IK 分詞器：

在創(chuàng)建索引時(shí)，使用自定義的分詞器配置來(lái)指定字段的分詞器為 IK 分詞器。

以下是一個(gè)示例的索引創(chuàng)建請(qǐng)求的 JSON 數(shù)據(jù)，其中將字段 content 的分詞器設(shè)置為 IK 分詞器：

PUT /my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_analyzer": {
          "type": "custom",
          "tokenizer": "ik_max_word",
          "filter": ["synonym_filter", "stop_filter"]
        }
      },
      "filter": {
        "synonym_filter": {
          "type": "synonym",
          "synonyms_path": "analysis/synonyms.txt"
        },
        "stop_filter": {
          "type": "stop",
          "stopwords_path": "analysis/stop.txt"
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "content": {
        "type": "text",
        "analyzer": "ik_analyzer"
      }
    }
  }
}

一、以上settings中說(shuō)明：

設(shè)置了一個(gè)自定義的解析器analyzer

定義名稱(chēng)為ik_analyzer(可根據(jù)自己喜好修改名稱(chēng))
定義它的類(lèi)型為custom自定義類(lèi)型
采用的分詞tokenizer為ik_max_word
定義了同義詞和停用詞過(guò)濾filter為synonym_filter、stop_filter

設(shè)置過(guò)濾filter

分別命名為synonym_filter和stop_filter（名字自己?。?，上邊引用的filter就是對(duì)應(yīng)的這個(gè)名字(不要寫(xiě)錯(cuò))
定義了type類(lèi)型分別是synonym(同義詞)、stop(停用詞)
synonyms_path和stopwords_path分別是同義詞和停用詞文件位置，文件路徑為ES根目錄下的config中創(chuàng)建analysis/synonyms.txt和analysis/stop.txt；（文件夾analysis和文件XXX.txt可自己定義，主要是放在config下邊）

二、以上mappings中說(shuō)明：

定義屬性properties為content(這個(gè)就是我們要進(jìn)行分詞的字段名)
定義content字段類(lèi)型為type:text
字段content采用的解析方式analyzer為上邊settings中定義的ik_analyzer

以上就基本完成了ES+IK分詞的索引創(chuàng)建文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-635601.html

到了這里，關(guān)于Elasticsearch中使用IK分詞配置的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶(hù)投稿，該文觀(guān)點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

搜索引擎elasticsearch ：安裝elasticsearch (包含安裝組件kibana、IK分詞器、部署es集群)
kibana可以幫助我們方便地編寫(xiě)DSL語(yǔ)句，所以還要裝kibana 因?yàn)槲覀冞€需要部署kibana容器，因此需要讓es和kibana容器互聯(lián)。這里先創(chuàng)建一個(gè)網(wǎng)絡(luò)：這里我們采用elasticsearch的7.12.1版本的鏡像，這個(gè)鏡像體積非常大，接近1G。不建議大家自己pull。課前資料提供了鏡像的tar包：大家將
2024年02月16日
瀏覽(26)
Docker安裝ElasticSearch、Kibana、IK分詞器以及設(shè)置ES賬戶(hù)密碼
版本聲明：系統(tǒng) ：CentOS 7.9（云服務(wù)器） ES版本：7.6.1 Kibana ：7.6.1 Ik分析器版本：7.6.1 1、拉取鏡像 2、創(chuàng)建掛載目錄設(shè)置所有用戶(hù)讀寫(xiě)執(zhí)行權(quán)限： sudo chmod -R 777 /docker_config/elasticsearch/ 3、創(chuàng)建elasticsearch.yml 配置文件 4、創(chuàng)建容器參數(shù)說(shuō)明： -p 端口映射 -e discovery.type=single
2023年04月09日
瀏覽(34)
Docker：Elasticsearch安裝配置IK分詞器
一、背景: ? 搞了elasticsearch和kibana的安裝和配置，在進(jìn)行分詞的時(shí)候沒(méi)有達(dá)到自己預(yù)想的效果，于是寫(xiě)一下elasticsearch的ik分詞器的安裝和配置（自定義分詞）。二、解決方式： 1：首先看看沒(méi)有加ik分詞器的效果。 2：下載ik軟件包。 ?3：選擇自己響應(yīng)版本。 ?4：將下載好的
2023年04月18日
瀏覽(26)
ElasticSearch-使用IK分詞器進(jìn)行分詞
使用KIbana測(cè)試IK分詞器打開(kāi)開(kāi)發(fā)工具臺(tái) ik_smart 最少分詞器分詞結(jié)果比較少 ik_max_word 顆粒度最細(xì)分詞器分詞結(jié)果比較多,組成各種結(jié)果,窮盡詞庫(kù)的可能！再看個(gè)例子,把我們的句子換成超級(jí)喜歡魏一鶴學(xué)習(xí)Java 首先看最少分詞然后是最細(xì)顆粒度分詞問(wèn)題來(lái)了我們輸入超級(jí)喜
2024年02月13日
瀏覽(19)
在 Linux 上使用 Docker 安裝 Elasticsearch 和 Kibana 并配置 IK 分詞器和停用詞典
首先要?jiǎng)?chuàng)建一個(gè)網(wǎng)絡(luò)，以便讓 ES 和 Kibana 容器互聯(lián)。使用 Docker 拉取 Elasticsearch7.17.11 版本的鏡像：拉取完鏡像后使用 Docker 運(yùn)行 ES 容器：注： -e \\\"ES_JAVA_OPTS=-Xms512m -Xmx512m\\\" ：設(shè)置堆大小（默認(rèn)堆大小為 1GB 1 ） -e \\\"discovery.type=single-node\\\" ：?jiǎn)喂?jié)點(diǎn)模式 -v es-data:/usr/share/elasticsear
2024年02月05日
瀏覽(33)
本地elasticsearch中文分詞器 ik分詞器安裝及使用
ElasticSearch 內(nèi)置了分詞器，如標(biāo)準(zhǔn)分詞器、簡(jiǎn)單分詞器、空白詞器等。但這些分詞器對(duì)我們最常使用的中文并不友好，不能按我們的語(yǔ)言習(xí)慣進(jìn)行分詞。 ik分詞器就是一個(gè)標(biāo)準(zhǔn)的中文分詞器。它可以根據(jù)定義的字典對(duì)域進(jìn)行分詞，并且支持用戶(hù)配置自己的字典，所以它除了可
2024年02月05日
瀏覽(36)
“Elasticsearch + Kibana + ik分詞器“介紹與使用
Elasticsearch 是一個(gè)分布式、RESTful 風(fēng)格的搜索和數(shù)據(jù)分析引擎，能夠解決不斷涌現(xiàn)出的各種用例。作為 Elastic Stack 的核心，它集中存儲(chǔ)您的數(shù)據(jù)，幫助您發(fā)現(xiàn)意料之中以及意料之外的情況。 Elasticsearch 官方介紹官方文檔官方中文社區(qū)中文1 社區(qū)中文2 1、Index （索引） 2、Typ
2023年04月08日
瀏覽(27)
ElasticSearch之IK分詞器安裝以及使用介紹
elasticsearch 默認(rèn)的內(nèi)置分詞器對(duì)中文的分詞效果可能并不理想，因?yàn)樗鼈冎饕轻槍?duì)英文等拉丁語(yǔ)系的文本設(shè)計(jì)的。如果要在中文文本上獲得更好的分詞效果，我們可以考慮使用中文專(zhuān)用的分詞器。 IK 分詞器是一個(gè)開(kāi)源的中文分詞器插件，特別為 Elasticsearch 設(shè)計(jì)和優(yōu)化。它在
2024年02月13日
瀏覽(29)
Elasticsearch下載安裝，IK分詞器、Kibana下載安裝使用，elasticsearch使用演示
首先給出自己使用版本的網(wǎng)盤(pán)鏈接：自己的版本7.17.14 鏈接：https://pan.baidu.com/s/1FSlI9jNf1KRP-OmZlCkEZw 提取碼：1234 一般情況下 Elastic Search（ES）并不單獨(dú)使用，例如主流的技術(shù)組合 ELK（Elasticsearch + Logstash + Kibana ） 1. Elasticsearch下載下載之前，先看下和 JDK 版本的對(duì)應(yīng)關(guān)系，版本
2024年02月05日
瀏覽(34)
Elasticsearch7.15.2 安裝ik中文分詞器后啟動(dòng)ES服務(wù)報(bào)錯(cuò)的解決辦法
下載elasticsearch ik中文分詞器，在elasticsearch安裝目錄下的plugins文件夾下創(chuàng)建名為ik的文件夾，將下載的ik中文分詞器解壓縮到新建的ik文件夾下，再次運(yùn)行 ./bin/elasticsearch啟動(dòng)ES服務(wù)時(shí)出現(xiàn)以下錯(cuò)誤： Exception in thread \\\"main\\\" java.nio.file.NotDirectoryException: /Users/amelia/work/elasticsearch-7.1
2024年02月12日
瀏覽(34)