国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<span id="gxj9m"></span>

<rp id="gxj9m"><del id="gxj9m"></del></rp>

ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件，一篇文章帶你徹底拿下！

2年前作者：Be explorer分類：Toy博客閱讀(28)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件，一篇文章帶你徹底拿下！。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

一、什么是IK分詞器
所謂分詞，即把一段中文或者別的劃分成一個(gè)個(gè)的關(guān)鍵字，我們?cè)谒阉鲿r(shí)會(huì)把自己的信息進(jìn)行分詞，會(huì)把數(shù)據(jù)庫(kù)中或者索引庫(kù)中的數(shù)據(jù)進(jìn)行分詞，然后進(jìn)行一個(gè)匹配的操作，默認(rèn)的中文分詞器是將每一個(gè)字看成一個(gè)詞，比如“我愛中國(guó)”會(huì)被分成“我”、“愛”、“中”、“國(guó)”，這顯然是不符合要求的，所以我們需要安裝中文分詞器IK來(lái)解決這個(gè)問題！

二、IK分詞器的分詞算法
1、ik__smart最少切分

2、ik_max_word最細(xì)粒度劃分

三、安裝IK
1、官網(wǎng)地址：GitHub - medcl/elasticsearch-analysis-ik: The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.

2、下載完畢之后，放入我們的elasticsearch的插件文件夾中

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

3、重啟觀察Elasticsearch
可以看到我們es啟動(dòng)的時(shí)候，加載了剛剛解壓的ik插件? es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

4、也可以通過ES的bin下的elasticsearch-plugin.bat查看安裝的插件
（1）在bin目錄下，打開cmd輸入命令

elasticsearch-plugin list

（2）可以查看當(dāng)前安裝的插件有哪些

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

5、使用kibana測(cè)試
（1）ik__smart最少切分：根據(jù)字典的配置，盡量少的對(duì)文檔進(jìn)行拆分
GET _analyze:這是通過RestFul風(fēng)格請(qǐng)求分詞器
“analyzer”：表示請(qǐng)求的分詞要求（選擇最少切分還是最細(xì)粒度?。?br> “text”:表示要分詞的文本

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

（2）ik_max_word最細(xì)粒度劃分：根據(jù)詞庫(kù)中的字典，最大程度的對(duì)文檔內(nèi)容進(jìn)行拆分

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

四、配置IK分詞器字典
假如我想對(duì)以下的內(nèi)容進(jìn)行分詞，我不希望“長(zhǎng)江東逝水”分開，這個(gè)時(shí)候就需要我們自己去配置一下屬于我們自己的字典了

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

配置方法：
1、打開IK分詞器的config配置文件夾

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

2、查看IKAnalyzer.cfg.xml配置文件

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

3、在目錄下新建一個(gè)文件，后綴為.dic，把我們想配置的字典內(nèi)容填進(jìn)去
如果我們不希望把某個(gè)詞給我拆開了，那么我就可以通過編寫自己的配置字典，把文本輸入進(jìn)去，綁定到IKAnalyzer.cfg.xml配置文件中即可！

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

4、把我們自己配置的字典注入進(jìn)來(lái)

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

5、重啟ES和kibana
（1）觀察ES細(xì)節(jié)，我們自己編寫的字典被加載進(jìn)來(lái)了！

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

（2）重啟kibana即可

6、測(cè)試重新使用最少切分的算法，測(cè)試“滾滾長(zhǎng)江東逝水”，是否把我們的“長(zhǎng)江東逝水”拼接在一起了
成功！

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

將來(lái)我們所有需要自己配置特定的分詞效果，直接在我們自己定義的dic文件中進(jìn)行配置即可！?。。。。∮浀媒壎ǖ絀KAnalyzer.cfg.xml配置文件中哦

至此，恭喜你已經(jīng)掌握了安裝和使用IK分詞器，掌握了分詞的基本規(guī)則。后續(xù)還會(huì)持續(xù)更新關(guān)于ES相關(guān)技術(shù)點(diǎn)，敬清期待~~~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-769825.html

到了這里，關(guān)于ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件，一篇文章帶你徹底拿下！的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

本地elasticsearch中文分詞器 ik分詞器安裝及使用
ElasticSearch 內(nèi)置了分詞器，如標(biāo)準(zhǔn)分詞器、簡(jiǎn)單分詞器、空白詞器等。但這些分詞器對(duì)我們最常使用的中文并不友好，不能按我們的語(yǔ)言習(xí)慣進(jìn)行分詞。 ik分詞器就是一個(gè)標(biāo)準(zhǔn)的中文分詞器。它可以根據(jù)定義的字典對(duì)域進(jìn)行分詞，并且支持用戶配置自己的字典，所以它除了可
2024年02月05日
瀏覽(36)
Elasticsearch下載安裝，IK分詞器、Kibana下載安裝使用，elasticsearch使用演示
首先給出自己使用版本的網(wǎng)盤鏈接：自己的版本7.17.14 鏈接：https://pan.baidu.com/s/1FSlI9jNf1KRP-OmZlCkEZw 提取碼：1234 一般情況下 Elastic Search（ES）并不單獨(dú)使用，例如主流的技術(shù)組合 ELK（Elasticsearch + Logstash + Kibana ） 1. Elasticsearch下載下載之前，先看下和 JDK 版本的對(duì)應(yīng)關(guān)系，版本
2024年02月05日
瀏覽(34)
ElasticSearch之IK分詞器安裝以及使用介紹
elasticsearch 默認(rèn)的內(nèi)置分詞器對(duì)中文的分詞效果可能并不理想，因?yàn)樗鼈冎饕轻槍?duì)英文等拉丁語(yǔ)系的文本設(shè)計(jì)的。如果要在中文文本上獲得更好的分詞效果，我們可以考慮使用中文專用的分詞器。 IK 分詞器是一個(gè)開源的中文分詞器插件，特別為 Elasticsearch 設(shè)計(jì)和優(yōu)化。它在
2024年02月13日
瀏覽(30)
elasticsearch插件ik分詞器，無(wú)法啟動(dòng)解決方案
首先7以后的版本一定要與es的版本保持一致下載包只能下載這個(gè)路徑的文件，版本號(hào)與自己的es版本保持一致?https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.6.0/elasticsearch-analysis-ik-8.6.0.zip這里可以直接替換? ? docker容器無(wú)法啟動(dòng)，可以刪除宿主機(jī)的plugins文件夾后重新
2024年02月15日
瀏覽(20)
elasticsearch 安裝 IK 中文分詞器插件提示找不到文件的異常（Exception in thread “main“ java.nio.file.NoSuchFileException）
錯(cuò)誤截圖在命令行窗口，執(zhí)行如下命令安裝 IK 中文分詞器失敗。錯(cuò)誤日志 1、自己到github下載對(duì)應(yīng)版本的ik中文分詞器上面命令中兩個(gè)插件版本號(hào)應(yīng)該和 Elasticsearch 的版本保持一致，我現(xiàn)在用的是 7.14.1 版本。首先版本和命令是對(duì)得上的。命令行窗口通過命令下載失敗的話
2024年04月11日
瀏覽(29)
windows安裝Elasticsearch后使用ik分詞器報(bào)錯(cuò)解決辦法
最近在學(xué)習(xí)Elasticsearch，安裝完成后下載了ik分詞器壓縮到plugins目錄下啟動(dòng)es報(bào)錯(cuò)如下：咋一看以為是es對(duì)應(yīng)的jdk自帶的權(quán)限不足導(dǎo)致的，查看jdk自帶的文件查看權(quán)限沒有發(fā)現(xiàn)問題：D:Code StudyTechnologyESelasticsearch-8.11.1jdklibsecurity下的default.policy 后面發(fā)現(xiàn)是路徑帶了空格，把
2024年01月20日
瀏覽(43)
CentOS 7 使用Docker方式搭建ElasticSearch 7.7.0 三節(jié)點(diǎn)集群，并配置elasticsearch-head插件，ik分詞器，以及Kibana可視化平臺(tái)
IP 角色 172.16.31.191 elasticsearch-1 172.16.31.192 elasticsearch-2 172.16.31.193 elasticsearch-3 并創(chuàng)建相關(guān)掛載目錄，3臺(tái)虛擬機(jī)都要，如下還要對(duì)文件夾加設(shè)置開放權(quán)限，如果不開放權(quán)限，則會(huì)報(bào)錯(cuò)無(wú)法寫入數(shù)據(jù)的情況，3臺(tái)虛擬機(jī)都要，如下 172.16.31.191 172.16.31.192 172.16.31.193 172.16.31.191 172.16.3
2024年02月04日
瀏覽(20)
windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安裝、部署、使用
目錄問題現(xiàn)象：解決方法： 1、下載IK中文分詞器 2、部署 3、使用前言（選看） ? ? ? 最近在重溫Elasticsearch，看來(lái)一下官網(wǎng)，都出到8.4.3版本了。想當(dāng)初學(xué)的時(shí)候用的還是5.6.8，版本更新了很多意味著有大變動(dòng)。 ????????? windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安
2024年02月13日
瀏覽(33)
ElasticSearch的使用，安裝ik分詞器，自定義詞庫(kù)，SpringBoot整合ES（增、刪、改、查）
保存一個(gè)數(shù)據(jù)，保存在哪個(gè)索引的哪個(gè)類型下，指定用哪個(gè)唯一標(biāo)識(shí)（相當(dāng)于，保存一個(gè)數(shù)據(jù)，保存在那個(gè)數(shù)據(jù)庫(kù)中的哪個(gè)表中，指定主鍵ID）例：PUT customer/external/1；在customer索引下的external類型下保存1號(hào)數(shù)據(jù)name為John Doe的數(shù)據(jù) POST和PUT都可以新增數(shù)據(jù) 注意： POST 新增。如果
2023年04月25日
瀏覽(59)
ElasticSearch插件plugin ik分詞器，報(bào)錯(cuò)plugin-descriptor.properties
@ES日志中報(bào)錯(cuò)plugin-descriptor.properties NoSuchFileException 找不到這個(gè)文件plugin-descriptor.properties。 ` 如下圖所示，下載的zip文件解壓之后的情況，這里是不能放到elasticsearch的plugins中的。分析：由于是java開發(fā)的分詞器，這里很明顯是maven項(xiàng)目的目錄結(jié)構(gòu)。所以要執(zhí)行打包命令，生成
2024年02月11日
瀏覽(26)