国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件,一篇文章帶你徹底拿下!

這篇具有很好參考價(jià)值的文章主要介紹了ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件,一篇文章帶你徹底拿下!。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

一、什么是IK分詞器
所謂分詞,即把一段中文或者別的劃分成一個(gè)個(gè)的關(guān)鍵字,我們?cè)谒阉鲿r(shí)會(huì)把自己的信息進(jìn)行分詞,會(huì)把數(shù)據(jù)庫(kù)中或者索引庫(kù)中的數(shù)據(jù)進(jìn)行分詞,然后進(jìn)行一個(gè)匹配的操作,默認(rèn)的中文分詞器是將每一個(gè)字看成一個(gè)詞,比如“我愛中國(guó)”會(huì)被分成“我”、“愛”、“中”、“國(guó)”,這顯然是不符合要求的,所以我們需要安裝中文分詞器IK來(lái)解決這個(gè)問題!

二、IK分詞器的分詞算法
1、ik__smart最少切分

2、ik_max_word最細(xì)粒度劃分

三、安裝IK
1、官網(wǎng)地址:GitHub - medcl/elasticsearch-analysis-ik: The IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary.

2、下載完畢之后,放入我們的elasticsearch的插件文件夾中

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

3、重啟觀察Elasticsearch
可以看到我們es啟動(dòng)的時(shí)候,加載了剛剛解壓的ik插件?es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

4、也可以通過ES的bin下的elasticsearch-plugin.bat查看安裝的插件
(1)在bin目錄下,打開cmd輸入命令

elasticsearch-plugin list

(2)可以查看當(dāng)前安裝的插件有哪些

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

5、使用kibana測(cè)試
(1)ik__smart最少切分:根據(jù)字典的配置,盡量少的對(duì)文檔進(jìn)行拆分
GET _analyze:這是通過RestFul風(fēng)格請(qǐng)求分詞器
“analyzer”:表示請(qǐng)求的分詞要求(選擇最少切分還是最細(xì)粒度?。?br> “text”:表示要分詞的文本

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

(2)ik_max_word最細(xì)粒度劃分:根據(jù)詞庫(kù)中的字典,最大程度的對(duì)文檔內(nèi)容進(jìn)行拆分

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

四、配置IK分詞器字典
假如我想對(duì)以下的內(nèi)容進(jìn)行分詞,我不希望“長(zhǎng)江東逝水”分開,這個(gè)時(shí)候就需要我們自己去配置一下屬于我們自己的字典了

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

配置方法:
1、打開IK分詞器的config配置文件夾

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

2、查看IKAnalyzer.cfg.xml配置文件

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

3、在目錄下新建一個(gè)文件,后綴為.dic,把我們想配置的字典內(nèi)容填進(jìn)去
如果我們不希望把某個(gè)詞給我拆開了,那么我就可以通過編寫自己的配置字典,把文本輸入進(jìn)去,綁定到IKAnalyzer.cfg.xml配置文件中即可!

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

4、把我們自己配置的字典注入進(jìn)來(lái)

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

5、重啟ES和kibana
(1)觀察ES細(xì)節(jié),我們自己編寫的字典被加載進(jìn)來(lái)了!

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

(2)重啟kibana即可

6、測(cè)試重新使用最少切分的算法,測(cè)試“滾滾長(zhǎng)江東逝水”,是否把我們的“長(zhǎng)江東逝水”拼接在一起了
成功!

es ik插件,ElasticSearch,elasticsearch,大數(shù)據(jù),搜索引擎

將來(lái)我們所有需要自己配置特定的分詞效果,直接在我們自己定義的dic文件中進(jìn)行配置即可!?。。。。∮浀媒壎ǖ絀KAnalyzer.cfg.xml配置文件中哦

至此,恭喜你已經(jīng)掌握了安裝和使用IK分詞器,掌握了分詞的基本規(guī)則。后續(xù)還會(huì)持續(xù)更新關(guān)于ES相關(guān)技術(shù)點(diǎn),敬清期待~~~文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-769825.html

到了這里,關(guān)于ElasticSearch篇——認(rèn)識(shí)、安裝和使用IK分詞器插件,一篇文章帶你徹底拿下!的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 本地elasticsearch中文分詞器 ik分詞器安裝及使用

    本地elasticsearch中文分詞器 ik分詞器安裝及使用

    ElasticSearch 內(nèi)置了分詞器,如標(biāo)準(zhǔn)分詞器、簡(jiǎn)單分詞器、空白詞器等。但這些分詞器對(duì)我們最常使用的中文并不友好,不能按我們的語(yǔ)言習(xí)慣進(jìn)行分詞。 ik分詞器就是一個(gè)標(biāo)準(zhǔn)的中文分詞器。它可以根據(jù)定義的字典對(duì)域進(jìn)行分詞,并且支持用戶配置自己的字典,所以它除了可

    2024年02月05日
    瀏覽(36)
  • Elasticsearch下載安裝,IK分詞器、Kibana下載安裝使用,elasticsearch使用演示

    Elasticsearch下載安裝,IK分詞器、Kibana下載安裝使用,elasticsearch使用演示

    首先給出自己使用版本的網(wǎng)盤鏈接:自己的版本7.17.14 鏈接:https://pan.baidu.com/s/1FSlI9jNf1KRP-OmZlCkEZw 提取碼:1234 一般情況下 Elastic Search(ES) 并不單獨(dú)使用,例如主流的技術(shù)組合 ELK(Elasticsearch + Logstash + Kibana ) 1. Elasticsearch下載 下載之前,先看下和 JDK 版本的對(duì)應(yīng)關(guān)系,版本

    2024年02月05日
    瀏覽(34)
  • ElasticSearch之IK分詞器安裝以及使用介紹

    ElasticSearch之IK分詞器安裝以及使用介紹

    elasticsearch 默認(rèn)的內(nèi)置分詞器對(duì)中文的分詞效果可能并不理想,因?yàn)樗鼈冎饕轻槍?duì)英文等拉丁語(yǔ)系的文本設(shè)計(jì)的。如果要在中文文本上獲得更好的分詞效果,我們可以考慮使用中文專用的分詞器。 IK 分詞器是一個(gè)開源的中文分詞器插件,特別為 Elasticsearch 設(shè)計(jì)和優(yōu)化。它在

    2024年02月13日
    瀏覽(30)
  • elasticsearch插件ik分詞器,無(wú)法啟動(dòng)解決方案

    elasticsearch插件ik分詞器,無(wú)法啟動(dòng)解決方案

    首先7以后的版本一定要與es的版本保持一致 下載包只能下載這個(gè)路徑的文件,版本號(hào)與自己的es版本保持一致?https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v8.6.0/elasticsearch-analysis-ik-8.6.0.zip這里可以直接替換? ? docker容器無(wú)法啟動(dòng),可以刪除宿主機(jī)的plugins文件夾后重新

    2024年02月15日
    瀏覽(20)
  • elasticsearch 安裝 IK 中文分詞器插件提示找不到文件的異常(Exception in thread “main“ java.nio.file.NoSuchFileException)

    elasticsearch 安裝 IK 中文分詞器插件提示找不到文件的異常(Exception in thread “main“ java.nio.file.NoSuchFileException)

    錯(cuò)誤截圖 在命令行窗口,執(zhí)行如下命令安裝 IK 中文分詞器 失敗。 錯(cuò)誤日志 1、自己到github下載對(duì)應(yīng)版本的ik中文分詞器 上面命令中兩個(gè)插件版本號(hào)應(yīng)該和 Elasticsearch 的版本保持一致,我現(xiàn)在用的是 7.14.1 版本。 首先版本和命令是對(duì)得上的。 命令行窗口通過命令下載失敗的話

    2024年04月11日
    瀏覽(29)
  • windows安裝Elasticsearch后使用ik分詞器報(bào)錯(cuò)解決辦法

    windows安裝Elasticsearch后使用ik分詞器報(bào)錯(cuò)解決辦法

    最近在學(xué)習(xí)Elasticsearch,安裝完成后下載了ik分詞器壓縮到plugins目錄下啟動(dòng)es報(bào)錯(cuò)如下: 咋一看以為是es對(duì)應(yīng)的jdk自帶的權(quán)限不足導(dǎo)致的,查看jdk自帶的文件查看權(quán)限沒有發(fā)現(xiàn)問題:D:Code StudyTechnologyESelasticsearch-8.11.1jdklibsecurity下的default.policy 后面發(fā)現(xiàn)是路徑帶了空格,把

    2024年01月20日
    瀏覽(43)
  • CentOS 7 使用Docker方式搭建ElasticSearch 7.7.0 三節(jié)點(diǎn)集群,并配置elasticsearch-head插件,ik分詞器,以及Kibana可視化平臺(tái)

    CentOS 7 使用Docker方式搭建ElasticSearch 7.7.0 三節(jié)點(diǎn)集群,并配置elasticsearch-head插件,ik分詞器,以及Kibana可視化平臺(tái)

    IP 角色 172.16.31.191 elasticsearch-1 172.16.31.192 elasticsearch-2 172.16.31.193 elasticsearch-3 并創(chuàng)建相關(guān)掛載目錄,3臺(tái)虛擬機(jī)都要,如下 還要對(duì)文件夾加設(shè)置開放權(quán)限,如果不開放權(quán)限,則會(huì)報(bào)錯(cuò)無(wú)法寫入數(shù)據(jù)的情況,3臺(tái)虛擬機(jī)都要,如下 172.16.31.191 172.16.31.192 172.16.31.193 172.16.31.191 172.16.3

    2024年02月04日
    瀏覽(20)
  • windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安裝、部署、使用

    windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安裝、部署、使用

    目錄 問題現(xiàn)象: 解決方法: 1、下載IK中文分詞器 2、部署 3、使用 前言(選看) ? ? ? 最近在重溫Elasticsearch,看來(lái)一下官網(wǎng),都出到8.4.3版本了。想當(dāng)初學(xué)的時(shí)候用的還是5.6.8,版本更新了很多意味著有大變動(dòng)。 ????????? windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安

    2024年02月13日
    瀏覽(33)
  • ElasticSearch的使用,安裝ik分詞器,自定義詞庫(kù),SpringBoot整合ES(增、刪、改、查)

    ElasticSearch的使用,安裝ik分詞器,自定義詞庫(kù),SpringBoot整合ES(增、刪、改、查)

    保存一個(gè)數(shù)據(jù),保存在哪個(gè)索引的哪個(gè)類型下,指定用哪個(gè)唯一標(biāo)識(shí)(相當(dāng)于,保存一個(gè)數(shù)據(jù),保存在那個(gè)數(shù)據(jù)庫(kù)中的哪個(gè)表中,指定主鍵ID) 例:PUT customer/external/1;在customer索引下的external類型下保存1號(hào)數(shù)據(jù)name為John Doe的數(shù)據(jù) POST和PUT都可以新增數(shù)據(jù) 注意: POST 新增。如果

    2023年04月25日
    瀏覽(59)
  • ElasticSearch插件plugin ik分詞器,報(bào)錯(cuò)plugin-descriptor.properties

    ElasticSearch插件plugin ik分詞器,報(bào)錯(cuò)plugin-descriptor.properties

    @ES日志中報(bào)錯(cuò)plugin-descriptor.properties NoSuchFileException 找不到這個(gè)文件plugin-descriptor.properties。 ` 如下圖所示,下載的zip文件解壓之后的情況,這里是不能放到elasticsearch的plugins中的。 分析:由于是java開發(fā)的分詞器,這里很明顯是maven項(xiàng)目的目錄結(jié)構(gòu)。所以要執(zhí)行打包命令,生成

    2024年02月11日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包