国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Elasticsearch之ik中文分詞篇

這篇具有很好參考價(jià)值的文章主要介紹了Elasticsearch之ik中文分詞篇。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

ik分詞器插件

es在7.3版本已經(jīng)支持中文分詞,由于中文分詞只能支持到單個(gè)字進(jìn)行分詞,不夠靈活與適配我們平常使用習(xí)慣,所以有很多對(duì)應(yīng)中文分詞出現(xiàn),最近使用的是ik分詞器,就說(shuō)說(shuō)它吧。

ik分詞器安裝

安裝可以百度下有很多教程,需要注意的是ik分詞器的版本要跟es版本對(duì)應(yīng)上,避免出現(xiàn)不必要的兼容問(wèn)題。

ik分詞模式

ik_max_word: 將文本拆分成最細(xì)粒度的詞語(yǔ)或者字

GET /test_analysis/_analyze
{
  "text": "是否分詞",
  "analyzer": "ik_max_word"
}

結(jié)果

{
  "tokens" : [
    {
      "token" : "是否",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "是",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "否",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "分詞",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "分",
      "start_offset" : 2,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "詞",
      "start_offset" : 3,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 5
    }
  ]
}

ik_smart: 將文本拆分成最粗粒的詞語(yǔ)

GET /test_analysis/_analyze
{
  "text": "是否分詞",
  "analyzer": "ik_smart"
}

結(jié)果

{
  "tokens" : [
    {
      "token" : "是否",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "分詞",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 1
    }
  ]
}

一般都用ik_max_word

es ik分詞測(cè)試

創(chuàng)建索引

PUT /test_analysis
{
  "mappings": {
    "properties": {
      "message": {
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "id": {
        "type": "keyword"
      }
    }
  }
}

添加數(shù)據(jù)

POST /test_analysis/_bulk
{"index":{}}
{"id":"111", "message":"我是一個(gè)小可愛(ài)"}
{"index":{}}
{"id":"222", "message":"只是為了測(cè)試一下結(jié)果是否分詞"}
{"index":{}}
{"id":"333", "message":"測(cè)試一下是否進(jìn)行了ik分詞"}
{"index":{}}
{"id":"444", "message":"搞一些假的數(shù)據(jù)吧"}
{"index":{}}
{"id":"555", "message":"實(shí)在不知道再寫(xiě)一些什么了"}
{"index":{}}
{"id":"666", "message":"就這樣吧"}

查詢

GET /test_analysis/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "message": "是否分詞"
          }
        }
      ]
    }
  }
}

查詢分詞結(jié)果文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-782721.html

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 3,
      "relation" : "eq"
    },
    "max_score" : 5.104265,
    "hits" : [
      {
        "_index" : "test_analysis",
        "_type" : "_doc",
        "_id" : "MDXEe4wBS_Neyb68FBdy",
        "_score" : 5.104265,
        "_source" : {
          "id" : "333",
          "message" : "測(cè)試一下是否進(jìn)行了ik分詞"
        }
      },
      {
        "_index" : "test_analysis",
        "_type" : "_doc",
        "_id" : "LzXEe4wBS_Neyb68FBdy",
        "_score" : 5.0611815,
        "_source" : {
          "id" : "222",
          "message" : "只是為了測(cè)試一下結(jié)果是否分詞"
        }
      },
      {
        "_index" : "test_analysis",
        "_type" : "_doc",
        "_id" : "LjXEe4wBS_Neyb68FBdy",
        "_score" : 0.728194,
        "_source" : {
          "id" : "111",
          "message" : "我是一個(gè)小可愛(ài)"
        }
      }
    ]
  }
}

到了這里,關(guān)于Elasticsearch之ik中文分詞篇的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • es elasticsearch 十 中文分詞器ik分詞器 Mysql 熱更新詞庫(kù)

    es elasticsearch 十 中文分詞器ik分詞器 Mysql 熱更新詞庫(kù)

    目錄 中文分詞器ik分詞器 介紹 安裝 使用分詞器 Ik分詞器配置文件 Mysql 熱更新詞庫(kù) 介紹 中文分詞器按照中文進(jìn)行分詞,中文應(yīng)用最廣泛的是ik分詞器 安裝 官網(wǎng)下載對(duì)應(yīng)版本zip 下載 ?放到 ?plugins 目錄 新建 ik文件夾 考入解析zip 重啟 es //分成小單詞 使用分詞器 ik_max_word分成

    2024年02月07日
    瀏覽(21)
  • Elasticsearch07:ES中文分詞插件(es-ik)安裝部署

    Elasticsearch07:ES中文分詞插件(es-ik)安裝部署

    在中文數(shù)據(jù)檢索場(chǎng)景中,為了提供更好的檢索效果,需要在ES中集成中文分詞器,因?yàn)镋S默認(rèn)是按照英文的分詞規(guī)則進(jìn)行分詞的,基本上可以認(rèn)為是單字分詞,對(duì)中文分詞效果不理想。 ES之前是沒(méi)有提供中文分詞器的,現(xiàn)在官方也提供了一些,但是在中文分詞領(lǐng)域,IK分詞器是

    2024年02月03日
    瀏覽(27)
  • ElasticSearch:centos7安裝elasticsearch7,kibana,ik中文分詞器,云服務(wù)器安裝elasticsearch

    ElasticSearch:centos7安裝elasticsearch7,kibana,ik中文分詞器,云服務(wù)器安裝elasticsearch

    系統(tǒng):centos7 elasticsearch: 7.17.16 安裝目錄:/usr/local 云服務(wù)器的安全組:開(kāi)放 9200 和5601的端口 1、安裝 2、修改es的配置文件 注意:es集群?jiǎn)?dòng)后,所有節(jié)點(diǎn)的cluster.initial_master_nodes: [\\\"node-1\\\"] 都要注釋掉。 3、修改jvm.options 可能出現(xiàn)報(bào)錯(cuò) 1、配置elasticsearch.yml ? 錯(cuò)誤內(nèi)容 : the de

    2024年02月03日
    瀏覽(29)
  • elasticsearch安裝中文分詞IK啟動(dòng)異常:java.nio.file.AccessDeniedException

    啟動(dòng)錯(cuò)誤信息如下: 問(wèn)題原因:plugins中添加的ik目錄沒(méi)有權(quán)限; 解決方案:進(jìn)入elasticsearch容器對(duì)應(yīng)plugins目錄下,進(jìn)行 chmod 777 ik 授權(quán)即可。

    2024年02月03日
    瀏覽(23)
  • windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安裝、部署、使用

    windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安裝、部署、使用

    目錄 問(wèn)題現(xiàn)象: 解決方法: 1、下載IK中文分詞器 2、部署 3、使用 前言(選看) ? ? ? 最近在重溫Elasticsearch,看來(lái)一下官網(wǎng),都出到8.4.3版本了。想當(dāng)初學(xué)的時(shí)候用的還是5.6.8,版本更新了很多意味著有大變動(dòng)。 ????????? windows環(huán)境基于Elasticsearch8.4.0的IK中文分詞器的安

    2024年02月13日
    瀏覽(33)
  • Linux下安裝ElasticSearch-analysis-ik中文分詞器插件,以及可能出現(xiàn)的異常處理

    Linux下安裝ElasticSearch-analysis-ik中文分詞器插件,以及可能出現(xiàn)的異常處理

    ? ? ? ? 注意:安裝可以采用在線方式、離線方式,但是不建議在線安裝,速度超級(jí)慢,本文只介紹離線安裝方式 ? ? ? ? ????????下載地址:https://github.com/medcl/elasticsearch-analysis-ik ? ? ? ? ? ? ? ? 切記選擇版本需要跟ElasticSearch保持一致,否則可能會(huì)出現(xiàn)一些未知的異

    2024年02月07日
    瀏覽(35)
  • Elasticsearch7.15.2 安裝ik中文分詞器后啟動(dòng)ES服務(wù)報(bào)錯(cuò)的解決辦法

    Elasticsearch7.15.2 安裝ik中文分詞器后啟動(dòng)ES服務(wù)報(bào)錯(cuò)的解決辦法

    下載elasticsearch ik中文分詞器,在elasticsearch安裝目錄下的plugins文件夾下創(chuàng)建名為ik的文件夾,將下載的ik中文分詞器解壓縮到新建的ik文件夾下,再次運(yùn)行 ./bin/elasticsearch啟動(dòng)ES服務(wù)時(shí)出現(xiàn)以下錯(cuò)誤: Exception in thread \\\"main\\\" java.nio.file.NotDirectoryException: /Users/amelia/work/elasticsearch-7.1

    2024年02月12日
    瀏覽(32)
  • 基于 centos7 搭建 laravel+scout+elasticsearch+ik-analyzer 用于中文分詞全文檢索服務(wù)及測(cè)試

    基于 centos7 搭建 laravel+scout+elasticsearch+ik-analyzer 用于中文分詞全文檢索服務(wù)及測(cè)試

    瀏覽該文章,建議先食用 異常問(wèn)題 這一節(jié) 軟件/框架 版本 jdk 19.0.2 elasticsearch 8.1.1 ik-analyzer 8.1.1 laravel 7.x-dev elasticsearch/elasticsearch 7.17.1 tamayo/laravel-scout-elastic 8.0.3 下載jdk傳送門(mén) 安裝 下載:wget https://download.oracle.com/java/19/latest/jdk-19_linux-x64_bin.rpm 安裝:rpm -ivh jdk-19_linux-x64_bin.

    2023年04月09日
    瀏覽(60)
  • elasticsearch 安裝 IK 中文分詞器插件提示找不到文件的異常(Exception in thread “main“ java.nio.file.NoSuchFileException)

    elasticsearch 安裝 IK 中文分詞器插件提示找不到文件的異常(Exception in thread “main“ java.nio.file.NoSuchFileException)

    錯(cuò)誤截圖 在命令行窗口,執(zhí)行如下命令安裝 IK 中文分詞器 失敗。 錯(cuò)誤日志 1、自己到github下載對(duì)應(yīng)版本的ik中文分詞器 上面命令中兩個(gè)插件版本號(hào)應(yīng)該和 Elasticsearch 的版本保持一致,我現(xiàn)在用的是 7.14.1 版本。 首先版本和命令是對(duì)得上的。 命令行窗口通過(guò)命令下載失敗的話

    2024年04月11日
    瀏覽(28)
  • ElasticSearch-使用IK分詞器進(jìn)行分詞

    ElasticSearch-使用IK分詞器進(jìn)行分詞

    使用KIbana測(cè)試IK分詞器 打開(kāi)開(kāi)發(fā)工具臺(tái) ik_smart 最少分詞器 分詞結(jié)果比較少 ik_max_word 顆粒度最細(xì)分詞器 分詞結(jié)果比較多,組成各種結(jié)果,窮盡詞庫(kù)的可能! 再看個(gè)例子,把我們的句子換成 超級(jí)喜歡魏一鶴學(xué)習(xí)Java 首先看最少分詞 然后是最細(xì)顆粒度分詞 問(wèn)題來(lái)了 我們輸入超級(jí)喜

    2024年02月13日
    瀏覽(19)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包