1、關(guān)于 Elasticsearch 8.X IK 分詞插件相關(guān)問題
球友在 ElasticSearch 版本選型問題中提及:如果要使用ik插件,是不是就使用目前最新的IK對應(yīng)elasticsearch的版本“8.8.2”?
https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2
如果要使用最新es版本,而IK沒有對應(yīng)的,老師有推薦的其他類似插件嗎?謝謝!——問題來源:https://t.zsxq.com/13YX8fFQy
2、 ?說一下 ?Elasticsearch 中文分詞插件
-
IK Analyzer
描述:基于詞典的中文分詞插件。
資源鏈接:https://github.com/medcl/elasticsearch-analysis-ik
目前業(yè)界使用相對廣泛,尤其中小型企業(yè)。
-
HanLP
描述:基于NLP技術(shù),提供了一系列中文處理能力的分詞插件。
資源鏈接:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
-
Jieba
描述:結(jié)巴分詞的Elasticsearch插件版本。
資源鏈接:https://github.com/sing1ee/elasticsearch-jieba-plugin
-
Ansj
描述:速度快,能夠識別新詞的中文分詞插件。
資源鏈接:https://github.com/NLPchina/elasticsearch-analysis-ansj
-
SmartCN
描述:Elasticsearch自帶的基于Lucene的中文分詞插件。
資源鏈接:Elasticsearch官方文檔
-
MMSEG
描述:基于詞典的復(fù)雜切分算法中文分詞插件。5.X版本后未再更新
資源鏈接:https://github.com/medcl/elasticsearch-analysis-mmseg
根據(jù)具體的應(yīng)用場景和需求,可以選擇合適的中文分詞插件。
另外,需要注意的是,當(dāng)使用插件時(shí)要確保其版本與Elasticsearch版本相匹配,以避免可能出現(xiàn)的兼容性問題。
3、IK 分詞插件如何使用最新版本?
開篇提及問題本質(zhì):Elasticsearch 更新版本快, 而 IK 更新較慢的問題。舉例:如下圖所示,當(dāng)前是 2023年10月20日,Elasticsearch 最新版本為:8.10.4,而 IK 插件的版本為:8.9.0。
兩者類型不匹配,安裝的時(shí)候會報(bào)錯(cuò)。
怎么辦?這其實(shí)就是開篇問題所在。
咱們可以分析一下 IK 插件的代碼,插件源碼近1年+幾乎沒有任何更新。
也就是說:是不是只手動改一下配置文件,自己手動下載部署可不可以呢?
其實(shí)是可以的,咱們歸攏一下步驟。
步驟1:下載當(dāng)前最新的 IK 插件。
步驟2:解壓源碼
這里的外層文件名是我手動由 8.9.0 改成 8.10.2 的,我的虛擬機(jī)集群是 8.10.2 版本。
修改配置:
如上內(nèi)容由原來的版本號 8.9.0,改成 8.10.2 就可以了!
完成后新版本打包,如下所示,打包為:elasticsearch-analysis-ik-8.10.2.zip文件。
步驟3:安裝 Elasticsearch IK插件。
如下圖所示,參考IK的文檔,我們采取方式1。
第一步:解壓elasticsearch-analysis-ik-8.10.2.zip到如下的 plugins 下的 ik 文件夾下。
ik 文件需要我們提前手動創(chuàng)建。
解壓后效果:
第二步:重啟 Elasticsearch。
步驟4:驗(yàn)證 IK 插件是否成功。
這個(gè)創(chuàng)建個(gè)索引,指定映射中的某個(gè)字段為 ik_max_word 或者 ?ik_smart 就可以了。
PUT?test_index_001
{
??"mappings":?{
????"properties":?{
??????"title":?{
????????"type":?"text",
????????"analyzer":?"ik_max_word"
??????}
????}
??}
}
4、小結(jié)
改動非常小,只為版本適配問題。更多類似問題,歡迎留言交流。
-
推薦閱讀
-
全網(wǎng)首發(fā)!從 0 到 1 Elasticsearch 8.X 通關(guān)視頻
-
重磅 | 死磕 Elasticsearch 8.X 方法論認(rèn)知清單
-
如何系統(tǒng)的學(xué)習(xí) Elasticsearch ?
-
那些 ChatGPT4 也搞不定的 Elasticsearch 問題,請拋給我們!
更短時(shí)間更快習(xí)得更多干貨!
中國50%+Elastic認(rèn)證專家出自于此!
文章來源:http://www.zghlxwxcb.cn/news/detail-734303.html
比同事?lián)屜纫徊綄W(xué)習(xí)進(jìn)階干貨!文章來源地址http://www.zghlxwxcb.cn/news/detail-734303.html
到了這里,關(guān)于Elasticsearch?8.X?分詞插件版本更新不及時(shí)解決方案的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!