国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Elasticsearch 全文搜索引擎 ---- IK分詞器

這篇具有很好參考價(jià)值的文章主要介紹了Elasticsearch 全文搜索引擎 ---- IK分詞器。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

????????原理:分詞的原理:二叉樹? ? ? ??

????????首先講一下為什么要出這個(gè)文章,前面我們講過(guò)分詞方法:中文分詞搜索 pscws(感興趣的同學(xué)可以去爬樓看一下),那為什么要講IK分詞?最主要的原因是:pscws分詞顆粒度不如IK分詞的顆粒度高,現(xiàn)在的需求要求顆粒度細(xì)一點(diǎn),以便提高搜索進(jìn)度,所以我們今天講一下IK分詞

? ? ? ? 第一步:安轉(zhuǎn)Elasticsearch,這個(gè)在博主原來(lái)的文章里面有,所以不在講述,安裝完成后運(yùn)行結(jié)果:

訪問(wèn)地址:http://localhost:9200

Elasticsearch 全文搜索引擎 ---- IK分詞器,搜索引擎,elasticsearch,大數(shù)據(jù),中文分詞,全文檢索,php

????????第二步:安轉(zhuǎn)IK擴(kuò)展(現(xiàn)在下載擴(kuò)展包):需要選擇和自己的Elasticsearch對(duì)應(yīng)的版本,我的Elasticsearch版本是7.3.2,下載后存放在:/plugins 目錄下:

? ? ? ? 下載地址:https://gitcode.net/mirrors/medcl/elasticsearch-analysis-ik/-/tree/v7.3.2

? ? ? ? 直接運(yùn)行會(huì)發(fā)現(xiàn)閃退情況:為什么會(huì)出現(xiàn)這樣的情況,主要有兩個(gè)原因:

? ? ? ? 1.版本不配

? ? ? ? 2.未修改配置 ,配置如何修改?

? ? ? ? 需要安裝 maven 包管理工具,這個(gè)是JAVA開發(fā)的,所以需要安裝JAVA的環(huán)境IK 分詞器需要 Java 8 或者以上的版本)??

????????一、下載&安裝

????????1. 下載地址

????????maven下載地址如下,各位請(qǐng)選擇對(duì)應(yīng)系統(tǒng)的maven版本進(jìn)行下載。

????????https://maven.apache.org/download.cgi

????????2. 解壓maven安裝包

????????maven安裝包下載之后,對(duì)其進(jìn)行解壓。

Elasticsearch 全文搜索引擎 ---- IK分詞器,搜索引擎,elasticsearch,大數(shù)據(jù),中文分詞,全文檢索,php


????????二、配置環(huán)境變量:
?? ??? ?系統(tǒng)變量新增:變量名:MAVEN_HOME ? 值:maven存放目錄
?? ??? ?系統(tǒng)變量追加:變量名:path ? ? ? ? 值:%MAVEN_HOME%\bin

?? ??? ?測(cè)試maven是否配置完畢:輸入mvn -v命令,如果出現(xiàn)maven版本號(hào),就表明安裝成功。
?? ??? ?如果報(bào)錯(cuò):
?? ??? ?配合:The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME should point to a JDK not a JRE
?? ??? ?沒(méi)有安裝Java的運(yùn)行環(huán)境或者JAVA_HOME的環(huán)境變量沒(méi)有配置,安裝好JAVA的運(yùn)行環(huán)境后記得配置JAVA_HOME環(huán)境變量,安裝好后,再運(yùn)行mvn -v命令????????Elasticsearch 全文搜索引擎 ---- IK分詞器,搜索引擎,elasticsearch,大數(shù)據(jù),中文分詞,全文檢索,php

查看命令:elasticSearch-plugin list:安裝成功

Elasticsearch 全文搜索引擎 ---- IK分詞器,搜索引擎,elasticsearch,大數(shù)據(jù),中文分詞,全文檢索,php

第三步:使用分詞(PHP版本):

//引入自動(dòng)加載文件
require_once APPPATH.'../vendor/es/autoload.php';
//使用命名空間引用
use Elasticsearch\ClientBuilder;
class Test extends CI_Controller
{
? ? //初始化
? ? public function __construct()
? ? {
? ? ? ? parent::__construct();
? ? ? ? //拼接參數(shù)
? ? ? ? $params = [
? ? ? ? ? ? [
? ? ? ? ? ? ? ? 'host' ? => '地址',
? ? ? ? ? ? ? ? 'port' ? => '端口號(hào)',
? ? ? ? ? ? ? ? 'scheme' => 'http',
? ? ? ? ? ? ? ? 'user' ? => '用戶名',
? ? ? ? ? ? ? ? 'pass' ? => '密碼'
? ? ? ? ? ? ]
? ? ? ? ];
?? ??? ??? ??? ?//初始化對(duì)象
? ? ? ? $this->client = ClientBuilder::create()->setHosts($params)->setConnectionPool('連接池地址(相對(duì)地址)', [])?->setRetries(10)->build();
? ? }
?? ??? ?
?? ??? ?//分詞器
? ? public function ik(){
? ? ? ? ?$params = [
? ? ? ? ? ? 'body' => [
? ? ? ? ? ? ? ? 'text' => '中國(guó)上海市直轄市靜安區(qū)',
? ? ? ? ? ? ? ? //ik_max_word 精細(xì) ?ik_smart 粗略
? ? ? ? ? ? ? ? 'analyzer'=>'ik_max_word'
? ? ? ? ? ? ]
? ? ? ? ];
?? ??? ??? ??? ?//請(qǐng)求分詞
? ? ? ? $res = ?$this->client->indices()->analyze($params);
? ? ? ? var_dump($res);die;
? ? }
}

IK精細(xì)分詞輸出結(jié)果:

??array(11) {
????[0]=>array(5) {
?? ??? ?["token"]=>string(6) "中國(guó)"["start_offset"]=>int(0)["end_offset"]=>int(2)?
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(0)
?? ??? ?}
????[1]=>array(5) {
?? ??? ?["token"]=>string(9) "上海市"["start_offset"]=>int(2)["end_offset"]=>int(5)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(1)
?? ??? ?}
????[2]=>array(5) {
?? ??? ?["token"]=>string(6) "上海"["start_offset"]=>int(2)["end_offset"]=>int(4)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(2)
?? ??? ?}
????[3]=>array(5) {
?? ??? ?["token"]=>string(6) "海市" ["start_offset"]=>int(3)["end_offset"]=>int(5)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(3)
?? ??? ?}
????[4]=>array(5) {
?? ??? ?["token"]=>string(6) "市直" ["start_offset"]=>int(4)["end_offset"]=>int(6)
?? ??? ?["type"]=> string(7) "CN_WORD"["position"]=>int(4)
?? ??? ?}?? ?
????[5]=>array(5) {
?? ??? ?["token"]=>string(9) "直轄市"["start_offset"]=>int(5)["end_offset"]=>int(8)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(5)
?? ??? ?}
????[6]=>array(5) {
?? ??? ?["token"]=> string(6) "直轄"["start_offset"]=> int(5)["end_offset"]=>int(7)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(6)
?? ??? ?}
????[7]=>array(5) {
?? ??? ?["token"]=>string(3) "市"["start_offset"]=>int(7)["end_offset"]=>int(8)
?? ??? ?["type"]=>string(7) "CN_CHAR"["position"]=>int(7)?
?? ??? ?}
????[8]=> array(5) {
?? ??? ?["token"]=>string(9) "靜安區(qū)" ["start_offset"]=>int(8)["end_offset"]=> int(11)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(8)
?? ??? ?}
????[9]=>array(5) {?
?? ??? ?["token"]=>string(6) "靜安" ["start_offset"]=>int(8)["end_offset"]=>int(10)
?? ??? ?["type"]=>string(7) "CN_WORD" ["position"]=>int(9)?
?? ??? ?}
????[10]=>array(5) {
?? ??? ?["token"]=>string(3) "區(qū)"["start_offset"]=>int(10)["end_offset"]=>int(11)
?? ??? ?["type"]=>string(7) "CN_CHAR"["position"]=>int(10)?
?? ??? ?}
??}
}

IK粗略分詞:

array(1) {
??["tokens"]=>
??array(11) {
????[0]=>array(5) {
?? ??? ?["token"]=>string(6) "中國(guó)"["start_offset"]=>int(0)["end_offset"]=>int(2)?
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(0)
?? ??? ?}
????[1]=>array(5) {
?? ??? ?["token"]=>string(9) "上海市"["start_offset"]=>int(2)["end_offset"]=>int(5)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(1)
?? ??? ?}
????[2]=>array(5) {
?? ??? ?["token"]=>string(9) "直轄市"["start_offset"]=>int(5)["end_offset"]=>int(8)
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(5)
?? ??? ?}
????[3]=> array(5) {
?? ??? ?["token"]=>string(9) "靜安區(qū)" ["start_offset"]=>int(8)["end_offset"]=> int(11)?
?? ??? ?["type"]=>string(7) "CN_WORD"["position"]=>int(8)
?? ??? ?}
??}
}

中文分詞搜索 pscws

array(4) {?
["中國(guó)"]=> array(4) {?
?? ?["word"]=> string(6) "中國(guó)"?
?? ?["times"]=> int(1) ["weight"]=> float(6.2600002288818) ["attr"]=> string(3) "ns"?
}?

["上海市"]=> array(4) {?
?? ?["word"]=> string(9) "上海市"?
?? ?["times"]=> int(1) ["weight"]=> float(7.8200001716614) ["attr"]=> string(3) "ns"?
}?

["直轄市"]=> array(4) {?
?? ?["word"]=> string(9) "直轄市"?
?? ?["times"]=> int(1) ["weight"]=> float(6.8499999046326) ["attr"]=> string(3) "n"?
}?

["靜安區(qū)"]=> array(4) {?
?? ?["word"]=> string(9) "靜安區(qū)"
?? ?["times"]=> int(1) ["weight"]=> float(12.140000343323) ["attr"]=> string(3) "ns"?
?}
}

????????至此IK分詞器講解完成,可以對(duì)比一下IK與pscws的區(qū)別,后續(xù)操作可以根據(jù)自己的業(yè)務(wù)來(lái)確定文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-695579.html

到了這里,關(guān)于Elasticsearch 全文搜索引擎 ---- IK分詞器的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 全文搜索引擎 Elasticsearch 入門使用

    目錄 1、安裝 2、基本概念 2.1 Node 與 Cluster 2.2 Index 2.3 Document? 2.4 Type 3、新建和刪除 Index 4、中文分詞設(shè)置? 5、數(shù)據(jù)操作? 5.1 新增記錄? 5.2 查看記錄? ?5.3 刪除記錄 5.4 更新記錄? 6、數(shù)據(jù)查詢 6.1 返回所有記錄 6.2 全文搜索 ?6.3 邏輯運(yùn)算 7、參考鏈接 本文從零開始,講解如何

    2024年02月09日
    瀏覽(20)
  • 開源的全文搜索引擎Elasticsearch

    Elasticsearch是一個(gè)開源的全文搜索引擎,可以實(shí)現(xiàn)快速、實(shí)時(shí)的數(shù)據(jù)搜索和分析。它是基于Apache Lucene的搜索引擎庫(kù)開發(fā)而來(lái),提供了一個(gè)分布式、多租戶的全文搜索引擎平臺(tái),能夠支持海量數(shù)據(jù)的實(shí)時(shí)檢索、聚合分析和可視化展示。 Elasticsearch 的主要特點(diǎn)包括: 分布式架構(gòu):

    2024年02月08日
    瀏覽(17)
  • Elasticsearch 分布式全文搜索引擎原理解析

    作者:禪與計(jì)算機(jī)程序設(shè)計(jì)藝術(shù) Elasticsearch是一個(gè)開源的分布式全文搜索引擎,它可以近實(shí)時(shí)地存儲(chǔ)、檢索數(shù)據(jù)。本系列文章將從以下幾個(gè)方面對(duì)Elasticsearch進(jìn)行深入分析: Elasticsearch的主要組成部分 索引、類型和映射(Mapping) 搜索請(qǐng)求處理流程 查詢緩存機(jī)制 Elasticsearch集群

    2024年02月05日
    瀏覽(31)
  • SpringBoot封裝Elasticsearch搜索引擎實(shí)現(xiàn)全文檢索

    注:本文實(shí)現(xiàn)了Java對(duì)Elasticseach的分頁(yè)檢索/不分頁(yè)檢索的封裝 ES就不用過(guò)多介紹了,直接上代碼: 創(chuàng)建Store類(與ES字段對(duì)應(yīng),用于接收ES數(shù)據(jù)) Elasticsearch全文檢索接口:不分頁(yè)檢索 Elasticsearch全文檢索接口:分頁(yè)檢索 本文實(shí)現(xiàn)了Java對(duì)Elasticsearch搜索引擎全文檢索的封裝 傳入

    2024年02月04日
    瀏覽(38)
  • Elasticsearch (ES) 搜索引擎: 搜索功能:搜索分頁(yè)、搜索匹配、全文搜索、搜索建議、字段排序

    原文鏈接:https://xiets.blog.csdn.net/article/details/132348920 版權(quán)聲明:原創(chuàng)文章禁止轉(zhuǎn)載 專欄目錄:Elasticsearch 專欄(總目錄) ES 搜索 API 官網(wǎng)文檔:Search APIs 先創(chuàng)建一個(gè)索引,并寫入一些文檔用于搜索示例: 寫入一些文檔示例: 官網(wǎng)API:The _source option 搜索結(jié)果中的文檔數(shù)據(jù)封裝

    2024年02月08日
    瀏覽(33)
  • [golang gin框架] 37.ElasticSearch 全文搜索引擎的使用

    [golang gin框架] 37.ElasticSearch 全文搜索引擎的使用

    ElasticSearch 是一個(gè)基于 Lucene 的 搜索服務(wù)器 ,它提供了一個(gè) 分布式多用戶 能力的 全文搜索引擎 ,基于 RESTful web 接口,Elasticsearch 是用 Java 開發(fā)的,并作為 Apache 許可條款下的開放源碼發(fā)布,是當(dāng)前流行的企業(yè)級(jí)搜索引擎,設(shè)計(jì)用于云計(jì)算中,能夠達(dá)到 實(shí)時(shí)搜索 , 穩(wěn)定 , 可靠

    2024年02月11日
    瀏覽(21)
  • 551、Elasticsearch詳細(xì)入門教程系列 -【分布式全文搜索引擎 Elasticsearch(二)】 2023.04.04

    551、Elasticsearch詳細(xì)入門教程系列 -【分布式全文搜索引擎 Elasticsearch(二)】 2023.04.04

    1.1 Elasticsearch中的數(shù)據(jù)格式 Elasticsearch 是面向文檔型數(shù)據(jù)庫(kù),一條數(shù)據(jù)在這里就是一個(gè)文檔。為了方便大家理解,我們將 Elasticsearch 里存儲(chǔ)文檔數(shù)據(jù)和關(guān)系型數(shù)據(jù)庫(kù) MySQL 存儲(chǔ)數(shù)據(jù)的概念進(jìn)行一個(gè)類比。 ES 里的 Index 可以看做一個(gè)庫(kù),而 Types 相當(dāng)于表,Documents 則相當(dāng)于表的行。

    2023年04月11日
    瀏覽(24)
  • 552、Elasticsearch詳細(xì)入門教程系列 -【分布式全文搜索引擎 Elasticsearch(三)】 2023.05.19

    1.1 簡(jiǎn)單介紹 之前是對(duì)ES中的創(chuàng)建/查看/刪除索引、創(chuàng)建定義映射、創(chuàng)建/查看/修改/刪除文檔的這些操作有了一定的了解認(rèn)識(shí),但是是通過(guò)Postman + JSON串的方法來(lái)實(shí)現(xiàn)的 那么之后仍然是對(duì)ES中的索引、映射、文檔進(jìn)行操作,只是方法換成了Java API。 1.2 案例詳情 首先需要?jiǎng)?chuàng)建一個(gè)

    2024年02月08日
    瀏覽(31)
  • Elasticsearch (ES) 搜索引擎: 文本搜索:分析器/分詞器、同義詞/停用詞、拼音搜索、高亮顯示、拼寫糾錯(cuò)

    原文鏈接:https://xiets.blog.csdn.net/article/details/132349032 版權(quán)聲明:原創(chuàng)文章禁止轉(zhuǎn)載 專欄目錄:Elasticsearch 專欄(總目錄) 文本搜索主要指的就是全文搜索,全文搜索是搜索引擎的核心功能,與精確匹配的結(jié)構(gòu)化數(shù)據(jù)不同,文本(text)數(shù)據(jù)在構(gòu)建索引和搜索時(shí)都需要進(jìn)行額外的處

    2024年02月03日
    瀏覽(44)
  • docker安裝elasticsearch與head教程完整版—.NET Core Web Api與elasticsearch打造全站全文搜索引擎

    docker安裝elasticsearch與head教程完整版—.NET Core Web Api與elasticsearch打造全站全文搜索引擎

    默認(rèn)已經(jīng)有docker環(huán)境 下載與安裝 elasticsearch ,從hub.docker里面可以看到最新版本的鏡像,選擇你想要的版本 本教程是以 7.17.7 為案例,為啥不適用最新的,首先個(gè)人一般需用最新的版本,如果有亢很難填,其次我自己的服務(wù)器下載的太慢(還是配置了docker加速地址的)拉取幾

    2024年02月10日
    瀏覽(20)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包