国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

全文檢索學(xué)習(xí)之ElasticSearch學(xué)習(xí)筆記

這篇具有很好參考價(jià)值的文章主要介紹了全文檢索學(xué)習(xí)之ElasticSearch學(xué)習(xí)筆記。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

在非關(guān)系型數(shù)據(jù)庫(kù)中,數(shù)據(jù)是非結(jié)構(gòu)化的,如果直接去查找效率極低,全文檢索將非結(jié)構(gòu)化數(shù)據(jù)中的一部分信息提取出來(lái),重新組織,使其變得有一定結(jié)構(gòu),然后對(duì)此有一定結(jié)構(gòu)的數(shù)據(jù)進(jìn)行搜索,從而達(dá)到搜索相對(duì)較快的目的。索引就是從非結(jié)構(gòu)化數(shù)據(jù)中提取出的然后重新組織的信息。建立索引,再對(duì)索引進(jìn)行搜索的過(guò)程就叫全文檢索(Full-text Search)。在了解了全文檢索的過(guò)程后,下面介紹最近學(xué)習(xí)的ElasticSearch全文檢索引擎。

1、ElasticSearch簡(jiǎn)介

Elaticsearch,簡(jiǎn)稱為es, es是一個(gè)開(kāi)源的高擴(kuò)展的分布式全文檢索引擎,可以在java開(kāi)發(fā)中使用,其核心還是Lucene,但是es在開(kāi)發(fā)中使用
可以通過(guò)簡(jiǎn)單的RESTful API來(lái)隱藏Lucene的復(fù)雜性,從而讓全文搜索變得簡(jiǎn)單。另外es檢索和存儲(chǔ)速度極快,即搜即得到結(jié)構(gòu),修改便可近乎實(shí)時(shí)的保存。
Elaticsearch目前有被很多大型網(wǎng)站使用,如GitHub使用ElasticSearch
搜索20TB的數(shù)據(jù),包括13億文件和1300億行代碼,百度目前廣泛使用ElasticSearch作為文本數(shù)據(jù)分析,采集百度所有服務(wù)器上的各類指標(biāo)數(shù)
據(jù)及用戶自定義數(shù)據(jù),通過(guò)對(duì)各種數(shù)據(jù)進(jìn)行多維分析展示,輔助定位分析實(shí)例異?;驑I(yè)務(wù)層面異常。新浪、阿里等許多大廠也在采用Elaticsearch全文搜索引擎

2、ElasticSearch術(shù)語(yǔ)

ElasticSearch術(shù)語(yǔ)包含index索引、Types類型、Documents、Fields,其中index可以理解為是關(guān)系型數(shù)據(jù)庫(kù)里面的database,types可以對(duì)應(yīng)為關(guān)系型數(shù)據(jù)庫(kù)里面的表tables,documents可以以對(duì)應(yīng)為關(guān)系型數(shù)據(jù)庫(kù)里面的記錄,fields以以對(duì)應(yīng)為關(guān)系型數(shù)據(jù)庫(kù)里面的字段。

2.1、index索引

一個(gè)index索引就是一個(gè)擁有幾分相似特征的文檔的集合。一個(gè)索引由一個(gè)全是小寫字母組成的名字來(lái)標(biāo)識(shí),使用到這個(gè)名字對(duì)對(duì)應(yīng)于這個(gè)索引中的文檔進(jìn)行索引、搜索、更新和刪除。在一個(gè)集群中,可以定義任意多的索引。

2.2、type類型

在一個(gè)索引中,可以定義一種或多種類型。一個(gè)類型是索引的一個(gè)邏輯上的分類/分區(qū),其語(yǔ)義完全支持自定義。通常,會(huì)為具有一組共同字段的文檔定義一個(gè)類型。

2.3、document文檔

文檔是可被索引的基礎(chǔ)信息單元。文檔采用JSON格式。在index/type里面,可以存儲(chǔ)任意多的文檔。文檔在物理上存在于索引之中,但文檔必須被索引/賦予一個(gè)索引的type。

2.4、field字段

相當(dāng)于是數(shù)據(jù)表的字段,對(duì)文檔數(shù)據(jù)根據(jù)不同屬性進(jìn)行的分類標(biāo)識(shí)。

2.5、 mapping映射

mapping對(duì)處理數(shù)據(jù)的方式和規(guī)則做限制,某個(gè)字段的數(shù)據(jù)類型、默認(rèn)值、分析器、是否被索引等等都可以被映射設(shè)置,另外處理es里面數(shù)據(jù)的一些使用規(guī)則設(shè)置也叫做映射,如按著最優(yōu)規(guī)則處理數(shù)據(jù)以至于性能提高。

2.6、 cluster集群和node節(jié)點(diǎn)

集群就是由一個(gè)或多個(gè)節(jié)點(diǎn)組織在一起,所有節(jié)點(diǎn)的數(shù)據(jù)共同組成了所有數(shù)據(jù),并一起提供索引和搜索功能。每個(gè)集群都有唯一標(biāo)識(shí)的名字,默認(rèn)就是“elasticsearch”。節(jié)點(diǎn)想組成或加入集群需要共同加入同一個(gè)名字的集群。
節(jié)點(diǎn)是集群中的一個(gè)服務(wù)器,是集群的一部分,可以存儲(chǔ)數(shù)據(jù)并且參與集群的索引和搜索。每個(gè)節(jié)點(diǎn)也都有唯一標(biāo)識(shí)的名字。

3、ElasticSearch使用

使用DSL語(yǔ)言來(lái)定義查,使用全文檢索

(1)查詢所有索引
GET /_cat/indices?v
(2)刪除某個(gè)索引

DELETE /索引名

在這里插入代碼片
(3)新增索引
PUT /索引名
(4)創(chuàng)建映射
PUT /索引名/type名/_mapping {
	"properties": {
		"name":{
			"type": "text",
			"analyzer": "所用的分詞器",
			"search_analyzer": "所用的分詞器"
		}
	}
}
(5)新增文檔數(shù)據(jù)/修改數(shù)據(jù)
PUT /索引名/type名/id號(hào) {
	 "name":"趙二", 
	 "age":22, 
	 "city":"上海", 
	 "description":"xxxxx" 
	 }
(6)更新數(shù)據(jù)
POST /索引名/type名/id號(hào)/_update {
	 "doc":{
	 	 "name":"xxx", 
	 	 "description":"xxxxxx" 
	 } 
}
(7)刪除Document
DELETE /索引名/type名/id號(hào)
(8)查詢所有數(shù)據(jù)
GET /索引名/_search

上面是一些常用的DSL語(yǔ)句,可以在 Kibana或者elasticsearch-head中使用進(jìn)行全文檢索文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-410762.html

到了這里,關(guān)于全文檢索學(xué)習(xí)之ElasticSearch學(xué)習(xí)筆記的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • elasticsearch全文檢索

    傳送門 best_fields 傳送門 most_fields 當(dāng)查詢多字段包含相同文本以不同方式分詞的時(shí)候此參數(shù)最有用, 傳送門 cross_fields phrase和phrase_prefix 傳送門 傳送門

    2024年02月07日
    瀏覽(33)
  • ElasticSearch 實(shí)戰(zhàn):ElasticSearch文檔全文檢索

    Elasticsearch 實(shí)戰(zhàn):Elasticsearch 文檔全文檢索 全文檢索是 Elasticsearch 的核心功能之一,它允許用戶對(duì)文本內(nèi)容進(jìn)行高效的模糊搜索、詞組匹配、同義詞處理、停用詞過(guò)濾等操作。以下是如何進(jìn)行文檔全文檢索的詳細(xì)步驟: **1. **全文匹配查詢(Match Query) 最基礎(chǔ)的全文檢索查詢是

    2024年04月11日
    瀏覽(29)
  • ES(Elasticsearch 全文檢索)

    ES(Elasticsearch 全文檢索)

    數(shù)據(jù)量大的時(shí)候 索引失效 =查詢性能低 功能比較弱 對(duì)文檔的內(nèi)容進(jìn)行分詞,對(duì)詞條創(chuàng)建索引,記錄詞條所在的文檔信息根據(jù)詞條查詢到文檔的id 從而查到文檔 文檔:每一條數(shù)據(jù)就是一條文檔 詞條:文檔按照語(yǔ)義分成的詞語(yǔ) 正向索引 根據(jù)文檔的id創(chuàng)建索引 查詢?cè)~條必須先找

    2024年02月05日
    瀏覽(52)
  • 全文檢索-Elasticsearch-整合SpringBoot

    全文檢索-Elasticsearch-整合SpringBoot

    前面記錄了 Elasticsearch 全文檢索的入門篇和進(jìn)階檢索。這次我們來(lái)講下 Spring Boot 中如何整合 ES,以及如何在 Spring Cloud 微服務(wù)項(xiàng)目中使用 ES 來(lái)實(shí)現(xiàn)全文檢索,來(lái)達(dá)到商品檢索的功能。 檢索服務(wù)單獨(dú)作為一個(gè)服務(wù),就稱作 gulimall-search 模塊。 點(diǎn)擊 Next 勾選 Spring Web 依賴,點(diǎn)擊

    2024年02月08日
    瀏覽(18)
  • ElasticSearch全文檢索原理及過(guò)程

    ElasticSearch全文檢索原理及過(guò)程

    ????????ElasticSearch的搜索引擎中,每個(gè) 文檔都有一個(gè)對(duì)應(yīng)的文檔 ID ,文檔內(nèi)容被表示為一系列的集合。例如文檔 1 經(jīng)過(guò)分詞,提取了 20 個(gè), 每個(gè)都會(huì)記錄它在文檔中出現(xiàn)的次數(shù)和出現(xiàn)位置 。那么,倒排索引就是 到文檔 ? ID 的映射 ,每個(gè)關(guān)鍵

    2023年04月17日
    瀏覽(25)
  • 7-Elasticsearch組合查詢和全文檢索

    Elasticsearch組合查詢 組合查詢–布爾查詢 組合查詢中的常用的查詢方式:布爾查詢。 它將多個(gè)查詢條件組合在一起,并且將查詢的結(jié)果和結(jié)果的評(píng)分組合在一起。 布爾查詢是把多個(gè)子查詢組合成一個(gè)布爾表達(dá)式,所有子查詢之間邏輯關(guān)系是and,只有當(dāng)一個(gè)文檔滿足布爾查詢

    2024年02月04日
    瀏覽(24)
  • ElasticSearch:全文檢索及倒排索引原理

    ElasticSearch:全文檢索及倒排索引原理

    首先介紹一下結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù): 結(jié)構(gòu)化數(shù)據(jù)將數(shù)據(jù)具有的特征事先以結(jié)構(gòu)化的形式定義好,數(shù)據(jù)有固定的格式或有限的長(zhǎng)度。典型的結(jié)構(gòu)化數(shù)據(jù)就是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的表結(jié)構(gòu),數(shù)據(jù)特征直接體現(xiàn)在表結(jié)構(gòu)的字段上,所以根據(jù)某一特征做數(shù)據(jù)檢索很直接,速度也比較快

    2024年02月14日
    瀏覽(22)
  • 九.全文檢索ElasticSearch經(jīng)典入門-ElasticSearch映射修改

    九.全文檢索ElasticSearch經(jīng)典入門-ElasticSearch映射修改

    這篇文章的內(nèi)容是ElasticSearch映射修改,寫這篇文章是有水友公司里面遇到了映射修改問(wèn)題,我這里做了一個(gè)整理,希望對(duì)你有所幫助。 在ElasticSearch中一旦創(chuàng)建了映射想要進(jìn)行修改是不被允許的。比如我這里有一個(gè)案例 上面創(chuàng)建了索引employee ,同時(shí)為其創(chuàng)建映射,指定了id和

    2024年02月05日
    瀏覽(31)
  • 全文檢索工具elasticsearch:第一章:理論知識(shí)

    全文檢索工具elasticsearch:第一章:理論知識(shí)

    cluster 整個(gè)elasticsearch 默認(rèn)就是集群狀態(tài),整個(gè)集群是一份完整、互備的數(shù)據(jù)。 node 集群中的一個(gè)節(jié)點(diǎn),一般只一個(gè)進(jìn)程就是一個(gè)node shard 分片,即使是一個(gè)節(jié)點(diǎn)中的數(shù)據(jù)也會(huì)通過(guò)hash算法,分成多個(gè)片存放,默認(rèn)是5片。 index 相當(dāng)于rdbms的database, 對(duì)于用戶來(lái)說(shuō)是一個(gè)邏輯數(shù)據(jù)庫(kù)

    2024年04月16日
    瀏覽(28)
  • Mysql 實(shí)現(xiàn)類似于 ElasticSearch 的全文檢索功能

    ? 一、前言 今天一個(gè)同事問(wèn)我,如何使用 Mysql 實(shí)現(xiàn)類似于 ElasticSearch 的全文檢索功能,并且對(duì)檢索跑分?我當(dāng)時(shí)腦子里立馬產(chǎn)生了疑問(wèn)?為啥不直接用es呢?簡(jiǎn)單好用還賊快。但是聽(tīng)他說(shuō),數(shù)據(jù)量不多,客戶給的時(shí)間非常有限,根本沒(méi)時(shí)間去搭建es,所以還是看一下

    2024年02月03日
    瀏覽(16)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包