国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【搜索引擎2】實現(xiàn)API方式調(diào)用ElasticSearch8接口

這篇具有很好參考價值的文章主要介紹了【搜索引擎2】實現(xiàn)API方式調(diào)用ElasticSearch8接口。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

1、理解ElasticSearch各名詞含義

ElasticSearch對比Mysql

Mysql數(shù)據(jù)庫 Elastic Search
Database 7.X版本前有Type,對比數(shù)據(jù)庫中的表,新版取消了
Table Index
Row Document
Column mapping

Elasticsearch是使用Java開發(fā)的,8.1版本的ES需要JDK17及以上版本;es默認(rèn)帶有JDK,如果安裝es環(huán)境為java8,則會默認(rèn)使用自帶環(huán)境;

索引、文檔、映射

??? 索引index
??????? 跟我們常說的數(shù)據(jù)庫索引沒有任何關(guān)系,它其實相當(dāng)于數(shù)據(jù)庫里面存數(shù)據(jù)的表;

文檔document
??????? 對應(yīng)我們數(shù)據(jù)庫的數(shù)據(jù),即每行數(shù)據(jù);

映射mappding
??????? 對應(yīng)我們數(shù)據(jù)庫的字段,自己設(shè)置的話需要設(shè)置字段類型,不設(shè)置在插入文檔內(nèi)容的時候es會按照字段內(nèi)容設(shè)置字段類型;

分片、副本

??? 分片shards
??????? 數(shù)據(jù)量特大,沒有足夠大的硬盤空間來一次性存儲,且一次性搜索那么多的數(shù)據(jù),響應(yīng)跟不上,ES提供把數(shù)據(jù)進行分片存儲,這樣方便進行拓展和提高吞吐;
??? 副本replicas
??????? 分片的拷貝,當(dāng)主分片不可用的時候,副本就充當(dāng)主分片進行使用
??????? 索引分片的備份,shard和replica一般存儲在不同的節(jié)點上,用來提高高可靠性

ES默認(rèn)為一個索引創(chuàng)建1個主分片和1個副本,在創(chuàng)建索引的時候使用settings屬性指定,每個分片必須有零到多個副本

注意:索引一旦創(chuàng)建成功,主分片primary shard數(shù)量不可以變(只能重建索引),副本數(shù)量可以改變

?正排索引、倒排索引

  • 正排索引 (Forward Index )

    • 指將文檔的內(nèi)容按照文檔的順序進行索引,每個文檔對應(yīng)一個索引條目,包含了文檔的各個字段的內(nèi)容
    • 正排索引的優(yōu)勢在于可以快速的查找某個文檔里包含哪些詞項。但是 正排不適用于查找包含某個詞項的文檔有哪些

倒排索引(Inverted Index)

  • 根據(jù)關(guān)鍵詞構(gòu)建的索引結(jié)構(gòu),記錄了每個關(guān)鍵詞出現(xiàn)在哪些文檔或數(shù)據(jù)記錄中,適用于全文搜索和關(guān)鍵詞檢索的場景

  • 它將文檔或數(shù)據(jù)記錄劃分成關(guān)鍵詞的集合,并記錄每個關(guān)鍵詞所出現(xiàn)的位置和相關(guān)聯(lián)的文檔或數(shù)據(jù)記錄的信息

2、默認(rèn)分詞及IK分詞區(qū)別演示

使用es自帶分詞器對內(nèi)容進行分詞

elasticsearch 8 terms api,搜索引擎,elasticsearch,大數(shù)據(jù)

使用ik-smart進行分詞

elasticsearch 8 terms api,搜索引擎,elasticsearch,大數(shù)據(jù)

使用ik_max_word進行分詞

elasticsearch 8 terms api,搜索引擎,elasticsearch,大數(shù)據(jù)

分詞模式 特點
es默認(rèn)standard 對中文按照一個一個字進行分詞
ik智能分詞ik_samrt 按照中文詞組進行分詞,不會重復(fù)對單個文字進行分詞
ik最小顆粒分詞ik_max_word 除了對詞組進行分詞外,還會對單個文字,及多詞組進行分詞

理解完分詞模式后,我們在插入文檔的時候是可以測試文檔默認(rèn)使用了哪種分詞;在我的測試結(jié)果中,集成IK的ES默認(rèn)使用的是ik_max_word;

3、索引及映射操作

索引常用接口:

接口名稱 請求方式 接口地址 請請求參數(shù) 請求結(jié)果
查看所有索引 GET /* 索引列表,沒有數(shù)據(jù)返回{}
創(chuàng)建索引 PUT /index_name

{

? ? "settings": {

? ? ? ? "number_of_shards": 3,

? ? ? ? "number_of_replicas": 0

? ? },

? ? "mappings": {

? ? ? ? "properties": {

? ? ? ? ? ? "id": {

? ? ? ? ? ? ? ? "type": "keyword"

? ? ? ? ? ? },

? ? ? ? ? ? "createTime": {

? ? ? ? ? ? ? ? "type": "date"

? ? ? ? ? ? },

? ? ? ? ? ? "name": {

? ? ? ? ? ? ? ? "type": "text"

? ? ? ? ? ? }

? ? ? ? }

? ? }

}

請求成功返回

{

? ? "acknowledged": true,

? ? "shards_acknowledged": true,

? ? "index": "file"

}

是否存在 HEAD /index_name

200索引存在

404索引不存在

獲取索引 GET /index_name 索引信息
更新索引設(shè)置 PUT /index_name {
? "settings": {
??? "number_of_replicas": 2
? }
}
刪除索引 DELETE /index_name

{

? ? "acknowledged": true

}

mapping無法后面進行單獨設(shè)置,或者插入文檔的時候es自動識別進行填入默認(rèn)類型;

4、文檔操作(“/_doc”代替之前版本type,固定寫法)
接口名稱 請求方式 接口地址 請請求參數(shù) 請求結(jié)果
查詢文檔 GET /index_name/_doc/1
新增文檔指定ID PUT /index_name/_doc/1 {
? "id":5555,
? "name":"小滴課堂短鏈平臺",
? "createDate":"20240311"
}
新增文檔不指定ID POST /index_name/_doc {
? "id":5555,
? "name":"小滴課堂短鏈平臺",
? "createDate":"20240311"
}
修改文檔 PUT/POST /index_name/_doc/1 {
? "id":5555,
? "name":"小滴課堂",
? "createDate":"20240312"
}
刪除文檔 DELETE /index_name/_doc/1

文檔存儲文件的類型為JSON;文檔ID與我們參數(shù)的id不是同一個參數(shù),文檔ID類似于mysql設(shè)置了一個自增ID,我們在插入數(shù)據(jù)的時候可傳值,也可不傳值;

5、內(nèi)容搜索

搜索接口:GET /index_name/_search

請求參數(shù):name為我們自己的字段,這里可以根據(jù)自己字段進行調(diào)整

{
    "query": {
        "match": {
            "name": "聽取"
        }
    }
}

返回字段解釋:

字段解釋
  took字段表示該操作的耗時(單位為毫秒)。
  timed_out字段表示是否超時。
  hits字段表示搜到的記錄,數(shù)組形式。
  total:返回記錄數(shù),本例是1條。
  max_score:最高的匹配程度,本例是1.0

關(guān)于es類型較多,后續(xù)單獨出一篇文章進行記錄

6、參考文章

ElasticSearch8.X入門教程:ElasticSearch8.X入門教程_elasticsearch 8.x 學(xué)習(xí)-CSDN博客文章來源地址http://www.zghlxwxcb.cn/news/detail-854204.html

到了這里,關(guān)于【搜索引擎2】實現(xiàn)API方式調(diào)用ElasticSearch8接口的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • SEO搜索引擎優(yōu)化方式

    SEO搜索引擎優(yōu)化方式

    SEO搜索引擎優(yōu)化方式 利用搜索引擎的規(guī)則提高網(wǎng)站在有關(guān)搜索引擎內(nèi)的自然排名,吸引更多的用戶訪問網(wǎng)站,提高網(wǎng)站的訪問量,提高網(wǎng)站的銷售能力和宣傳能力,從而提升網(wǎng)站的品牌效應(yīng)。 今天給大家介紹兩種搜索引擎優(yōu)化的技術(shù)手段。 通過欺騙技術(shù)和濫?搜索算法來推

    2024年02月11日
    瀏覽(107)
  • 各大搜索引擎下拉詞長尾詞API接口

    各大搜索引擎下拉詞長尾詞API接口

    返回結(jié)果: 返回結(jié)果: 谷歌API接口地址2:http://suggestqueries.google.com/complete/search?output=toolbarhl=zhq=開源福利 返回結(jié)果:

    2024年02月11日
    瀏覽(18)
  • 偽API:讓搜索引擎愛上你的網(wǎng)站【詳細教程】

    偽API:讓搜索引擎愛上你的網(wǎng)站【詳細教程】

    大家好,今天來聊聊偽原創(chuàng)API:讓搜索引擎愛上你的網(wǎng)站,希望能給大家提供一點參考。 以下是針對論文重復(fù)率高的情況,提供一些修改建議和技巧: 偽原創(chuàng)API:讓搜索引擎愛上你的網(wǎng)站 你是否在為如何提高網(wǎng)站在搜索引擎中的排名而苦惱?你是否希望讓你的網(wǎng)站在搜索結(jié)

    2024年01月17日
    瀏覽(22)
  • 信息搜集:網(wǎng)絡(luò)空間搜索引擎(Shodan)語法及API應(yīng)用案例

    信息搜集:網(wǎng)絡(luò)空間搜索引擎(Shodan)語法及API應(yīng)用案例

    使用Python去調(diào)用Shodan的API接口可以實現(xiàn)自動化信息搜集,首先需要注冊用戶,在My Account中可以看到API Key。本例如下圖: 初始化API: 初始化API之后就可以使用Shodan的庫函數(shù),下面整理一些常用函數(shù),具體詳細資料可以參考Shodan官方給出的API文檔的API文檔。 ? § shodan_api.coun

    2023年04月08日
    瀏覽(31)
  • 搜索引擎都有哪些關(guān)鍵詞匹配方式

    ?1. 完全匹配 這個應(yīng)該是很多SEO最熟悉的一種匹配方式了,什么是完全匹配呢?比如說我的是“SEO培訓(xùn)”,如果網(wǎng)站中完整的出現(xiàn)了這個詞,并且的位置也匹配,這樣就是完全匹配。這里需要特別明確說的一點就是,完全匹配一定是一個單獨的才是,什么是

    2024年02月13日
    瀏覽(21)
  • 百度搜索引擎推廣的方式和優(yōu)勢有哪些呢?

    百度搜索引擎推廣的方式和優(yōu)勢有哪些呢?

    隨著互聯(lián)網(wǎng)的不斷發(fā)展,搜索引擎的種類也越來越多了,對于國內(nèi)用戶來說,最常用的還是百度搜索引擎,而對于企業(yè)來說,做搜索引擎優(yōu)化推廣也是針對于百度搜索引擎來做的。 ? 那么,百度搜索引擎推廣的方式和優(yōu)勢有哪些呢?接下來就一起了解一下吧! 一、百度搜索

    2024年02月01日
    瀏覽(25)
  • 谷歌瀏覽器添加首頁快捷方式,并設(shè)置默認(rèn)搜索引擎為百度

    谷歌瀏覽器添加首頁快捷方式,并設(shè)置默認(rèn)搜索引擎為百度

    目錄 1、添加首頁快捷方式 ?2、谷歌瀏覽器設(shè)置默認(rèn)搜索引擎 1、添加首頁快捷方式 (1)首先要保證當(dāng)前的默認(rèn)搜索引擎為Google才可以添加首頁的快捷方式。 (2)回到首頁即可添加和自定義快捷方式的url (3)默認(rèn)搜索引擎不是Google,則展示如下,無法添加和修改快捷方式

    2024年02月15日
    瀏覽(54)
  • ES搜索引擎入門+最佳實踐(九):項目實戰(zhàn)(二)--elasticsearch java api 進行數(shù)據(jù)增刪改查

    ? ? ? ? 本篇是這個系列的最后一篇了,在這之前可以先看看前面的內(nèi)容: ES搜索引擎入門+最佳實踐(一)_flame.liu的博客-CSDN博客 ES搜索引擎入門+最佳實踐(二)_flame.liu的博客-CSDN博客 ES搜索引擎入門+最佳實踐(三)_flame.liu的博客-CSDN博客 ES搜索引擎入門+最佳實踐(四)_flame.liu的博客

    2024年02月12日
    瀏覽(28)
  • LangChain 67 深入理解LangChain 表達式語言30 調(diào)用tools搜索引擎 LangChain Expression Language (LCEL)

    LangChain 67 深入理解LangChain 表達式語言30 調(diào)用tools搜索引擎 LangChain Expression Language (LCEL)

    LangChain系列文章 LangChain 50 深入理解LangChain 表達式語言十三 自定義pipeline函數(shù) LangChain Expression Language (LCEL) LangChain 51 深入理解LangChain 表達式語言十四 自動修復(fù)配置RunnableConfig LangChain Expression Language (LCEL) LangChain 52 深入理解LangChain 表達式語言十五 Bind runtime args綁定運行時參數(shù)

    2024年01月23日
    瀏覽(132)
  • 如何高效實現(xiàn)搜索引擎爬蟲進行數(shù)據(jù)挖掘-搜索引擎爬蟲(SERP)集成測試與分享

    如何高效實現(xiàn)搜索引擎爬蟲進行數(shù)據(jù)挖掘-搜索引擎爬蟲(SERP)集成測試與分享

    身處大數(shù)據(jù)時代中,我們面對海量的互聯(lián)網(wǎng)數(shù)據(jù),如何自動高效地獲取感興趣的信息并為我們所用是一個非常重要的問題,以下就針對這個重要的搜索引擎爬蟲問題來做一個技術(shù)分享。 什么是SERP和搜索引擎爬蟲:搜索引擎會根據(jù)特定的的策略,運用特定的計算機程序搜集互

    2024年02月11日
    瀏覽(34)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包