国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ElasticSearch 實(shí)戰(zhàn):ElasticSearch文檔全文檢索

這篇具有很好參考價(jià)值的文章主要介紹了ElasticSearch 實(shí)戰(zhàn):ElasticSearch文檔全文檢索。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

Elasticsearch 實(shí)戰(zhàn):Elasticsearch 文檔全文檢索

全文檢索是 Elasticsearch 的核心功能之一,它允許用戶對(duì)文本內(nèi)容進(jìn)行高效的模糊搜索、詞組匹配、同義詞處理、停用詞過(guò)濾等操作。以下是如何進(jìn)行文檔全文檢索的詳細(xì)步驟:

**1. **全文匹配查詢(Match Query)

最基礎(chǔ)的全文檢索查詢是 match 查詢,它會(huì)對(duì)輸入的文本進(jìn)行分詞處理,并嘗試在索引中找到包含這些詞的文檔。例如,查找標(biāo)題中包含 “Elasticsearch” 的書(shū)籍:

GET /my_index/_search
{
  "query": {
    "match": {
      "title": "Elasticsearch"
    }
  }
}

**2. **短語(yǔ)匹配查詢(Match Phrase Query)

match_phrase 查詢要求文本在文檔中以精確的順序出現(xiàn)。例如,查找標(biāo)題中包含短語(yǔ) “Elasticsearch in Action” 的書(shū)籍:

GET /my_index/_search
{
  "query": {
    "match_phrase": {
      "title": "Elasticsearch in Action"
    }
  }
}

**3. **多字段全文匹配查詢(Multi Match Query)

multi_match 查詢?cè)试S在多個(gè)字段上執(zhí)行相同的全文搜索。例如,查找標(biāo)題或摘要中包含 “Elasticsearch” 的書(shū)籍:

GET /my_index/_search
{
  "query": {
    "multi_match": {
      "query": "Elasticsearch",
      "fields": ["title", "summary"]
    }
  }
}

**4. **模糊查詢(Fuzzy Query)

fuzzy 查詢?cè)试S對(duì)文本進(jìn)行一定程度的拼寫(xiě)錯(cuò)誤容忍。例如,查找標(biāo)題接近 “Elasticsearch” 但允許最多一個(gè)字符錯(cuò)誤的書(shū)籍:

GET /my_index/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value": "Elasticsearch",
        "fuzziness": "AUTO"
      }
    }
  }
}

**5. **通配符查詢(Wildcard Query)和正則表達(dá)式查詢(Regexp Query)

對(duì)于更為復(fù)雜的字符串匹配需求,可以使用 wildcardregexp 查詢:

  • 通配符查詢:使用星號(hào) * 或問(wèn)號(hào) ? 作為通配符匹配文本。例如,查找標(biāo)題以 “Elastic” 開(kāi)頭的書(shū)籍:

    GET /my_index/_search
    {
      "query": {
        "wildcard": {
          "title": "Elastic*"
        }
      }
    }
    
  • 正則表達(dá)式查詢:使用正則表達(dá)式匹配文本。例如,查找標(biāo)題包含連續(xù)兩個(gè) “a” 字母的書(shū)籍:

    GET /my_index/_search
    {
      "query": {
        "regexp": {
          "title": ".*aa.*"
        }
      }
    }
    

**6. **同義詞處理(Synonyms)

要實(shí)現(xiàn)同義詞搜索,通常需要配置分析器(Analyzer)使用同義詞過(guò)濾器(Synonym Filter)。例如,定義一個(gè)包含同義詞映射的分析器:

PUT /my_index
{
  "settings": {
    "analysis": {
      "analyzer": {
        "synonym_analyzer": {
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "synonym_filter"
          ]
        }
      },
      "filter": {
        "synonym_filter": {
          "type": "synonym",
          "synonyms": [
            "es => Elasticsearch",
            "search engine => SE"
          ]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "synonym_analyzer"
      }
    }
  }
}

然后使用配置了同義詞分析器的字段進(jìn)行查詢:

GET /my_index/_search
{
  "query": {
    "match": {
      "title": {
        "query": "es",
        "analyzer": "synonym_analyzer"
      }
    }
  }
}

**7. **停用詞過(guò)濾(Stop Words)

停用詞是指在文本中頻繁出現(xiàn)但對(duì)語(yǔ)義貢獻(xiàn)較小的詞匯,如英語(yǔ)中的 “the”, “a”, “an” 等。通過(guò)配置分析器使用停用詞過(guò)濾器(Stop Words Filter),可以忽略這些詞在搜索中的影響。配置方法與同義詞類(lèi)似,此處略。

通過(guò)以上步驟,您可以利用 Elasticsearch 的全文檢索功能進(jìn)行各種復(fù)雜的文本搜索。結(jié)合業(yè)務(wù)需求,合理選擇查詢類(lèi)型、配置分析器以及處理同義詞、停用詞等,可以顯著提升搜索的準(zhǔn)確性和用戶體驗(yàn)。同時(shí),關(guān)注全文檢索的性能影響,適時(shí)進(jìn)行查詢優(yōu)化。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-847684.html

到了這里,關(guān)于ElasticSearch 實(shí)戰(zhàn):ElasticSearch文檔全文檢索的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 全文檢索-Elasticsearch-進(jìn)階檢索

    全文檢索-Elasticsearch-進(jìn)階檢索

    本文記錄谷粒商城高級(jí)篇的 Elasticsearch 進(jìn)階檢索部分,續(xù)上之前記錄的 Elasticsearch入門(mén)篇。 ES 支持兩種基本方式檢索 : 一個(gè)是通過(guò)使用 REST request URI 發(fā)送搜索參數(shù)(uri + 檢索參數(shù)) 另一個(gè)是通過(guò)使用 REST request body 來(lái)發(fā)送它們(uri + 請(qǐng)求體) 請(qǐng)求體中寫(xiě)查詢條件,語(yǔ)法: 示例

    2024年02月03日
    瀏覽(27)
  • elasticsearch全文檢索

    傳送門(mén) best_fields 傳送門(mén) most_fields 當(dāng)查詢多字段包含相同文本以不同方式分詞的時(shí)候此參數(shù)最有用, 傳送門(mén) cross_fields phrase和phrase_prefix 傳送門(mén) 傳送門(mén)

    2024年02月07日
    瀏覽(32)
  • ElasticSearch-全文檢索

    ElasticSearch-全文檢索

    https://www.elastic.co/cn/what-is/elasticsearch 全文搜索屬于最常見(jiàn)的需求,開(kāi)源的Elasticsearch是目前全文搜索引擎的首選。 它可以快速地儲(chǔ)存、搜索和分析海量數(shù)據(jù)。 維基百科、StackOverflow、Github都采用它。 Elastic的底層是開(kāi)源庫(kù)Lucene。但是,你沒(méi)法直接用Lucene,必須自己寫(xiě)代碼去調(diào)用

    2024年04月17日
    瀏覽(25)
  • ES(Elasticsearch 全文檢索)

    ES(Elasticsearch 全文檢索)

    數(shù)據(jù)量大的時(shí)候 索引失效 =查詢性能低 功能比較弱 對(duì)文檔的內(nèi)容進(jìn)行分詞,對(duì)詞條創(chuàng)建索引,記錄詞條所在的文檔信息根據(jù)詞條查詢到文檔的id 從而查到文檔 文檔:每一條數(shù)據(jù)就是一條文檔 詞條:文檔按照語(yǔ)義分成的詞語(yǔ) 正向索引 根據(jù)文檔的id創(chuàng)建索引 查詢?cè)~條必須先找

    2024年02月05日
    瀏覽(52)
  • 九.全文檢索ElasticSearch經(jīng)典入門(mén)-ElasticSearch映射修改

    九.全文檢索ElasticSearch經(jīng)典入門(mén)-ElasticSearch映射修改

    這篇文章的內(nèi)容是ElasticSearch映射修改,寫(xiě)這篇文章是有水友公司里面遇到了映射修改問(wèn)題,我這里做了一個(gè)整理,希望對(duì)你有所幫助。 在ElasticSearch中一旦創(chuàng)建了映射想要進(jìn)行修改是不被允許的。比如我這里有一個(gè)案例 上面創(chuàng)建了索引employee ,同時(shí)為其創(chuàng)建映射,指定了id和

    2024年02月05日
    瀏覽(31)
  • 全文檢索-Elasticsearch-整合SpringBoot

    全文檢索-Elasticsearch-整合SpringBoot

    前面記錄了 Elasticsearch 全文檢索的入門(mén)篇和進(jìn)階檢索。這次我們來(lái)講下 Spring Boot 中如何整合 ES,以及如何在 Spring Cloud 微服務(wù)項(xiàng)目中使用 ES 來(lái)實(shí)現(xiàn)全文檢索,來(lái)達(dá)到商品檢索的功能。 檢索服務(wù)單獨(dú)作為一個(gè)服務(wù),就稱作 gulimall-search 模塊。 點(diǎn)擊 Next 勾選 Spring Web 依賴,點(diǎn)擊

    2024年02月08日
    瀏覽(18)
  • ElasticSearch全文檢索原理及過(guò)程

    ElasticSearch全文檢索原理及過(guò)程

    ????????ElasticSearch的搜索引擎中,每個(gè) 文檔都有一個(gè)對(duì)應(yīng)的文檔 ID ,文檔內(nèi)容被表示為一系列的集合。例如文檔 1 經(jīng)過(guò)分詞,提取了 20 個(gè), 每個(gè)都會(huì)記錄它在文檔中出現(xiàn)的次數(shù)和出現(xiàn)位置 。那么,倒排索引就是 到文檔 ? ID 的映射 ,每個(gè)關(guān)鍵

    2023年04月17日
    瀏覽(25)
  • 7-Elasticsearch組合查詢和全文檢索

    Elasticsearch組合查詢 組合查詢–布爾查詢 組合查詢中的常用的查詢方式:布爾查詢。 它將多個(gè)查詢條件組合在一起,并且將查詢的結(jié)果和結(jié)果的評(píng)分組合在一起。 布爾查詢是把多個(gè)子查詢組合成一個(gè)布爾表達(dá)式,所有子查詢之間邏輯關(guān)系是and,只有當(dāng)一個(gè)文檔滿足布爾查詢

    2024年02月04日
    瀏覽(24)
  • 全文檢索學(xué)習(xí)之ElasticSearch學(xué)習(xí)筆記

    在非關(guān)系型數(shù)據(jù)庫(kù)中,數(shù)據(jù)是非結(jié)構(gòu)化的,如果直接去查找效率極低,全文檢索將非結(jié)構(gòu)化數(shù)據(jù)中的一部分信息提取出來(lái),重新組織,使其變得有一定結(jié)構(gòu),然后對(duì)此有一定結(jié)構(gòu)的數(shù)據(jù)進(jìn)行搜索,從而達(dá)到搜索相對(duì)較快的目的。索引就是從非結(jié)構(gòu)化數(shù)據(jù)中提取出的然后重新組

    2023年04月11日
    瀏覽(20)
  • ElasticSearch:全文檢索及倒排索引原理

    ElasticSearch:全文檢索及倒排索引原理

    首先介紹一下結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù): 結(jié)構(gòu)化數(shù)據(jù)將數(shù)據(jù)具有的特征事先以結(jié)構(gòu)化的形式定義好,數(shù)據(jù)有固定的格式或有限的長(zhǎng)度。典型的結(jié)構(gòu)化數(shù)據(jù)就是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的表結(jié)構(gòu),數(shù)據(jù)特征直接體現(xiàn)在表結(jié)構(gòu)的字段上,所以根據(jù)某一特征做數(shù)據(jù)檢索很直接,速度也比較快

    2024年02月14日
    瀏覽(22)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包