国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn)

這篇具有很好參考價值的文章主要介紹了ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

背景

XOP億級別題庫的試題召回以及搜題的舉一反三業(yè)務(wù)場景都涉及使用文本相似搜索技術(shù),學(xué)習(xí)此方面技術(shù)以便更好的服務(wù)于業(yè)務(wù)場景。

目前基于集合的Jaccard算法以及基于編輯距離的Levenshtein在計(jì)算文本相似度場景中有著各自的特點(diǎn),為了優(yōu)化具體的計(jì)算時間抖動超時問題,需要學(xué)習(xí)此方面知識,本文主要內(nèi)容為文本相似度計(jì)算方法的現(xiàn)狀、Jaccard、Levenshtein算法實(shí)現(xiàn)基本原理以及代碼實(shí)現(xiàn)論文基于改進(jìn)的 Jaccard 系數(shù)文檔相似度計(jì)算方法的算法,另外一個是針對每個字符進(jìn)行杰卡德相似優(yōu)化的算法實(shí)現(xiàn),// TODO 待驗(yàn)證效果。

ps:你知道的越多,你不知道的也越多,搜索技術(shù)真是讓人上頭hhh

參考

  • 基于改進(jìn)的 Jaccard 系數(shù)文檔相似度計(jì)算方法論文 http://www.c-s-a.org.cn/csa/article/pdf/6123

  • 萊文斯坦距離概述以及DP實(shí)現(xiàn)https://www.zhihu.com/question/315634571/answer/620984468

  • 文本相似度計(jì)算工具h(yuǎn)ttps://github.com/shibing624/similarity

  • 什么是TD-IDFhttps://zh.wikipedia.org/wiki/Tf-idf

  • 超級好懂的min-hash算法https://juejin.cn/post/7025522652898918414

  • // TODO 字符串相似度匹配算法_Jaccard算法優(yōu)化:https://blog.csdn.net/qq_44272797/article/details/134686733

目錄

  • 文本相似度計(jì)算方法的現(xiàn)狀

    • 向量空間模型

    • KNN

    • 編輯距離

    • 集合相似度

  • 基于改進(jìn)的Jaccard系數(shù)文檔原理與嘗試代碼實(shí)現(xiàn)

    • 算法原理

    • 本地代碼實(shí)現(xiàn)demo

    • 效果測試

  • // TODO 基于字符的Jaccard算法測評

1、文本相似度計(jì)算方法的現(xiàn)狀

1.1、向量空間模型

傳統(tǒng)的文本相似度計(jì)算方法一般采用向量空間模型[3] , 實(shí)際上就是將語義相似度用空間上的相似度來表 達(dá), 對文本進(jìn)行特征項(xiàng)選取后再對其做加權(quán)處理, 用向 量來表示特征項(xiàng)權(quán)重, 使這些特征項(xiàng)權(quán)重從離散的數(shù) 字轉(zhuǎn)化為一個個帶向量的分量, 于是文本的相似度計(jì) 算就轉(zhuǎn)化成特征項(xiàng)權(quán)重在高維空間內(nèi)的相似度計(jì)算[4] .

傳統(tǒng)向量空間模型特點(diǎn)

  • 這種計(jì)算方法簡單直觀,有效地將文本處理的問題轉(zhuǎn) 化為數(shù)學(xué)問題.

  • 但是在對特征項(xiàng)進(jìn)行加權(quán)時向量空間 模型沒有考慮到特征項(xiàng)在文本中的位置信息, 并且忽 略了各個特征項(xiàng)的語義在文本之間的關(guān)聯(lián)性.也就是頻率權(quán)重和位置權(quán)重。

舉個例子,下面兩個文本

  • 文本1: “機(jī)器學(xué)習(xí)是人工智能領(lǐng)域中非常重要的一部分,它可以用于各種任務(wù),包括圖像識別和自然語言處理等?!?/p>

  • 文本2: “計(jì)算機(jī)視覺是機(jī)器學(xué)習(xí)領(lǐng)域的一個研究方向,主要涉及圖像處理和圖像識別等技術(shù)應(yīng)用?!?/p>

傳統(tǒng)方法可能只考慮關(guān)鍵詞的出現(xiàn)頻率,并將這兩篇文章當(dāng)作包含如下關(guān)鍵詞的向量進(jìn)行比較:

  • 關(guān)鍵詞向量1:[機(jī)器學(xué)習(xí), 人工智能, 圖像識別, 自然語言處理]

  • 關(guān)鍵詞向量2:[計(jì)算機(jī)視覺, 機(jī)器學(xué)習(xí), 圖像處理, 圖像識別]

如果我們使用傳統(tǒng)方法,可能會直接比較這兩個向量之間的相似度,例如通過計(jì)算余弦相似度來判斷他們的相似程度。但是這樣的方法沒有考慮到特征項(xiàng)的頻率權(quán)重和位置權(quán)重信息。

  • 位置權(quán)重:為了解決傳統(tǒng)方法的不足, 王小林[8]考慮到特征項(xiàng)在文本中的位置對權(quán)重的影響, 對特征項(xiàng)添加了位置權(quán)重, 進(jìn)行信息增益和熵值計(jì)算, 雖然該算法在一定程度上提高了查全率和查準(zhǔn)率, 但該算法的時間復(fù)雜度較高, 還需進(jìn)一步改進(jìn)才能運(yùn)用在實(shí)際環(huán)境中

  • 頻率權(quán)重:周麗杰[9]將得到的特征項(xiàng)權(quán)值經(jīng)過馬爾科夫模型與向 量空間模型的結(jié)合, 得到一個總體相似度, 提高了準(zhǔn)確 率, 忽略了關(guān)鍵詞在不同文檔中的權(quán)重問題

特征提取之嵌套詞串

特征提取也很重要,需要注意特征提取算法中對嵌套詞串處理避免丟失重要信息。

涂建軍提出的特征提取算法通過對嵌套詞串的處理有效地避免了在降維過程中丟失重要信息的問題。

下面是一個例子來說明這個算法的作用:

(1)假設(shè)我們有一段文本:“這部電影真的非常好看,情節(jié)緊湊、劇情曲折扣人心弦?!?/p>

(2)傳統(tǒng)的特征提取方法可能會直接將文本拆分成單個詞語的集合,比如[“這部”, “電影”, “真的”, “非?!? “好看”,…]。然后可以使用詞頻或者TF-IDF等方式來表示每個詞的重要性,并構(gòu)建一個稀疏向量來表示整個文本。

(3)但是,在這種方法中,單個詞語的順序和組合并沒有得到很好的保留。例如,上述文本中,“劇情曲折扣人心弦” 這個詞串表達(dá)了電影的核心特點(diǎn),但在傳統(tǒng)方法中卻被拆分為獨(dú)立的單個詞語。

(4)而涂建軍所提出的特征提取算法則考慮到了嵌套詞串,在處理文本時會以更長的片段作為特征單位。

對于上述例子,該算法可以將文本分解為 [“這部電影”, “真的非?!? “好看情節(jié)”, “緊湊劇情”, “曲折扣人心弦”] 等嵌套詞串。

這樣一來,我們就能更好地捕捉到連續(xù)出現(xiàn)的相關(guān)詞語以及它們之間的關(guān)系。在文本相似度計(jì)算或者其他自然語言處理任務(wù)中,這種特征提取方法可以更全面、準(zhǔn)確地表達(dá)文本的含義和特征。

特征提取之n-gram

什么是n-gram:https://zhuanlan.zhihu.com/p/32829048王賢明提出的基于 n-Gram 的相似度算法操作簡單,避免了傳統(tǒng)文本相似度計(jì)算方法中繁雜的特征提取過程,從而有效地提高了計(jì)算效率。

然而,在計(jì)算權(quán)重的評價函數(shù)過程中,該算法采用了隨機(jī)挑選元素的方法,導(dǎo)致元素權(quán)重的不確定性。具體來說,該算法首先將文本進(jìn)行分詞處理,然后根據(jù)n-Gram模型生成特征項(xiàng)集合。例如,對于一個二元的2-Gram模型,可以得到所有由兩個相鄰詞組成的特征項(xiàng)。

接下來,通過計(jì)算每個特征項(xiàng)在文本中的頻率,并結(jié)合一些其他因素(如長度懲罰),來計(jì)算特征項(xiàng)的權(quán)重。

1.2、KNN

上面兩個方法則會對每個關(guān)鍵詞進(jìn)行加權(quán),并考慮不同位置上的權(quán)重變化。因此,在計(jì)算文本相似度時,我們需要綜合考慮關(guān)鍵詞的權(quán)重、位置和波動等因素。雖然考慮了特征項(xiàng)的頻率權(quán)重以及位置權(quán)重對相似性準(zhǔn)確度有一定效果。但是還有那種文字特征聯(lián)系弱,但是上下文有相關(guān)聯(lián)系的場景處理不到,

1、舉個例子,下面一個場景,例如,考慮一個搜索主題是"狗糧品牌推薦",另一個搜索主題是"如何訓(xùn)練小狗"。這兩個主題在內(nèi)容上可能沒有明顯的語義相似性,因?yàn)樗鼈兩婕暗讲煌姆矫妫阂粋€是關(guān)于狗糧的品牌推薦,另一個是關(guān)于狗的訓(xùn)練方法。然而,從實(shí)際生活經(jīng)驗(yàn)中我們可以觀察到,人們在選擇狗糧之前通常會先了解如何正確地訓(xùn)練小狗。這意味著這兩個主題之間存在某種相關(guān)性:人們在搜索狗糧品牌之前可能會搜索有關(guān)訓(xùn)練小狗的信息。

基于傳統(tǒng)向量空間模型優(yōu)化的方法,可以通過分析大量用戶點(diǎn)擊行為數(shù)據(jù)來發(fā)現(xiàn)這種潛在的相關(guān)性,并將其考慮在搜索結(jié)果的排名中。這樣,即使兩個主題的語義相似度較低,但由于它們之間可能存在隱含的相關(guān)關(guān)系,搜索引擎可以更好地理解用戶的真實(shí)需求,并提供更準(zhǔn)確、相關(guān)的搜索結(jié)果。

2、再舉一個例子,對于何維的方法,他使用KNN算法來表示文本相似度,并將文本相似度用句子級別來表示。舉個例子來說明這種方法可能更好理解。假設(shè)我們有兩篇新聞文章A和B,它們分別是關(guān)于足球比賽的報(bào)道。我們要判斷這兩篇文章是否相似。

  • 在傳統(tǒng)的文本相似度計(jì)算方法中,我們通常會將文章A和文章B轉(zhuǎn)換為向量表示(比如詞袋模型),然后計(jì)算它們之間的余弦相似度或歐氏距離等指標(biāo)來衡量它們的相似程度。但是這些方法無法考慮到文章中每個句子的重要性以及句子之間的關(guān)聯(lián)。

  • 而何維的方法則采用了不同的思路。首先,他將文章A和文章B拆解成多個句子,并計(jì)算每個句子之間的相似度。然后,通過KNN算法找出最相關(guān)的幾個句子并計(jì)算它們的平均相似度作為整個文章的相似度。

例如,如果文章A包含以下三個句子:

  1. “昨天晚上巴塞羅那隊(duì)與皇馬隊(duì)的足球比賽非常精彩?!?/p>

  2. “梅西在比賽中表現(xiàn)出色,打進(jìn)了兩個進(jìn)球?!?/p>

  3. “皇馬隊(duì)則依靠貝爾的帽子戲法贏得了比賽?!?/p>

文章B包含以下三個句子:

  1. “切爾西隊(duì)與曼聯(lián)隊(duì)的足球比賽在本周末進(jìn)行?!?/p>

  2. “這場比賽吸引了眾多球迷的關(guān)注?!?/p>

  3. “最終切爾西以2-1的比分戰(zhàn)勝了曼聯(lián)?!?/p>

通過計(jì)算每個句子之間的相似度,并使用KNN算法找出最相關(guān)的幾個句子(比如選擇前兩個句子)來計(jì)算平均相似度。假設(shè)我們得到的結(jié)果是0.8,則可以認(rèn)為文章A和文章B相似程度較高。這種方法考慮了句子級別的相似度,能夠更全面地表示文本之間的相似度,相比傳統(tǒng)方法來說具有一定的優(yōu)勢。

傳統(tǒng)的文本分類方法可能會將每個文檔轉(zhuǎn)換成由詞頻構(gòu)成的向量,在高維空間中進(jìn)行計(jì)算,然后使用某種機(jī)器學(xué)習(xí)算法訓(xùn)練分類模型。但是當(dāng)郵件的數(shù)量非常龐大時,向量的維度也會變得非常高,并且隨著郵件數(shù)量的增加,處理起來會越來越困難。

而K-nearest模型則采用了近鄰思想,即將每個文檔視為一個點(diǎn)在高維空間中的位置,通過尋找最近的K個文檔來確定該文檔的類別。在這個例子中,我們可以選取K=5,然后通過計(jì)算待分類文檔與訓(xùn)練集中其他文檔的相似度(比如使用余弦相似度),并選擇最近的5個文檔來判斷其類別。

1.3、字符串編輯距離

一般的編輯距離實(shí)現(xiàn)算法如來溫斯坦距離。算法詳解與實(shí)現(xiàn)https://cloud.tencent.com/developer/article/1649884

// 一般的dfs
class Solution:
  def minDistance(self, s: str, t: str) -> int:
      n, m = len(s), len(t)
      @cache
      def dfs(i, j):
          if i < 0: return j + 1
          if j < 0: return i + 1
          if s[i] == t[j]: return dfs(i - 1, j - 1)
          return min(dfs(i - 1, j), dfs(i, j - 1), dfs(i - 1, j - 1)) + 1
      return dfs(n - 1, m - 1)
?
?
// 二維DP
?
狀態(tài)轉(zhuǎn)移一,對字符串A插入操作,需要插入的值是B字符串的最后一個字母,所以問題變成了求“abcd”與“abcd”的編輯距離,現(xiàn)在最后一個字母相同,可以用之前得到的結(jié)論,繼而問題成了求“abc”與“abc”的編輯距離。這樣看來,其實(shí)是把最初的問題轉(zhuǎn)移了:求“abc”與“abcd”編輯距離 = 求“abc”與“abc”的編輯距離 + 1。“+1”是因?yàn)槲覀儗ψ址瓵做了一個插入操作。
狀態(tài)轉(zhuǎn)移二,對字符串A刪除操作。問題成了這樣:求“abc”與“abcd”的編輯距離 = 求“ab”與“abcd”的編輯距離 + 1。
狀態(tài)轉(zhuǎn)移三,對字符串A替換操作。替換操作是比較隱晦的,不易看出來(對電腦而言),我們需要額外舉例。現(xiàn)在字符串A = “abcd” 字符串B = “abce”,肉眼能夠分辨,將字符串A最后一個字母“d”換成“e”,A就變成B了。可計(jì)算機(jī)沒那么聰明,它需要一個字母一個字母的去比較。當(dāng)同時去掉字符串A與字符串B的最后一個字母,如果剩下字符串相同,那么我們認(rèn)為兩個字符串之間的轉(zhuǎn)換可以通過一個替換操作完成。
class Solution {
    public int minDistance(String word1, String word2) {
        int len1=word2.length();
        int len2=word1.length();
        int dp[][]=new int[len1+1][len2+1];
        for(int i=1;i<=len1;i++) dp[i][0]=i;
        for(int i=1;i<=len2;++i) dp[0][i]=i;
        
        for(int i=1;i<=len1;i++){
            for(int j=1;j<=len2;j++){
                if(word2.charAt(i-1)!=word1.charAt(j-1)){
                    dp[i][j]=Math.min(dp[i-1][j-1],Math.min(dp[i-1][j],dp[i][j-1]))+1;
                }else dp[i][j]=dp[i-1][j-1];
            }
        }
        return dp[len1][len2];
    }
}
?
// 一維DP,將空間復(fù)雜度從o(mn)壓縮到o(min(m,n))
?
// 狀態(tài)壓縮
public class EditDistance {
    public static int minDistance(String word1, String word2) {
        // 獲取字符串長度
        int m = word1.length(); // abc
        int n = word2.length(); // abcd
        
        // 初始化一維DP數(shù)組
        int[] dp = new int[n + 1];
        
        // 初始化第一行,表示將空串轉(zhuǎn)換成word2的前j個字符所需的操作次數(shù)
        // word1 = "" 情況
        for (int j = 0; j <= n; j++) {
            dp[j] = j; // [0,1,2,3,4]
        }
?
        /**
        *   a b c
        * a
        * b
        * c
        * d
        *
        */
        
        // 迭代計(jì)算每一行的值
        // 以上代碼通過一個一維數(shù)組dp來保存每行的值,prev變量用于存儲上一輪迭代的dp[j-1]的值。在每次更新dp[j]時,需要先將當(dāng)前位置的值temp保存起來供下一輪使用。
        for (int i = 1; i <= m; i++) {
            int prev = dp[0]; // 對角線的值
            dp[0] = i; // 本輪開始
            
            for (int j = 1; j <= n; j++) {
                int temp = dp[j]; 
                
                if (word1.charAt(i - 1) == word2.charAt(j - 1)) {
                    dp[j] = prev; // 字符相等,不需要進(jìn)行操作
                } else {
                    dp[j] = Math.min(prev, Math.min(dp[j], dp[j - 1])) + 1;
                }
                
                prev = temp;
            }
        }
        
        return dp[n];
    }
}
?

G Sidorov和賈惠娟則從不同的角度出發(fā),分別探索了基于樹編輯距離和結(jié)合特征詞知識庫的新穎計(jì)算方法,在實(shí)驗(yàn)中也取得了更好的結(jié)果。這些研究為我們在處理文本相似度問題時提供了更多有益的思路和工具?;诰庉嬀嚯x的基礎(chǔ), G Sidorov[6]提出使用 一種樹編輯距離的算法來計(jì)算文本相似度, 實(shí)驗(yàn)結(jié)果 的準(zhǔn)確率高于編輯距離. 賈惠娟[7]在有特征詞知識庫支 持的前提條件下, 提出將編輯距離與向量空間模型相 結(jié)合構(gòu)建一種新的文本相似度計(jì)算模型, 雖然在數(shù)據(jù) 預(yù)處理的過程中可能會丟失一些文本特征項(xiàng), 但是用 于領(lǐng)域文檔查詢也取得不錯的效果.

**主要是提升相似準(zhǔn)確性,**舉個例子假設(shè)我們有兩個句子:句子A是"我喜歡吃蘋果",句子B是"我不喜歡吃橙子"。傳統(tǒng)的編輯距離算法只考慮了單詞之間的差異,它會將這兩個句子視為完全不相似的。但是,G Sidorov提出的樹編輯距離算法可以更好地捕捉到結(jié)構(gòu)上的相似性。通過將句子轉(zhuǎn)化成語法樹,并計(jì)算樹之間的編輯距離,該算法能夠發(fā)現(xiàn)句子A和句子B中都存在著"我喜歡吃"這樣一個共同的片段,從而得出它們在某種程度上是相關(guān)的。賈惠娟則進(jìn)一步探索了將編輯距離與向量空間模型相結(jié)合來計(jì)算文本相似度。在她的方法中,首先使用編輯距離算法計(jì)算兩個句子的相似度分?jǐn)?shù),然后再與特征詞知識庫中的權(quán)重進(jìn)行加權(quán)。這樣一來,不僅考慮了詞匯層面的相似性,還充分利用了特征詞的語義信息,使得相似度計(jì)算更準(zhǔn)確。

1.4、集合相似度

一般的共同元素相似性計(jì)算實(shí)現(xiàn)方法如Jaccard系數(shù)。https://www.cnblogs.com/bourneli/archive/2013/04/04/2999767.htmlJaccard相似度是衡量兩個集合之間相似性的一種常用方法,它利用集合中共同元素的數(shù)量來計(jì)算相似度??梢詫⑵鋺?yīng)用于文本相似度的計(jì)算。舉個例子,假設(shè)我們有兩個句子:“我喜歡吃蘋果"和"我愛吃水果”。通過將每個句子分詞并構(gòu)建詞匯表,將每個句子表示為一個詞語的集合:{我, 喜歡, 吃, 蘋果}和{我, 愛, 吃, 水果}。接下來,我們可以使用 Jaccard 相似度來計(jì)算這兩個句子之間的相似度。具體而言,Jaccard 相似度計(jì)算公式如下:J(A, B) = |A ∩ B| / |A ∪ B|

  • 其中,A 和 B 分別代表兩個句子的詞語集合,

  • |A ∩ B| 表示 A 和 B 之間共同存在的詞語數(shù)量

  • |A ∪ B| 則表示 A 和 B 的總詞語數(shù)量。

對于上述例子中的兩個句子,共同存在的詞語數(shù)量為3({我, 吃}),總詞語數(shù)量為6。因此,它們之間的 Jaccard 相似度為 3/6 = 0.5。

通過計(jì)算 Jaccard 相似度,我們可以衡量文本之間的相似性,并用于文本聚類、社團(tuán)發(fā)現(xiàn)等任務(wù)。這里提到的孫宇的研究使用 Jaccard 相似度實(shí)現(xiàn)了社團(tuán)發(fā)現(xiàn)和聚類研究,通過計(jì)算文本集合之間的相似度來找出具有相似主題或內(nèi)容的文本群體。

這種如果涉及語意層面相似度計(jì)算,那么計(jì)算的有可能不太準(zhǔn)了,如下面demo,兩句話語意計(jì)算的不準(zhǔn)確,但是Jaccard計(jì)算的相似度為1.0

public static void main(String[] args) {
      String s1 = "你好,你不是我的朋友";
      String s2 = "你不好,我的朋友是你";
      List<Integer> s1Chars = s1.chars().distinct().boxed().collect(Collectors.toList());
      System.out.println("s1 元素ASCII集合:" + s1Chars);
?
      List<Integer> s2Chars = s2.chars().distinct().boxed().collect(Collectors.toList());
      System.out.println("s2 元素ASCII集合:" + s2Chars);
?
      long sameChars = CollectionUtils.intersection(s1Chars, s2Chars).size();
      double denominator = CollectionUtils.union(s1Chars, s2Chars).stream().distinct().count();
      System.out.println("Jaccard 相似性系數(shù)為: " + sameChars / denominator); // 1.0
  }

基于min-hash的進(jìn)階版Jaccard

min-hash算法就是一個在Jaccard距離基礎(chǔ)之上進(jìn)行改進(jìn),帶有降維功能的進(jìn)階版Jaccard距離。如果兩個集合的維度是成百萬上千萬的,那么比較適合,否則計(jì)算的相似度不準(zhǔn)確。盡管Jaccard距離本身是一個不復(fù)雜的概念,然而,隨著集合的維度的增加,計(jì)算集合之間的Jaccard距離的計(jì)算成本也呈指數(shù)級增長,因此我們不得不思考一個問題:如何降低運(yùn)算的復(fù)雜度?

2、基于改進(jìn)的Jaccard系數(shù)文檔原理與嘗試代碼實(shí)現(xiàn)

針對傳統(tǒng)方法的不足最簡單粗暴的Jaccard算法的不足, 下面參考基于改進(jìn)的 Jaccard 模型的計(jì)算方法提出的一種兼顧特征項(xiàng)權(quán)重與 計(jì)算效率的文本相似度計(jì)算方法, 用以獲得更準(zhǔn)確的 文本信息描述, 提高文本分類性能.本地嘗試代碼實(shí)現(xiàn)。

參考論文:基于改進(jìn)的 Jaccard 系數(shù)文檔相似度計(jì)算方法論文 http://www.c-s-a.org.cn/csa/article/pdf/6123

2.1、算法實(shí)現(xiàn)

公式
ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

計(jì)算相似度,使用Jaccard相似系數(shù)算法。從字符串根據(jù)滑動窗口選取子串進(jìn)行權(quán)重相似度計(jì)算,以下介紹本文方法的主要步驟:

  • (1) 給定參數(shù) K, K 為文檔中移動窗口大小. 給定兩個文檔長度分別為 n1、n2 的文檔 X 和文檔 Y. 確定文檔中長度為 K 的元素個數(shù), 并計(jì)算每個元素在文檔中所占的比重;

  • (2) 計(jì)算每個元素的 Jaccard 相似度;

  • (3) 計(jì)算每個元素在所有長度為 K 的元素中所占的比重;

  • (4) 確定每個 K 字元素的權(quán)重;

  • (5) 匯總所有 K 字元素相似度, 計(jì)算文檔相似度

2.2、算法代碼實(shí)現(xiàn)

/**
     * 計(jì)算相似度,使用Jaccard相似系數(shù)算法。從字符串根據(jù)滑動窗口選取子串進(jìn)行權(quán)重相似度計(jì)算
     * 以下介紹本文方法的主要步驟:
     * (1) 給定參數(shù) K, K 為文檔中移動窗口大小. 給定兩個文檔長度分別為 n1、n2 的文檔 X 和文檔 Y. 確定文檔中長度為 K 的元素個數(shù), 并計(jì)算每個元素在文檔中所占的比重;
     * (2) 計(jì)算每個長度為 K 元素的 Jaccard 相似度;
     * (3) 計(jì)算每個元素在所有長度為 K 的元素中所占的比重;
     * (4) 確定每個 K 字元素的權(quán)重;
     * (5) 匯總所有 K 字元素相似度, 計(jì)算文檔相似度
     * @param left
     * @param right
     * @param denominatorPolicy
     * @param windowLength 滑動窗口的大小
     * @return
     */
    private static double similarityByJaccardBySlidingWindow(String left, String right, JaccardDenominatorPolicy denominatorPolicy,int windowLength) {
        // 檢驗(yàn)窗口大小
        int leftLen = StringUtils.length(left);
        int rightLen = StringUtils.length(right);
        int minLen = Math.min(leftLen, rightLen);
        if(minLen < windowLength){
            windowLength = minLen;
        }
        // 窗口元素個數(shù)
        int leftElementLen = leftLen - windowLength + 1;
        int rightElementLen = rightLen - windowLength + 1;
?
        // 統(tǒng)計(jì)窗口元素出現(xiàn)的次數(shù)
        Map<String,Double> leftWindowElementWeightMap = Maps.newHashMap();
        Map<String,Double> rightWindowElementWeightMap = Maps.newHashMap();
?
        for (int i = 0; i < leftElementLen; i++) {
            String substring = left.substring(i, i + windowLength);
            leftWindowElementWeightMap.put(substring,leftWindowElementWeightMap.getOrDefault(substring,0.0) + 1);
        }
        for (int i = 0; i < rightElementLen; i++) {
            String substring = right.substring(i, i + windowLength);
            rightWindowElementWeightMap.put(substring,rightWindowElementWeightMap.getOrDefault(substring,0.0) + 1);
        }
        // 計(jì)算窗口元素權(quán)重
        Set<String> leftWindowElementSet = leftWindowElementWeightMap.keySet();
        Set<String> rightWindowElementSet = rightWindowElementWeightMap.keySet();
?
        for (String element : leftWindowElementSet) {
            leftWindowElementWeightMap.put(element,leftWindowElementWeightMap.get(element) / leftElementLen);
        }
        for (String element : rightWindowElementSet) {
            rightWindowElementWeightMap.put(element,rightWindowElementWeightMap.get(element) / rightElementLen);
        }
?
        // 存在兩個集合的窗口元素
        Collection<String> shareWindowElements = CollectionUtils.intersection(leftWindowElementSet, rightWindowElementSet);
?
        // 計(jì)算同時存在兩個集合的窗口元素的Jaccard系數(shù) , 采用 min(weight) / max(weight)
        Map<String,Double> shareWindowElementJaccardMap = new HashMap<>();
        for (String element : shareWindowElements) {
            Double leftWeight = leftWindowElementWeightMap.get(element);
            Double rightWeight = rightWindowElementWeightMap.get(element);
            shareWindowElementJaccardMap.put(element,leftWeight < rightWeight ? leftWeight / rightWeight : rightWeight / leftWeight);
        }
        // 計(jì)算同時存在兩個集合的窗口元素的Weight系數(shù) ,窗口元素出現(xiàn)的次數(shù) / 全部窗口元素的個數(shù)
        Map<String,Double> shareWindowElementWeightMap = new HashMap<>();
        for (String element : shareWindowElements) {
            double count = (leftWindowElementWeightMap.get(element) * leftElementLen) + (rightWindowElementWeightMap.get(element) * rightElementLen);
            Double weight = count / (leftElementLen + rightElementLen);
            shareWindowElementWeightMap.put(element,weight);
        }
		?

        // 計(jì)算最后的結(jié)果
        double molecular = 0.0;
        double denominator = 0.0;
        for (String element : shareWindowElements) {
            molecular += shareWindowElementJaccardMap.get(element) * shareWindowElementWeightMap.get(element);
            denominator += shareWindowElementWeightMap.get(element);
        }
        return molecular / denominator;
    }

2.3、效果測評

經(jīng)過下面系列測試

  • 2.3.1、與杰卡德、萊文斯坦相似度結(jié)果對比測試

  • 2.3.2、測試n-gram對相似度影響

  • 2.3.3、召回CASE測試1

  • 2.3.3、召回CASE測試2

總的來說,目前該場景無實(shí)用價值,按照關(guān)鍵詞以及權(quán)重計(jì)算相似性,相比普通的杰卡德有著關(guān)鍵詞相似聯(lián)系的特點(diǎn),但是相似結(jié)果和真實(shí)的相似結(jié)果是非線形的,也就是波動比較大,相似度效果也并不是很準(zhǔn),目前該場景無實(shí)用價值;效率會提升一點(diǎn)點(diǎn)(基本可以忽略)

  • 效果:改進(jìn)杰卡德算法n-gram值越大,相似度要求越來嚴(yán)格,也就是兩個不太相似的文本段落相似度得分越來越低。整體來說,改進(jìn)版杰卡德算法其實(shí)類似分詞計(jì)算相似度,會根據(jù)分詞的詞頻、權(quán)重影響相似度,較長文本(文章)適合設(shè)置n-gram較為大值,較短文本(試題題干)適合設(shè)置n-gram為較小的值(比如1-4)。
  • 性能:理論n-gram >= 1 的時候,兩個文本段落A、B理論集合數(shù)量為 len(A) - n-gram + 1、len(B) - n-gram + 1,相比原本杰卡德算法兩個集合A、B數(shù)量為len(A)、len(B)減少了n-gram個,因此性能會略微好一點(diǎn),但是相差不大。
    ps:n-gram也就是窗口的大小,取值不同會影響最終的相似度結(jié)果,論文中說在n-gram = 7數(shù)據(jù)量較大的時候和相似度線性相關(guān)。

ps:n-gram也就是窗口的大小,取值不同會影響最終的相似度結(jié)果,論文中說在n-gram = 7數(shù)據(jù)量較大的時候和相似度線性相關(guān)。

2.3.1、與杰卡德、萊文斯坦相似度結(jié)果對比測試

測試結(jié)論:設(shè)置n-gram = 7

  • 性能方面,少量CASE和簡單粗暴的杰卡德性能不相上下

  • 效果方面,少量CASE下,相似度準(zhǔn)確度量還是可以的,相比萊文斯坦特征不那么生硬,相比最簡單粗暴的杰卡德有有著結(jié)合窗口特這個權(quán)重、窗口特征頻率等相關(guān)相似性效果。

String[] searchTexts = {
    "化學(xué)的研究對象是 A.物質(zhì) B物體 C.運(yùn)動 D.實(shí)驗(yàn)",
    "1.銀是一種銀白色金屬,密度較大,具有良好的 導(dǎo)電性,長期放置會被氧化而發(fā)黑、其中屬 于銀的化學(xué)性質(zhì)的是 () A.銀白色 B.密度較大 C.導(dǎo)電性良好 D.能被氧化",
    "6.非洲最高峰乞力馬扎羅山是著名的“赤道雪山”,導(dǎo)致其頂部出現(xiàn)積雪的 因素是()。 A.緯度 B.海陸 C.地形 D.洋流",
    "7. 復(fù)合題題干 (1)小問1 A. 選 4.項(xiàng)1 B. 選項(xiàng)2 C. 選項(xiàng)3 D. 選項(xiàng)4 (2)小問2 A. 選項(xiàng)1 B. 選項(xiàng)2 C. 選項(xiàng)3 D. 選項(xiàng)4",
    "如圖所示 一、”認(rèn)真細(xì)致”填一填!(24分,每格1分。)1.在 $$1.4 \\dot{4}\\dot{5},1. \\dot{4}5,1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1.1.$$ 這四個數(shù)中,最大的數(shù)是(),最小的數(shù)是()2.根據(jù)356×24=8544,那么35.6×()-()×240=85.44。",
    "1.計(jì)算下面各題. (1)27×11. (3)39×11. (5)92×11. (6)98×11.",
    "—How many birds do you see? — A. I have 11. B. I'm 11. C. I see 11.",
    "不等式 7?6x?x^2>0 的解集為( ) A. [?7,1] B. (?7,1) C. (?∞,?7]∪[1.+∞) D. (?∞,?7)∪(1.+∞)",
    "zhaoquīlxiěchūshù&四、找規(guī)律寫出數(shù)字。(16分)1.&4610142.510153045",
    "1.給下列加點(diǎn)的字注音或根據(jù)拼音寫漢字。, 阻礙() 墮落() jue ()擇, jiao ()辯 強(qiáng)詞奪理()",
    "試題分析:本文敘述的是在上學(xué)時得知母親去世的消息,我不斷懷念母親,認(rèn)為他是我心中的英雄,是個偉大的人。 細(xì)節(jié)理解題。根據(jù)第一段When we returned to school,my teacher told me to go to the headmaster‘s office,當(dāng)我們返回學(xué)校時,老師把我們叫到校長辦公室。故得出C項(xiàng)。 細(xì)節(jié)理解題。根據(jù)第一段The police officer told me what had happened and we went to pick my sister up,警察告訴我發(fā)生的事,所以選D項(xiàng)。 細(xì)節(jié)理解題。根據(jù)第二段On the next day,the headmaster came and told my two teachers what had happened,第二天,校長過來告訴我的兩個老師所發(fā)生的事 根據(jù)When my teacher took me outside,my sister ran up to me. She started crying,“She‘s gone. Teresa,mommy’s gone.得知母親去世。故選B項(xiàng)。 細(xì)節(jié)推斷題。根據(jù)最后一段When someone asks me who my hero is,I tell them,my mother. My mother lives every day. That is what makes her a true hero B項(xiàng)。 細(xì)節(jié)理解題。very good根據(jù)最后一段When someone asks me who my hero is,I tell them,my mother,母親是個偉大的人,故選D項(xiàng)。",
    "\"I love you\" might be one of the most important sentences in the English language. very good.It shows the closeness among family members and friends. In Mandarin, \"I love you\" translates as “我愛你”, but the way it's used in China might be a little different, and Chinese are wondering why. The Global Times reports that two online videos showing children telling their parents \"I love you\" have been widely spread in China. The first, filmed by an Anhui TV station, shows a number of college students telling their parents they love them. The answers are mixed. \"Are you drunk?\" asked one parent. In another similar video, a father even said— \"I am going to a meeting, so cut the crap.\" Even the positive attitudes make it clear that the words are expressed rarely. \"I am so happy you called to say that. It is the happiest thing that happened to me in 2014,\" one parent answered. However, Chinese families hardly use those words. \"The parents' answers show that many Chinese are not good at expressing positive feelings,\" Xia Xueluan, a Sociologist from Peking University, told the Global Times. \"They are used to educating children with negative language.\" This isn't the first time that China has done some soul-searching about familial love — last year China Daily asked a lot of people if they said 'I love you' to their parents, lovers, and children. \"I have never said 'I love you' to my family, and I don't think I will in the future,\" one 56-year-old told the paper, \"Saying it aloud is embarrassing for me.\" Still, that doesn't mean that love can't be expressed. In another article, China Daily spoke to Zhao Mengmeng, a 31-year-old woman who said she had never told her father she loved him face-to-face. Sometimes actions speak louder than words, however — Zhao gave her father, a photo album featuring photographs of them together on every one of her birthdays in June 2012. The pictures were popular online, being forwarded hundreds of thousands of times on Weibo. Her father was very excited when he heard about it. What does the underlined word Mandarin probably mean? French Japanese English Chinese What can we infer(推斷) from the parents’ answers in Paragragh3 and 4? Some parents don’t love their children. Parents in China are too busy. Most Chinese students rarely express their positive feelings to their parents. Children in China are always taught negative language. What will that 56-year-old person feel if he/she says “I love you” to the families? embarrassed excited proud unhappy Why did Zhao give her father a photo album instead of saying \"I love you\"? The album is more expensive. His father likes the album better. She thinks actions speak louder than words sometimes. She hates saying \"I love you\" to her father. What’s the best title for the passage? I Love You A Photo Album Two Online Videos Family members",
    "閱讀下面短文, 完成短文后的問題。 In many English homes, people eat four meals a day. Breakfast is a very big meal. very good.It shows the closeness among family members and friends. People have eggs, tomatoes or bread and drink tea or coffee at breakfast. For many people, lunch is a quick meal. In sandwich bars, office workers can buy all kinds of salad sandwiches and bread. School children often have their meals at school, but many just take a sandwich, a drink and some fruit from home. Afternoon tea comes between lunch and evening meal. \"Tea\" means(意味著)two things. It is a drink and a meal. Some people have afternoon tea with sandwiches, cakes and a cup of tea. \"Dinner” is the main(主要的)meal of the day. They usually have the evening meal quite early, all the the family often eat together between six and eight. And they eat all kinds of things. First, they have soup, then they have meat, fish and vegetables. After that, they eat some fruit, like bananas, apples or oranges. Some people also eat ice-cream after dinner. How many meals do many English people have? What do English people have at breakfast ? Where do school children often have their lunch? Does \"afternoon tea\" only mean a drink? What do you think of \"Dinner\"? Why?",
    "What do you think robots are able to do? You might be able to find one that fits your needs at the World Robot Conference (WRC) 2022 in Beijing. It was held from Aug 18 to 21, more than 500 robots were on display at the WRC. From human-like robots that look surprisingly lively to robots that can make jianbing 24 hours a day, this year’s WRC showed not only cutting-edge (尖端的) inventions, but also Chinese culture and youth power. A fruit-picking robot attracted visitors’ attention. With the help of different kinds of sensors (傳感器) and an AI system, the robot can collect fruit according to its ripeness, quality and size. Wu Jiafeng, the exhibitor of the fruit-picking robot, told CCTV that more robotic technology will be used in agriculture (農(nóng)業(yè)) in the future, including robots for daily inspection (巡檢) and weeding (除草). Students from BDA School of the High School Affiliated to Renmin University of China (人大附中北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)學(xué)校) had their own exhibition at the WRC. Although they are young, the students brought fascinating inventions and ideas. For example, Wang Zirun, a junior student at the school, designed a three-dimensional parking facility (架空式立體停車機(jī)). Since there are usually too few parking spaces in older communities, Wang’s work aims to fit more cars into current parking spots. The facility works like a sky wheel with six parking spots. When cars need to be picked up, the facility rotates steadily, placing the car on the ground. How long did the World Robot Conference (WRC) 2022 last? 2 days 3 days 4 days 5 days Which kind of robot is mentioned in this passage? Human-like robots fruit-picking robots animal-like robots robots that can make jianbing What can help a fruit-picking robot work? Sensors AI systems ripeness A& B What is Wu Jiafeng? an exhibitior a visitor an inventor a designer Why did Wang Zirun design the three-dimensional parking facility? Because it is like a sky wheel with six parking spots. Because there are usually few parking spots in older communities. Because it can attract the visitors’ attention. Because it will be used in agriculture.",
    "用所給詞的適當(dāng)形式填空。每詞限用一次。 shut off support nod examine behave Mrs Brown when her students greeted her. The lights must when we leave the classroom. I believe John well next time. His parents many of his races since he became a runner on his school team. John what was wrong with his computer when I came back home.",
    "危ない!その中に入る_。 なあ かな な ぞ",
    "閱讀下面的文字,完成下面小題。 材料一: 劉姥姥吃畢了飯,拉了板兒過來,舔舌咂嘴的道謝。鳳姐笑道:“且請坐下,聽我告訴你老人家。方才的意思,我已知道了。①若論親戚之間,原該不等上門來就該有照應(yīng)才是。但如今家內(nèi)雜事太煩,太太漸上了年紀(jì),一時想不到也是有的。況是我近來接著管些事,都不知道這些親戚們。二則外頭看著雖是烈烈轟轟的,殊不知大有大的艱難去處,說與人也未必信罷。今兒你既老遠(yuǎn)的來了,又是頭一次見我張口,怎好叫你空回去呢??汕勺騼禾o我的丫頭們做衣裳的二十兩銀子,我還沒動呢,你若不嫌少,就暫且先拿了去罷。” 那劉姥姥先聽見告艱難,只當(dāng)是沒有,心里便突突的,后來聽見給他二十兩,喜的又渾身發(fā)癢起來,說道:“噯,我也是知道艱難的。但俗語說的‘瘦死的駱駝比馬大’,憑他怎樣,你老拔根寒毛比我們的腰還粗呢!” 周瑞家的見他說的粗鄙,只管使眼色止他。鳳姐看見,笑而不睬,只命平兒把昨兒那包銀子拿來,再拿一吊錢來,都送到劉姥姥的跟前。鳳姐乃道:“這是二十兩銀子,暫且給這孩子做件冬衣罷。若不拿著,就真是怪我了。這錢雇車坐罷。改日無事,只管來逛逛,方是親戚們的意思。天也晚了,也不虛留你們了,到家里該問好的問個好兒罷?!币幻嬲f,一面就站了起來。 劉姥姥只管千恩萬謝的,拿了銀子錢,隨了周瑞家的來至外面,仍從后門去了。 (選自《紅樓夢》第六回,有刪改) 材料二: ②那劉姥姥入了坐,拿起箸來,沉甸甸的不伏手。原是鳳姐和鴛鴦商議定了,單拿一雙老年四楞象牙鑲金的筷子與劉姥姥。劉姥姥見了,說道:“這叉爬子比俺那里鐵鍬還沉,那里拿的動?”說的眾人都笑起來。 只見一個媳婦端了一個盒子站在當(dāng)?shù)?一個丫鬟上來揭去盒蓋,里面盛著兩碗菜。李紈端了一碗放在賈母桌上。鳳姐兒偏揀了一碗鴿子蛋,放在劉姥姥桌上。賈母這邊說聲“請”,劉姥姥便站起身來,高聲說道:“老劉,老劉,食量大似牛,吃一個老母豬不抬頭。”說著,卻鼓著腮幫子,兩眼直視,一聲不語。眾人先是發(fā)怔。后來一聽,上上下下都哈哈大笑起來。湘云掌不住,一口飯都噴了出來;黛玉笑岔了氣,伏著桌子只叫“噯喲”;寶玉早滾到賈母懷里,賈母笑的摟著寶玉叫“心肝”;王夫人笑的用手指著鳳姐兒,只說不出話來;薛姨媽也掌不住,口里的茶噴了探春一裙子;探春手里的飯碗都合在迎春身上;惜春離了坐位,拉著他奶母叫揉一揉腸子。地下的無一個不彎腰屈背。也有躲出去蹲著笑去的,也有忍著笑上來替他姊妹換衣裳的。獨(dú)有鳳姐、鴛鴦二人掌著,還只管讓劉姥姥。劉姥姥拿起箸來,只覺不聽使,又說道:“這里的雞兒也俊,下的這蛋也小巧。怪俊的,我且抓得一個兒?!?眾人方住了笑,聽見這話,又笑起來。賈母笑的眼淚出來,琥珀在后捶著。賈母笑道:“這定是鳳丫頭促狹鬼兒鬧的,快別信他的話了?!蹦莿⒗牙颜潆u蛋小巧,鳳姐兒笑道:“一兩銀子一個呢,你快嘗嘗罷,冷了就不好吃了。”劉姥姥便伸箸子要夾,那里夾的起來,③滿碗里鬧了一陣,好容易撮起一個來,才伸著脖子要吃,偏又滑下來,滾在地下,忙放下箸子要親自去撿,早有地下的人撿了出去了。劉姥姥嘆道:“一兩銀子,也沒聽見響聲兒就沒了。”眾人已沒心吃飯,都看著他笑。 (選自《紅樓夢》第四十回,有刪改) 材料三: 只見平兒同劉姥姥帶了一個小女孩兒進(jìn)來,說:“我們姑奶奶在那里?”平兒引到炕邊,劉姥姥便說:“請姑奶奶安。”鳳姐睜眼一看,不覺一陣傷心,說:“姥姥你好?怎么這時候才來?你瞧你外孫女兒也長的這么大了。”劉姥姥看著鳳姐骨瘦如柴,神情恍惚,心里也就悲慘起來,說:“我的奶奶,怎么這幾個月不見,就病到這個分兒。我糊涂的要死,怎么不早來請姑奶奶的安!”便叫青兒給姑奶奶請安。青兒只是笑,鳳姐看了倒也十分喜歡,便叫小紅招呼著。 這里平兒恐劉姥姥話多,攪煩了鳳姐,便拉了劉姥姥說:“你提起太太來,你還沒有過去呢。我出去叫人帶了你去見見,也不枉來這一趟。”劉姥姥便要走。鳳姐道:“忙什么,你坐下,我問你近來的日子還過的么?”劉姥姥千恩萬謝的說道:“我們?nèi)舨徽讨媚棠獭?說著,指著青兒說:“他的老子娘都要餓死了。如今雖說是莊家人苦,家里也掙了好幾畝地,又打了一眼井,種些菜蔬瓜果,一年賣的錢也不少,盡夠他們嚼吃的了。這兩年姑奶奶還時常給些衣服布匹,在我們村里算過得的了。阿彌陀佛,前日他老子進(jìn)城,聽見姑奶奶這里動了家,我就幾乎唬殺了。虧得又有人說不是這里,我才放心。后來又聽見說這里老爺升了,我又喜歡,就要來道喜,為的是滿地的莊家來不得。昨日又聽說老太太沒有了,我在地里打豆子,聽見了這話,唬得連豆子都拿不起來了,就在地里狠狠的哭了一大場。我和女婿說,我也顧不得你們了,不管真話謊話,我是要進(jìn)城瞧瞧去的。④我女兒女婿也不是沒良心的,聽見了也哭了一回子,今兒天沒亮就趕著我進(jìn)城來了。我也不認(rèn)得一個人,沒有地方打聽,一徑來到后門,進(jìn)了門找周嫂子,再找不著,撞見一個小姑娘,說周嫂子他得了不是了,攆了"
};

String[] stemTexts = {
    "化學(xué)的研究對象是 A.物質(zhì) B物體 C.運(yùn)動 D.實(shí)驗(yàn)",
    "銀是一種銀白色金屬,密度較大,具有良好的 導(dǎo)電性,長期放置會被氧化而發(fā)黑、其中屬 于銀的化學(xué)性質(zhì)的是 () A.銀白色 B.密度較大 C.導(dǎo)電性良好 D.能被氧化",
    "非洲最高峰乞力馬扎羅山是著名的“赤道雪山”,導(dǎo)致其頂部出現(xiàn)積雪的 因素是()。 A.緯度 B.海陸 C.地形 D.洋流",
    " 復(fù)合題題干 (1)小問1 A. 選 4.項(xiàng)1 B. 選項(xiàng)2 C. 選項(xiàng)3 D. 選項(xiàng)4 (2)小問2 A. 選項(xiàng)1 B. 選項(xiàng)2 C. 選項(xiàng)3 D. 選項(xiàng)4",
    "如圖所示 一、”認(rèn)真細(xì)致”填一填!(24分,每格1分。)1.在 $$1.4 \\dot{4}\\dot{5},1. \\dot{4}5,1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1. \\dot{5},1.1.$$ 這四個數(shù)中,最大的數(shù)是(),最小的數(shù)是()2.根據(jù)356×24=8544,那么35.6×()-()×240=85.44。",
    "計(jì)算下面各題. (1)27×11. (3)39×11. (5)92×11. (6)98×11.",
    "—How many birds do you see? — A. I have 11. B. I'm 11. C. I see 11.",
    "不等式 7?6x?x^2>0 的解集為( ) A. [?7,1] B. (?7,1) C. (?∞,?7]∪[1.+∞) D. (?∞,?7)∪(1.+∞)",
    "zhaoquīlxiěchūshù&四、找規(guī)律寫出數(shù)字。(16分)1.&4610142.510153045",
    "給下列加點(diǎn)的字注音或根據(jù)拼音寫漢字。, 阻礙() 墮落() jue ()擇, jiao ()辯 強(qiáng)詞奪理()",
    "試題分析:本文敘述的是在上學(xué)時得知母親去世的消息,我不斷懷念母親,認(rèn)為他是我心中的英雄,是個偉大的人。 細(xì)節(jié)理解題。根據(jù)第一段When we returned to school,my teacher told me to go to the headmaster‘s office,當(dāng)我們返回學(xué)校時,老師把我們叫到校長辦公室。故得出C項(xiàng)。 細(xì)節(jié)理解題。根據(jù)第一段The police officer told me what had happened and we went to pick my sister up,警察告訴我發(fā)生的事,所以選D項(xiàng)。 細(xì)節(jié)理解題。根據(jù)第二段On the next day,the headmaster came and told my two teachers what had happened,第二天,校長過來告訴我的兩個老師所發(fā)生的事 根據(jù)When my teacher took me outside,my sister ran up to me. She started crying,“She‘s gone. Teresa,mommy’s gone.得知母親去世。故選B項(xiàng)。 細(xì)節(jié)推斷題。根據(jù)最后一段When someone asks me who my hero is,I tell them,my mother. My mother lives every day. That is what makes her a true hero B項(xiàng)。 細(xì)節(jié)理解題。根據(jù)最后一段When someone asks me who my hero is,I tell them,my mother,母親是個偉大的人,故選D項(xiàng)。",
    "\"I love you\" might be one of the most important sentences in the English language. It shows the closeness among family members and friends. In Mandarin, \"I love you\" translates as “我愛你”, but the way it's used in China might be a little different, and Chinese are wondering why. The Global Times reports that two online videos showing children telling their parents \"I love you\" have been widely spread in China. The first, filmed by an Anhui TV station, shows a number of college students telling their parents they love them. The answers are mixed. \"Are you drunk?\" asked one parent. In another similar video, a father even said— \"I am going to a meeting, so cut the crap.\" Even the positive attitudes make it clear that the words are expressed rarely. \"I am so happy you called to say that. It is the happiest thing that happened to me in 2014,\" one parent answered. However, Chinese families hardly use those words. \"The parents' answers show that many Chinese are not good at expressing positive feelings,\" Xia Xueluan, a Sociologist from Peking University, told the Global Times. \"They are used to educating children with negative language.\" This isn't the first time that China has done some soul-searching about familial love — last year China Daily asked a lot of people if they said 'I love you' to their parents, lovers, and children. \"I have never said 'I love you' to my family, and I don't think I will in the future,\" one 56-year-old told the paper, \"Saying it aloud is embarrassing for me.\" Still, that doesn't mean that love can't be expressed. In another article, China Daily spoke to Zhao Mengmeng, a 31-year-old woman who said she had never told her father she loved him face-to-face. Sometimes actions speak louder than words, however — Zhao gave her father, a photo album featuring photographs of them together on every one of her birthdays in June 2012. The pictures were popular online, being forwarded hundreds of thousands of times on Weibo. Her father was very excited when he heard about it. What does the underlined word Mandarin probably mean? French Japanese English Chinese What can we infer(推斷) from the parents’ answers in Paragragh3 and 4? Some parents don’t love their children. Parents in China are too busy. Most Chinese students rarely express their positive feelings to their parents. Children in China are always taught negative language. What will that 56-year-old person feel if he/she says “I love you” to the families? embarrassed excited proud unhappy Why did Zhao give her father a photo album instead of saying \"I love you\"? The album is more expensive. His father likes the album better. She thinks actions speak louder than words sometimes. She hates saying \"I love you\" to her father. What’s the best title for the passage? I Love You A Photo Album Two Online Videos Family members",
    "閱讀下面短文, 完成短文后的問題。 In many English homes, people eat four meals a day. Breakfast is a very big meal. People have eggs, tomatoes or bread and drink tea or coffee at breakfast. For many people, lunch is a quick meal. In sandwich bars, office workers can buy all kinds of salad sandwiches and bread. School children often have their meals at school, but many just take a sandwich, a drink and some fruit from home. Afternoon tea comes between lunch and evening meal. \"Tea\" means(意味著)two things. It is a drink and a meal. Some people have afternoon tea with sandwiches, cakes and a cup of tea. \"Dinner” is the main(主要的)meal of the day. They usually have the evening meal quite early, all the the family often eat together between six and eight. And they eat all kinds of things. First, they have soup, then they have meat, fish and vegetables. After that, they eat some fruit, like bananas, apples or oranges. Some people also eat ice-cream after dinner. How many meals do many English people have? What do English people have at breakfast ? Where do school children often have their lunch? Does \"afternoon tea\" only mean a drink? What do you think of \"Dinner\"? Why?",
    "What do you think robots are able to do? You might be able to find one that fits your needs at the World Robot Conference (WRC) 2022 in Beijing. It was held from Aug 18 to 21, more than 500 robots were on display at the WRC. From human-like robots that look surprisingly lively to robots that can make jianbing 24 hours a day, this year’s WRC showed not only cutting-edge (尖端的) inventions, but also Chinese culture and youth power. A fruit-picking robot attracted visitors’ attention. With the help of different kinds of sensors (傳感器) and an AI system, the robot can collect fruit according to its ripeness, quality and size. Wu Jiafeng, the exhibitor of the fruit-picking robot, told CCTV that more robotic technology will be used in agriculture (農(nóng)業(yè)) in the future, including robots for daily inspection (巡檢) and weeding (除草). Students from BDA School of the High School Affiliated to Renmin University of China (人大附中北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)學(xué)校) had their own exhibition at the WRC. Although they are young, the students brought fascinating inventions and ideas. For example, Wang Zirun, a junior student at the school, designed a three-dimensional parking facility (架空式立體停車機(jī)). Since there are usually too few parking spaces in older communities, Wang’s work aims to fit more cars into current parking spots. The facility works like a sky wheel with six parking spots. When cars need to be picked up, the facility rotates steadily, placing the car on the ground. How long did the World Robot Conference (WRC) 2022 last? 2 days 3 days 4 days 5 days Which kind of robot is mentioned in this passage? Human-like robots fruit-picking robots animal-like robots robots that can make jianbing What can help a fruit-picking robot work? Sensors AI systems ripeness A& B What is Wu Jiafeng? an exhibitior a visitor an inventor a designer Why did Wang Zirun design the three-dimensional parking facility? Because it is like a sky wheel with six parking spots. Because there are usually few parking spots in older communities.Her father was very excited when he heard about it. Because it can attract the visitors’ attention. Because it will be used in agriculture.",
    "如圖所示 A.用所給動詞的適當(dāng)形式填空,每詞限用一次.(10 分) shut, reflect, perform, stick, sense 1. Laura _that Bruce didn't believe her. 2.Don't worry. The gas in my house _off before I leave home. 3.Paul loves Africa. His music_ his interest in African culture. 4.I _to running since five years ago. 5. -I called you at eight last night, but you didn't answer my phone. _a wonderful play for my family. Which made them v",
    "授業(yè)中は隣の人と話を( )。靜かにしてください。 A. しなさい B. するな C. するなあ D. するぞ",
    "三十一、閱讀下文,回答問題。原是鳳姐和鴛鴦商議定了,單拿一雙老年四楞象牙鑲金的筷子與劉姥姥。劉姥姥見了,說道:”這叉爬子比俺那里鐵锨還沉,那里犟的過他?!闭f的眾人都笑起來。只見一個媳婦端了一個盒子站在當(dāng)?shù)?一個丫鬟上來揭去盒蓋,里面盛著兩碗菜。李紈端了一碗放在賈母桌上。鳳姐兒偏揀了一碗鴿子蛋放在劉姥姥桌上。賈母這邊說聲”請”,劉姥姥便站起身來,高聲說道:”老劉,老劉,食量大似牛,吃一個老母豬不抬頭?!弊约簠s鼓著腮不語。眾人先是發(fā)怔,后來一聽,上上下下都哈哈的大笑起來。史湘云撐不住,一口飯都噴了出來;林黛玉笑岔了氣,伏著桌子叫”噯喲”;寶玉早滾到賈母懷里,賈母笑的摟著寶玉叫”心肝”;王夫人笑的用手指著鳳姐兒,只說不出話來;薛姨媽也撐不住,口里茶噴了探春一裙子;探春手里的飯碗都合在迎春身上;惜春離了坐位,拉著他奶母叫揉一揉腸子。地下的無一個不彎腰屈背,也有躲出去蹲著笑去的,也有忍著笑上來替他姊妹換衣裳的,獨(dú)有鳳姐鴛鴦二人撐著,還只管讓劉姥姥。劉姥姥拿起箸來,只覺不聽使,又說道:”這里的雞兒也俊,下的這蛋也小巧,怪俊的。我且攮一個?!北娙朔阶×诵?聽見這話又笑起來。賈母笑的眼淚出來,琥珀在后捶著。賈母笑道:”這定是鳳丫頭促狹鬼兒鬧的,快別信他的話了?!蹦莿⒗牙颜潆u蛋小巧,要禽攮一個,鳳姐兒笑道:”一兩銀子一個呢,你快嘗嘗罷,那冷了就不好吃了。”劉姥姥便伸箸子要夾,那里夾的起來,滿碗里鬧了一陣好的,好容易撮起一個來,才伸著脖子要吃,偏又滑下來滾在地下,忙放下箸子要親自去撿,早有地下的人撿了出去了。劉姥姥嘆道:”一兩銀子,也沒聽見響聲兒就沒了。'1.本語段節(jié)選自名著《紅樓夢》,作者是_(朝代)的_(人名)。2.請用簡潔的語言概括選文內(nèi)容。3.結(jié)合選文內(nèi)容分析劉姥姥形象。"
};
計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 64毫秒, 文本長度: 27/27
計(jì)算試題相似度(萊溫斯坦) 相似度: 100.0, 耗時: 3毫秒, 文本長度: 27/27
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 100.0, 耗時: 5毫秒, 文本長度: 27/27

計(jì)算試題相似度(杰卡德) 相似度: 97.67, 耗時: 1毫秒, 文本長度: 83/81
計(jì)算試題相似度(萊溫斯坦) 相似度: 97.14, 耗時: 1毫秒, 文本長度: 83/81
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 96.88, 耗時: 1毫秒, 文本長度: 83/81

計(jì)算試題相似度(杰卡德) 相似度: 97.62, 耗時: 1毫秒, 文本長度: 61/59
計(jì)算試題相似度(萊溫斯坦) 相似度: 96.0, 耗時: 0毫秒, 文本長度: 61/59
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 95.45, 耗時: 0毫秒, 文本長度: 61/59

計(jì)算試題相似度(杰卡德) 相似度: 94.44, 耗時: 1毫秒, 文本長度: 81/79
計(jì)算試題相似度(萊溫斯坦) 相似度: 96.49, 耗時: 0毫秒, 文本長度: 81/79
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 96.08, 耗時: 1毫秒, 文本長度: 81/79

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 308/308
計(jì)算試題相似度(萊溫斯坦) 相似度: 100.0, 耗時: 3毫秒, 文本長度: 308/308
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 308/308

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 49/47
計(jì)算試題相似度(萊溫斯坦) 相似度: 94.59, 耗時: 0毫秒, 文本長度: 49/47
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 93.55, 耗時: 0毫秒, 文本長度: 49/47

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 67/67
計(jì)算試題相似度(萊溫斯坦) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 67/67
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 67/67

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 78/78
計(jì)算試題相似度(萊溫斯坦) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 78/78
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 78/78

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 53/53
計(jì)算試題相似度(萊溫斯坦) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 53/53
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 53/53

計(jì)算試題相似度(杰卡德) 相似度: 93.94, 耗時: 0毫秒, 文本長度: 56/54
計(jì)算試題相似度(萊溫斯坦) 相似度: 94.44, 耗時: 0毫秒, 文本長度: 56/54
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 93.33, 耗時: 0毫秒, 文本長度: 56/54

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 2毫秒, 文本長度: 742/733
計(jì)算試題相似度(萊溫斯坦) 相似度: 98.69, 耗時: 3毫秒, 文本長度: 742/733
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 98.26, 耗時: 2毫秒, 文本長度: 742/733

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 2841/2831
計(jì)算試題相似度(萊溫斯坦) 相似度: 99.61, 耗時: 19毫秒, 文本長度: 2841/2831
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 99.61, 耗時: 6毫秒, 文本長度: 2841/2831

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 1228/1161
計(jì)算試題相似度(萊溫斯坦) 相似度: 94.18, 耗時: 3毫秒, 文本長度: 1228/1161
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 94.15, 耗時: 1毫秒, 文本長度: 1228/1161

計(jì)算試題相似度(杰卡德) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 2087/2138
計(jì)算試題相似度(萊溫斯坦) 相似度: 97.59, 耗時: 10毫秒, 文本長度: 2087/2138
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 97.54, 耗時: 3毫秒, 文本長度: 2087/2138

計(jì)算試題相似度(杰卡德) 相似度: 66.67, 耗時: 1毫秒, 文本長度: 308/396
計(jì)算試題相似度(萊溫斯坦) 相似度: 26.27, 耗時: 0毫秒, 文本長度: 308/396
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 79.35, 耗時: 1毫秒, 文本長度: 308/396

計(jì)算試題相似度(杰卡德) 相似度: 28.13, 耗時: 0毫秒, 文本長度: 22/54
計(jì)算試題相似度(萊溫斯坦) 相似度: 14.63, 耗時: 0毫秒, 文本長度: 22/54
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54

計(jì)算試題相似度(杰卡德) 相似度: 47.45, 耗時: 1毫秒, 文本長度: 2000/743
計(jì)算試題相似度(萊溫斯坦) 相似度: 32.59, 耗時: 4毫秒, 文本長度: 2000/743
計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德) 相似度: 37.17, 耗時: 2毫秒, 文本長度: 2000/743

2.3.2、測試n-gram對計(jì)算相似度影響

**測試結(jié)論:**設(shè)置n-gram從1-10,選取一個日志記錄的超時的CASE,測試n-gram不同的時候?qū)ο嗨贫鹊挠绊?/p>

  • 性能方面:性能和原來的杰卡德相差不大。

  • 效果方面:一般來看,n-gram值越大,計(jì)算得到的相似性呈現(xiàn)遞減趨勢,但是不絕對。

- search text:危ない!その中に入る_。 なあ かな な ぞ
- stem text:授業(yè)中は隣の人と話を( )。靜かにしてください。 A. しなさい B. するな C. するなあ D. するぞ
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 28.13, 耗時: 81毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 64.54, 耗時: 24毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 33.02, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 38.46, 耗時: 1毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 22/54
 
- search text:郊狼體型較小,只有灰狼體型的1/3,平時以嚙齒類生物為食,偶爾也吃灰狼的食物殘骸。黃石公園歷史上為保護(hù)麋鹿曾大規(guī)模獵殺園中的灰狼?;依墙^跡后,郊狼生活習(xí)性漸漸從單獨(dú)捕獵嚙齒生物轉(zhuǎn)變?yōu)楹献鲊C麋鹿中衰老或幼年個體。后公園重新引入灰狼,回歸黃石的灰狼群選擇先獵殺郊狼群,郊狼被迫恢復(fù)曾經(jīng)的生活習(xí)性。下列說法正確的是( ) 灰狼回歸后,與郊狼的種間關(guān)系是捕食 灰狼屬于頂極掠食者,流入灰狼的能量最多 原來灰狼與郊狼共存,因?yàn)槎咧g生態(tài)位高度重疊 麋鹿數(shù)量提升后,郊狼選擇捕食麋鹿, 
- stem text:灰狼分布于北美、歐亞大陸和北非等地,原本是世界上廣泛分布的物種,但是由于近一二百年來大量地捕獵和生態(tài)環(huán)境的破壞,其全世界各地的種群數(shù)量都在急劇下降,到了瀕危的邊緣。分布在黃石國家公園附近的灰狼亞種也沒能逃此厄運(yùn)。 黃石的灰狼種群被根除后,當(dāng)?shù)氐镊缏狗N群數(shù)量開始急劇增長,而黃石國家公園的環(huán)境條件急劇惡化。公園內(nèi)麋鹿種群成倍地繁殖擴(kuò)大,而山楊和柳樹等落葉樹種遭受到嚴(yán)重的過度取食。情急之下,公園管理部門開始了誘捕、轉(zhuǎn)移和捕殺這些麋鹿的行動。雖然這一方法阻止了生態(tài)環(huán)境繼續(xù)惡化,但也并未能改善已被破壞的生態(tài)環(huán)境。 $$1995$$年,灰狼被重新引入黃石公園?;依且胫?科
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 22.22, 耗時: 3毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 60.85, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 43.32, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 30.85, 耗時: 2毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 27.96, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 17.91, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 17.85, 耗時: 0毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 17.79, 耗時: 0毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 17.72, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 239/1316
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 239/1316
 
- search text:我要改正上課做小動作的不正確的毛病。
- stem text:在社會生活中,我們總是要遵守各種各樣的社會秩序。下列做法中,你認(rèn)同的有( ) ①上課認(rèn)真聽講,不做小動作 ②不在樓道內(nèi)追逐打鬧 ③放學(xué)時,按順序走出教室,不擁擠 ④在課堂上吃零食 ①②④ ①③④ ②③④ ①②③
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 14.93, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 27.19, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 16.35, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 15.53, 耗時: 1毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 14.71, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 18/105
 
- search text: 一)水認(rèn)地主的大多數(shù)是有抗日要求的,一部分開明紳士 是贊成民主改革的……故于實(shí)行減租減息之后,又須實(shí)行交租 交息……借以聯(lián)合地主階級一致抗日, ——摘編自《中共中央關(guān)于抗日根據(jù)地土地政策的決定》 材料三第一條廢除封建性及半封建性剝削的土地制度,實(shí) 行耕者有其田的土地制度。 第二條 廢除一切地主的土地所有權(quán) ——摘編自《中國土地法大綱) (1)以上三則材料是中國共產(chǎn)黨在不同歷史時期的土地政策 請你任選其一,對這一政策起到的作用加以分析。(3分)
- stem text:下表所示為中國共產(chǎn)黨在新民主主義革命時期的土地政策匯總,這表明( ) 時間 文件 土地政策 1929年4月 興國縣《土地法》 沒收一切公共土地及地主階級的土地 1942年1月 《中共中央關(guān)于抗日根據(jù)地土地改革的決定》 地主減租減息,農(nóng)民交租交息 1947年10月 《中國土地法大綱》 廢除封建性及半封建性剝削的土地制度,實(shí)現(xiàn)耕者有其田的土地制度 土地革命的依靠力量發(fā)生了改變 中共依據(jù)形勢變化調(diào)整政策 農(nóng)民革命運(yùn)動的積極性得到激發(fā) 民主革命的性質(zhì)發(fā)生了變化
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 37.34, 耗時: 1毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 69.15, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 87.17, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 96.08, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 98.22, 耗時: 1毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 98.21, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 98.21, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 98.2, 耗時: 1毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 98.19, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 98.18, 耗時: 0毫秒, 文本長度: 224/228
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 98.17, 耗時: 0毫秒, 文本長度: 224/228
 
- search text:小紅的爸爸是一名出租車司機(jī),這星期前五天的收入情況如下表。(單位:元) 星期一 星期二 星期三 星期四 星期五 378 269 518 (1)星期二比星期一和星期三的總收入少209元,星期二收入多少元?, 
- stem text:如圖所示 小檑的爸爸是一位出租車司機(jī)。星期一早上出車時,里程表的讀數(shù)是65千米。每天收車時,小檑都記錄了當(dāng)時的里程讀數(shù),共計(jì)錄了五天。(單位:千米)星期一星期二星期三星期四星期五272│468|675|675│906星期二比星期一少行駛了草稿米。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 42.47, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 59.05, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 74.87, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 76.91, 耗時: 1毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 83.33, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 83.19, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 83.05, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 82.91, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 103/123
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 103/123
 
- search text:xS_5= C.20 D.15 南水北調(diào)工程緩解了北方一些地區(qū)水資源短缺問題,其中一部分水著入某水庫.已知該水庫水位為海拔148.5m時,相 140.0km^2x 應(yīng)水面的面積為140.0km2;水位為海拔157.5m時,相應(yīng)水面的面積為180.0km2,將該水庫在這兩個水位間的形狀看 180.0km^2x 148.5m 作一個棱臺,則該水庫水位從海拔148.5m上升到157. 5m時,增加的水量約為(√~2.65) ( 157.5m (sqrt{7}≈2.65) A.1.0×10^9m^3 B.1.2×10^9m^3 C.1.4×10^9m^3 D.1.6×
- stem text:水庫是我國防洪廣泛采用的工程措施之一.已知某水庫水位為海拔 155.5m 時,相應(yīng)水面的面積為 180.0km^2 ;水位為海拔 146.5m 時,相應(yīng)水面的面積為 140.0km^2 .將該水庫在這兩個水位間的形狀看作一個棱臺,則該水庫水位從海拔 155.5m 下降到 146.5m 時,減少的水量約為 (sqrt{7}≈2.65) ( ) 1.0×10^9m^3 1.2×10^9m^3 1.4×10^9m^3 1.6×10^9m^3
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 50.45, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 78.67, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 72.25, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 71.55, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 70.72, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 71.52, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 71.49, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 71.4, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 71.2, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 71.97, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 70.79, 耗時: 0毫秒, 文本長度: 299/219
 
- search text:方位角的表示,
- stem text:若數(shù)軸經(jīng)過折疊,﹣1表示的點(diǎn)與3表示的點(diǎn)重合,則﹣2018表示的點(diǎn)與數(shù) 表示的點(diǎn)重合.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 12.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 59.69, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 57.14, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 7/43

另外一個CASE

- search text:xS_5= C.20 D.15 南水北調(diào)工程緩解了北方一些地區(qū)水資源短缺問題,其中一部分水著入某水庫.已知該水庫水位為海拔148.5m時,相 140.0km^2x 應(yīng)水面的面積為140.0km2;水位為海拔157.5m時,相應(yīng)水面的面積為180.0km2,將該水庫在這兩個水位間的形狀看 180.0km^2x 148.5m 作一個棱臺,則該水庫水位從海拔148.5m上升到157. 5m時,增加的水量約為(√~2.65) ( 157.5m (sqrt{7}≈2.65) A.1.0×10^9m^3 B.1.2×10^9m^3 C.1.4×10^9m^3 D.1.6×
- stem text:水庫是我國防洪廣泛采用的工程措施之一.已知某水庫水位為海拔 155.5m 時,相應(yīng)水面的面積為 180.0km^2 ;水位為海拔 146.5m 時,相應(yīng)水面的面積為 140.0km^2 .將該水庫在這兩個水位間的形狀看作一個棱臺,則該水庫水位從海拔 155.5m 下降到 146.5m 時,減少的水量約為 (sqrt{7}≈2.65) ( ) 1.0×10^9m^3 1.2×10^9m^3 1.4×10^9m^3 1.6×10^9m^3
 
計(jì)算試題相似度(杰卡德,按照字符) 相似度: 50.45, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 78.67, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 72.25, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 71.55, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 70.72, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 71.52, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 71.49, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 71.4, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 71.2, 耗時: 0毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 71.97, 耗時: 1毫秒, 文本長度: 299/219
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 70.79, 耗時: 0毫秒, 文本長度: 299/219

2.3.3、召回CASE1

測試結(jié)論:本測試CASE發(fā)現(xiàn)改進(jìn)杰卡德在n-gram為1、2、3的時候選取的相似結(jié)果文本比原生杰卡德選取的相似結(jié)果文本余弦相似度要高一些,但是試題匹配度人為判斷還是不如原生杰卡德算法,效率差別不大。

搜索題干:

閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?/strong>

其他試題題干:

當(dāng)前試題:1561285791080448,杰卡德相似度:1.0,題干:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?當(dāng)前試題:1561273645809664,杰卡德相似度:0.25,題干:閱讀下面二則《孟子 》選段,回答問題。 ①孟子曰:“不挾長,不挾貴,不挾兄弟而友。友也者,友其德也,不可以有挾也。孟獻(xiàn)子,百乘之家也,有友五人焉:樂正裘,牧仲,其三人.則予忘之矣。獻(xiàn)子之與此五人者友也,無獻(xiàn)子之家者也。此五人者,亦有獻(xiàn)子之家,則不與之友矣。非惟百乘之家為然也,雖小國之君亦有之?!?(《孟子·萬章下》) ②孟子謂萬章曰:“一鄉(xiāng)之善士,斯友一鄉(xiāng)之善士;一國之善士,斯友一國之善土;天下之善士斯友天下之善士。以友天下之善士為未足,又尚論古之人。頌其詩,讀其書,不知其人,可乎?是以論其事也,是尚友 也。(《孟子·萬章下》) 下列對原文內(nèi)容分析不正確的一項(xiàng)是( ) 與今人交友務(wù)必要頌讀其詩文,做到“知其人”后方可結(jié)交。 “又尚論古之人”的意思是:又向上追論古代的人。 孟子說的“不挾”即不要有倚仗的念頭。 選段②,孟子以層層推進(jìn)的形式闡述了自己對于交友的認(rèn)識。 【小題2】請你根據(jù)上面的文字,談?wù)劽献訉τ诮挥训恼J(rèn)識。
當(dāng)前試題:1561251360194560,杰卡德相似度:0.2297872340425532,題干:閱讀下列《孟子》選段,按要求回答問題。 陳臻問日:,“前日子齊,王饋兼金一百而不受;于宋,饋七十錳而受;于薛,饋五十鎰而受。前日之不受是,則今日之受非也;今日之受是,則前日之不受非也。夫子必居一于此矣?!泵献釉?“皆是也。當(dāng)在宋也,予將有遠(yuǎn)行,行者必以贐;辭曰:‘饋贐?!韬螢椴皇?當(dāng)在薛也,予有戒心;辭日: ‘聞戒,故為兵饋之。’.予何為不受?若于齊,則未有處也。無處而饋之,是貨之也。焉有君子而可以貨取乎?” ——《孟子·公孫丑下》 孟子曰:“大人者,言不必信,行不必果,惟義所在。” ——《孟子·離婁下》 請問這兩段話共同體現(xiàn)了孟子怎樣的行為準(zhǔn)則?請結(jié)合語段簡要說明。
當(dāng)前試題:1561323174854656,杰卡德相似度:0.23317307692307693,題干:閱讀下面的文言文,完成小題。 孟子將朝王,王使人來曰:“寡人如就見者也,有寒疾,不可以風(fēng)。朝,將視朝,不識可使寡人得見乎?”對曰:“不幸而有疾,不能造朝?!?明日,出吊于東郭氏。公孫丑曰:“昔者辭以病,今日吊,或者不可乎?”曰:“昔日疾,今日愈,如之何不吊?”王使人問疾,醫(yī)來。孟仲子①對曰:“昔者有王命,有采薪之憂②,不能造朝。今病小愈,趨造于朝,我不識能至否乎?”使數(shù)人要于路,曰:“請必?zé)o歸,而造于朝!”不得已而之景丑氏宿焉。 景子曰:“內(nèi)則父子,外則君臣,人之大倫也。父子主恩,君臣主敬。丑見王之敬子也,未見所以敬王也。”曰:“惡!是何言也!齊人無以仁義與王言者,豈以仁義為不美也?其心曰‘是何足與言仁義也 ’云爾,則不敬莫大乎是。我非堯舜之道不敢以陳于王前,故齊人莫如我敬王也?!本白釉?“否,非此之謂也?!抖Y》曰:‘父召,無諾;君命召,不俟駕。’固將朝也,聞王命而遂不果③,宜與夫禮若不相似然?!?曰:“豈謂是與?天下有達(dá)尊④三:爵一,齒一,德一。朝廷莫如爵,鄉(xiāng)黨莫如齒,輔世長民莫如德。惡得有其一以慢其二哉?故將大有為之君,必有所不召之臣;欲有謀焉,則就之。其尊德樂道,不如是,不足與有為也?!?(摘自《孟子·公孫丑下》) [注]①孟仲子:孟子的堂兄弟,跟孟子學(xué)習(xí)。②采薪之憂:謂有病不能上山打柴,是疾病的代詞,為當(dāng)時交際的習(xí)慣語。③不果:終于沒有實(shí)行。④達(dá)尊:普遍尊貴的事。 對下列句子中加點(diǎn)的詞的解釋,不正確的一項(xiàng)是( ) 寡人如就見者也如:應(yīng)當(dāng)。 君命召,不俟駕俟:等待。 不識可使寡人得見乎得:能夠。 使數(shù)人要于路要:要挾、威脅。 【小題2】下列詞語中,加點(diǎn)字的意義和用法相同的一項(xiàng)是( ) ①不得已而之景丑氏宿焉②猶且從師而問焉 ①請必?zé)o歸,而造于朝②吾嘗終日而思矣 ①未見所以敬王也②所以遣將守關(guān)者,備他盜之出入與非常也。 ①豈謂是與②吾王庶幾無疾病與 【小題3】本文的人物形象很生動,為了達(dá)到自己的目的,齊王、孟子、孟仲子都說過假話。根據(jù)原文內(nèi)容判斷,下面說的是真話的一句是 ( ) 寡人如就見也,有寒疾,不可以風(fēng) 不幸而有疾,不能造朝 請必?zé)o歸,而造于朝 今病小愈, 趨造于朝 【小題4】下列對原文有關(guān)內(nèi)容的分析和概括,不正確的一項(xiàng)是( ) 本文通過孟子不接受齊王的召見,表明了孟子對君臣關(guān)系的看法與態(tài)度,他認(rèn)為君臣關(guān)系應(yīng)建立在仁義的基礎(chǔ)上,國君應(yīng)該禮賢下士,謙遜待人。 孟子認(rèn)為國君的尊貴不應(yīng)該表現(xiàn)在地位的優(yōu)越上,臣子對國君的恭順不應(yīng)該只停留在禮節(jié)形 式上。 孟子還認(rèn)為國君不能因?yàn)樽约旱赂咄?就輕慢了地位和年齡比自己低的臣子,國君應(yīng)該表現(xiàn)出尊德樂道的風(fēng)范。 景丑氏認(rèn)為孟子對齊王不恭敬,孟子本來要見國君,可是一聽到齊王的命令反而不去了,景子覺得孟子這種做法與《禮記》上說的不相合。 【小題5】把下列句子翻譯成現(xiàn)代漢語。 ①朝,將視朝,不識可使寡人得見乎?” ②故將大有為之君,必有所不召之臣;欲有謀焉,則就之。 ③危而不持,顛而不扶,則將焉用彼相矣。 ④狗彘食人食而不知檢,涂有餓莩而不知發(fā)。
當(dāng)前試題:1561237488615424,杰卡德相似度:0.5041666666666667,題干:閱讀文化經(jīng)典《孟子》,按要求答題。 孟子謂戴不勝①曰:“子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?” 曰:“使齊人傅之。” 曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣;引而置之莊岳之間數(shù)年②,雖日撻而求其楚,亦不可得矣。子謂薛居州③,善士也,使之居于王所。在于王所者,長幼卑尊皆薛居州也,王誰與為不善?在王所者,長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?” (選自《孟子·滕文公下》) [注釋] ①戴不勝:宋臣。②莊岳:莊,街名;岳,里名,都在齊都城臨淄城內(nèi)。這里代指齊都中的鬧市區(qū)。③薛居州:宋國人。 下列各項(xiàng)中,對上面《孟子》選段的理解,不正確的一項(xiàng)是( ) 孟子認(rèn)為一個齊國人教楚國大夫的兒子學(xué)齊國話,雖然周圍有許多楚國人干擾他,但只要天天鞭打逼他學(xué)齊國話,就有可能學(xué)會的。 孟子認(rèn)為把楚國大夫的兒子帶到齊國都城的鬧市上住上幾年,即使天天鞭打他,要他講楚國話,也不可能的了。 如果在王宮中的人,不論年齡大小、地位高低,都是薛居州那樣的人.那么宋王就不能同誰一起干壞事了。 “一薛居州,獨(dú)如宋王何?”說明一個薛居州,不能對宋王起到重要作用。 請用一個成語概括選段的主要內(nèi)容,并分析孟子的觀點(diǎn)。(用自己的話回答)
當(dāng)前試題:1561241502400512,杰卡德相似度:0.5469387755102041,題干:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰: “子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸,使楚人傅諸?”(1)曰:“使齊人傅之?!?曰:“一齊人傅之,歡楚人咻之,(2)雖日撻而求其齊也不可得矣;(3)引而置之莊岳之間數(shù)年,(4)雖日撻而求其楚亦不可得矣。子謂薛居州善士 也,(5使之居于王所。在于王所者長幼卑尊皆薛居州也,王誰與為不善?在 王所者長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?”(6) 【注釋】 (1)傅:朱熹《集注》云:“教也?!?2)淋(xiū休):為“喧嘩”。(3)撻:責(zé)打。(4)莊岳:朱熹《集注》云:“齊街里名也?!?5)薛居州: 趙注云:“宋之善上也?!?6)獨(dú):王引之《經(jīng)傳釋詞》云:“獨(dú)猶將也?!?(1)下列各項(xiàng)中,對上面選段的理解不正確的一項(xiàng)是( ) A.孟子用設(shè)喻的方法反問戴不勝,楚國大夫的兒子要學(xué)會說齊國話,是找齊國的人來教他好呢,還是找楚國的人來教他好呢? B.孟子認(rèn)為如果一個齊國人來教他,卻有許多楚國人在他周圍用楚國話來干擾他,即使每天鞭打他,要求他說齊國話,那也是不可能的。 C.同樣的道理,如果在王宮中的人,無論年齡大小的還是地位高低的都居住在薛居州那里,那么君王和誰去做壞事呢? D.如果國君周圍多是好人,那么國君也就會和大家一起向善做好事。相反,如果國君周圍多是壞人,那么國君也就難做好人了。 (2)請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)劷邮芙逃c學(xué)習(xí)環(huán)境的關(guān)系。
當(dāng)前試題:1561273695535104,杰卡德相似度:0.46798029556650245,題干:閱讀下面的《孟子》選段,回答問題。 孟子謂戴不勝①曰:“子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸,使楚人傅諸?”曰:“使齊人傅之?!?曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣;引而置之莊岳②之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長幼卑尊皆薛居州也,王誰與為不善?在王所者,長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?” (《滕文公下》6.6) 【注釋】①戴不勝:人名,宋國大臣 ②莊岳:齊國一個繁盛街道的名稱 (1)從“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣”一句中,可概括出成語 ;孟子運(yùn)用 方法,向戴不勝提出了 的建議。 (2)請概括選段的主旨并簡要分析。
當(dāng)前試題:1561239300816896,杰卡德相似度:0.24427480916030533,題干:《孟子》選讀 齊人伐燕?;騿栐?“勸齊伐燕,有諸?”曰:“未也。沈同①問‘燕可伐與’,吾應(yīng)之曰:‘可’。彼然而伐之也。彼如曰:‘孰可以伐之?’則將應(yīng)之曰:‘為天吏②,則可以伐之?!裼袣⑷苏?或問之曰:‘人可殺與?’則將應(yīng)之曰:‘可’。彼如曰:‘孰可以殺之?’則將應(yīng)之曰:‘為士師,則可以殺之?!褚匝喾パ?何為勸之哉?” (選自《孟子·公孫丑下》) 【注釋】①沈同:齊國大臣。②為天吏:奉行天命的天子。 (1)下列各項(xiàng)中,對上面《孟子》選段的理解,不正確的一項(xiàng)是( ) A.齊國討伐燕國,是戰(zhàn)國中期的一項(xiàng)重大事件。孟子認(rèn)為,燕國的國政敗壞,民眾因此遭受苦難,所以是可以討伐的。 B.孟子指出,討伐燕國者必須施行優(yōu)于燕國的政治措施,否則,伐燕是沒有意義的,而且也不可能得到民眾的支持。 C.孟子認(rèn)為,燕國的國政敗壞,齊人身為天吏,替天行道,可以討伐燕國。但如果讓燕國人討伐燕國人,則不值得鼓勵。 D.孟子認(rèn)為,禮樂征伐這樣的大事,不是誰都有權(quán)力去做的,因此他明確反對讓像燕國一樣暴虐的同為諸侯國的齊國去討伐燕國。 (2)孟子是認(rèn)為燕國可以討伐,殺人犯可以殺掉么?為什么?
當(dāng)前試題:1561279754993664,杰卡德相似度:0.28413284132841327,題干:閱讀下面的《孟子》選段,回答問題。 孟子見齊宣王,曰:“所謂故國者,非謂有喬木之謂也,有世臣①之謂也。王無親臣矣,昔者所進(jìn),今日不知其亡也?!蓖踉?“吾何以識其不才而舍之?”曰:“國君進(jìn)賢,如不得已,將使卑逾尊,疏逾戚,可不慎與?左右皆曰‘賢’,未可也;諸大夫皆曰‘賢’,未可也;國人皆曰‘賢’,然后察之;見賢焉,然后用之。左右皆曰‘不可’,勿聽;諸大夫皆曰‘不可’,勿聽;國人皆曰‘不可’,然后察之;見不可焉,然后去之。左右皆曰‘可殺’,勿聽;諸大夫皆曰‘可殺’,勿聽;國人皆曰‘可殺’,然后察之,見可殺焉,然后殺之。故曰‘國人殺之’也。如此,然后可以為民父母?!?《孟子·梁惠王下》) 【注】①世臣:即“累世勛舊之臣,與國同休戚者也”(朱熹)。 下列對選段內(nèi)容的理解,不正確的一項(xiàng)是( ) 孟子認(rèn)為,一個國家要擁有長期為國效力立功的大臣,才能稱得上是“故國”,所以國君選拔任用人才很重要。 齊宣王認(rèn)為,齊國沒有“親臣”是因?yàn)樗羧諞]能分辨出“不才”之人,所以向孟子詢問“識其不才”的方法。 孟子告訴齊宣王,在人才的任用上,應(yīng)該以賢能與否為標(biāo)準(zhǔn),即使超越“尊尊親親”的倫常,也不必有所顧忌。 孟子認(rèn)為,國君只有運(yùn)用恰當(dāng)?shù)姆椒?正確地選拔賢才和罷黜“不才”之人,才能稱得上是人民的父母。 【小題2】“故曰:國人殺之也?!边@體現(xiàn)了孟子的什么思想?
當(dāng)前試題:2526504062001152,杰卡德相似度:0.16428571428571428,題干:閱讀下面的文字,完成下面小題。 薛嵩,絳州萬泉人。祖仁貴,高宗朝名將,封平陽郡公。父楚玉,為范陽、平盧節(jié)度使。嵩少以門蔭,落拓不事家產(chǎn),有膂力,善騎射,不知書。自天下兵起,委質(zhì)逆徒。廣德元年,東都平,時皇太子為天下兵馬元帥,遣仆固懷恩東收河朔。嵩為賊守相州,聞賊朝義兵潰,王師至,嵩惶惑迎拜于懷恩馬前,懷恩釋之,令守舊職。時懷恩二心已萌。懷恩平河朔旋,乃奏嵩及田承嗣、張忠志、李懷仙分理河北道;詔遂以嵩為相州刺史,充相、衛(wèi)、洺、邢等州節(jié)度觀察使,承嗣鎮(zhèn)魏州,忠志鎮(zhèn)恒州,懷仙鎮(zhèn)幽州,各據(jù)數(shù)州之地。時多事之后,姑欲安人,遂以重寄委嵩。嵩感恩奉職,數(shù)年間,管內(nèi)粗理,累遷檢校右仆射。大歷八年正月卒。 嵩子平,年十二,嵩卒,軍吏欲用河北故事,脅平知留后務(wù),平偽許之,讓于叔父崿,一夕以喪歸。及免喪,累授右衛(wèi)將軍,在南衙凡三十年。宰相杜黃裳深器之,薦為汝州刺史、兼御史中丞,理有能名。元和七年,淮西用兵,自左龍武大將軍授兼御史大夫、滑州刺史、鄭滑節(jié)度觀察等使,累有戰(zhàn)功?;莩俏骶帱S河二里,每歲常為水患。平詢訪得古河道,接衛(wèi)州黎陽縣界。平率魏博節(jié)度使田弘正同上聞,開古河南北長十四里,決舊河以分水勢,滑人遂無水患。居鎮(zhèn)六年,入為左金吾大將軍。未幾,復(fù)為鄭滑節(jié)度觀察使。 長慶元年,幽鎮(zhèn)叛,杜叔良統(tǒng)橫海全軍討伐不勝,王庭湊圍牛元翼于深州。棣州為賊所窘朝廷乃委平以師援棣州平即遣將李叔佐以兵五百救之。居數(shù)月,刺史王稷饋給稍薄,兵士怨怒,叔佐不能戢,宵潰而歸。仍推突將馬狼兒為帥,行及青城鎮(zhèn),劫鎮(zhèn)將李自勸,并其眾;次至博昌鎮(zhèn),復(fù)劫其鎮(zhèn)兵,共得七千余人,徑逼青州城。城中兵士不敵,平悉府庫并家財(cái)募二千精卒,逆擊之,仍先以騎兵掩其家屬輜重,賊眾惶惑反顧,因大敗。狼兒與其同惡十?dāng)?shù)輩脫身竄匿,余黨降,稍后者斬于鞠場。明日,狼兒亦就擒戮,脅從者放歸田里。詔加右仆射,進(jìn)封魏國公,由是遠(yuǎn)近畏伏平之威略。 在鎮(zhèn)六周歲,兵甲完利,井賦均一。至是入覲,百姓遮道乞留,數(shù)日乃得出。在河中凡六年,召拜太子太保。明年,上疏乞老,以司徒致仕,居一年卒,冊贈太傅。 ——節(jié)選自《舊唐書·列傳第七十四》 對下列句子中加點(diǎn)的詞的解釋,不正確的一項(xiàng)是 ( ) 嵩少以門蔭,落拓不事家產(chǎn) 落拓:豪放,放蕩不羈 時多事之后,姑欲安人,遂以重寄委嵩 安:安排 自天下兵起,束身戎伍,委質(zhì)逆徒 委質(zhì):順從,歸附 兵甲完利,井賦均一 完利:堅(jiān)固鋒利 以下句子中,全都直接表明薛嵩與薛平父子二人功績的一組是 ( ) ①宰相杜黃裳深器之,薦為汝州刺史、兼御史中丞 ②嵩感恩奉職,數(shù)年間,管內(nèi)粗理,累遷檢校右仆射 ③自左龍武大將軍授兼御史大夫、滑州刺史、鄭滑節(jié)度觀察等使,累有戰(zhàn)功 ④至是入覲,百姓遮道乞留,數(shù)日乃得出 ⑤平悉府庫并家財(cái)募二千精卒,逆擊之 ⑥開古河南北長十四里,決舊河以分水勢,滑人遂無水患 ①③④ ①⑤⑥ ②③⑥ ②④⑤ 下列對原文有關(guān)內(nèi)容的分析和概括,不正確的一項(xiàng)是( ) 薛嵩原本替賊兵把守相州,賊兵敗后,王師到來,薛嵩就到懷恩馬前迎接叩拜,懷恩放了他,并讓他做了相州刺史。 宰相杜黃裳很器重薛平,推薦他做汝州刺史、兼任御史中丞,治理得好,在當(dāng)時很有名聲。在淮西戰(zhàn)事中,又屢有戰(zhàn)功。 薛平在滑州時,率領(lǐng)魏博節(jié)度使田弘正開鑿古河南北總長十四里,挖開舊河來分流水勢,滑州百姓于是沒有水患了。 青州城兵士不敵亂軍時,薛平拿出府庫和家里的全部錢財(cái)招募二千精銳的士兵,迎擊對方,仍然先用騎兵掩擊敵人的家屬輜重,叛賊士兵惶惑反顧,于是大敗。 對“軍吏欲用河北故事,脅平知留后務(wù),平偽許之,讓于叔父崿,一夕以喪歸”句翻譯最準(zhǔn)確的一項(xiàng)是( ) 軍吏想要采用河北的故事,脅迫薛平務(wù)必留下來,薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北舊例,脅迫薛平務(wù)必留下來,薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北舊例,脅迫薛平留下來管理后務(wù),薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北故事里的樣子,脅迫薛平留下來管理后務(wù),薛平答應(yīng)了他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?下列對文章中畫波浪線部分的斷句,正確的一項(xiàng)是( ) 棣州為賊所窘/朝廷乃委平/以師援棣州/平即遣將李叔佐/以兵五百救之。 棣州為賊所窘/朝廷乃委平以師/援棣州/平即遣將李叔佐/以兵五百救之。 棣州為賊所窘/朝廷乃委平以師援棣州/平即遣將李叔佐以兵五百救之。 棣州為賊所窘/朝廷乃委平以師/援棣州/平即遣將李叔佐以兵五百救之。

測試結(jié)果,排除完全相等的情況,對于普通的杰卡德計(jì)算相似度最高的為相似度得分為54,從10個中選取結(jié)果

  • 閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰: “子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸,使楚人傅諸?”(1)曰:“使齊人傅之?!?曰:“一齊人傅之,歡楚人咻之,(2)雖日撻而求其齊也不可得矣;(3)引而置之莊岳之間數(shù)年,(4)雖日撻而求其楚亦不可得矣。子謂薛居州善士 也,(5使之居于王所。在于王所者長幼卑尊皆薛居州也,王誰與為不善?在 王所者長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?”(6) 【注釋】 (1)傅:朱熹《集注》云:“教也?!?2)淋(xiū休):為“喧嘩”。(3)撻:責(zé)打。(4)莊岳:朱熹《集注》云:“齊街里名也?!?5)薛居州: 趙注云:“宋之善上也?!?6)獨(dú):王引之《經(jīng)傳釋詞》云:“獨(dú)猶將也?!?(1)下列各項(xiàng)中,對上面選段的理解不正確的一項(xiàng)是( ) A.孟子用設(shè)喻的方法反問戴不勝,楚國大夫的兒子要學(xué)會說齊國話,是找齊國的人來教他好呢,還是找楚國的人來教他好呢? B.孟子認(rèn)為如果一個齊國人來教他,卻有許多楚國人在他周圍用楚國話來干擾他,即使每天鞭打他,要求他說齊國話,那也是不可能的。 C.同樣的道理,如果在王宮中的人,無論年齡大小的還是地位高低的都居住在薛居州那里,那么君王和誰去做壞事呢? D.如果國君周圍多是好人,那么國君也就會和大家一起向善做好事。相反,如果國君周圍多是壞人,那么國君也就難做好人了。 (2)請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)劷邮芙逃c學(xué)習(xí)環(huán)境的關(guān)系。

對于不同n-gram改進(jìn)杰卡德算法選取的最相似的結(jié)果

  • n-gram為1、2、3:閱讀文化經(jīng)典《孟子》,按要求答題。 孟子謂戴不勝①曰:“子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?” 曰:“使齊人傅之。” 曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣;引而置之莊岳之間數(shù)年②,雖日撻而求其楚,亦不可得矣。子謂薛居州③,善士也,使之居于王所。在于王所者,長幼卑尊皆薛居州也,王誰與為不善?在王所者,長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?” (選自《孟子·滕文公下》) [注釋] ①戴不勝:宋臣。②莊岳:莊,街名;岳,里名,都在齊都城臨淄城內(nèi)。這里代指齊都中的鬧市區(qū)。③薛居州:宋國人。 下列各項(xiàng)中,對上面《孟子》選段的理解,不正確的一項(xiàng)是( ) 孟子認(rèn)為一個齊國人教楚國大夫的兒子學(xué)齊國話,雖然周圍有許多楚國人干擾他,但只要天天鞭打逼他學(xué)齊國話,就有可能學(xué)會的。 孟子認(rèn)為把楚國大夫的兒子帶到齊國都城的鬧市上住上幾年,即使天天鞭打他,要他講楚國話,也不可能的了。 如果在王宮中的人,不論年齡大小、地位高低,都是薛居州那樣的人.那么宋王就不能同誰一起干壞事了。 “一薛居州,獨(dú)如宋王何?”說明一個薛居州,不能對宋王起到重要作用。 請用一個成語概括選段的主要內(nèi)容,并分析孟子的觀點(diǎn)。(用自己的話回答)

  • n-gram為4、5、6、7:閱讀下面二則《孟子 》選段,回答問題。 ①孟子曰:“不挾長,不挾貴,不挾兄弟而友。友也者,友其德也,不可以有挾也。孟獻(xiàn)子,百乘之家也,有友五人焉:樂正裘,牧仲,其三人.則予忘之矣。獻(xiàn)子之與此五人者友也,無獻(xiàn)子之家者也。此五人者,亦有獻(xiàn)子之家,則不與之友矣。非惟百乘之家為然也,雖小國之君亦有之?!?(《孟子·萬章下》) ②孟子謂萬章曰:“一鄉(xiāng)之善士,斯友一鄉(xiāng)之善士;一國之善士,斯友一國之善土;天下之善士斯友天下之善士。以友天下之善士為未足,又尚論古之人。頌其詩,讀其書,不知其人,可乎?是以論其事也,是尚友 也。(《孟子·萬章下》) 下列對原文內(nèi)容分析不正確的一項(xiàng)是( ) 與今人交友務(wù)必要頌讀其詩文,做到“知其人”后方可結(jié)交。 “又尚論古之人”的意思是:又向上追論古代的人。 孟子說的“不挾”即不要有倚仗的念頭。 選段②,孟子以層層推進(jìn)的形式闡述了自己對于交友的認(rèn)識。 【小題2】請你根據(jù)上面的文字,談?wù)劽献訉τ诮挥训恼J(rèn)識。

  • n-gram為8:閱讀下面的文言文,完成小題。 孟子將朝王,王使人來曰:“寡人如就見者也,有寒疾,不可以風(fēng)。朝,將視朝,不識可使寡人得見乎?”對曰:“不幸而有疾,不能造朝?!?明日,出吊于東郭氏。公孫丑曰:“昔者辭以病,今日吊,或者不可乎?”曰:“昔日疾,今日愈,如之何不吊?”王使人問疾,醫(yī)來。孟仲子①對曰:“昔者有王命,有采薪之憂②,不能造朝。今病小愈,趨造于朝,我不識能至否乎?”使數(shù)人要于路,曰:“請必?zé)o歸,而造于朝!”不得已而之景丑氏宿焉。 景子曰:“內(nèi)則父子,外則君臣,人之大倫也。父子主恩,君臣主敬。丑見王之敬子也,未見所以敬王也?!痹?“惡!是何言也!齊人無以仁義與王言者,豈以仁義為不美也?其心曰‘是何足與言仁義也 ’云爾,則不敬莫大乎是。我非堯舜之道不敢以陳于王前,故齊人莫如我敬王也?!本白釉?“否,非此之謂也。《禮》曰:‘父召,無諾;君命召,不俟駕。’固將朝也,聞王命而遂不果③,宜與夫禮若不相似然?!?曰:“豈謂是與?天下有達(dá)尊④三:爵一,齒一,德一。朝廷莫如爵,鄉(xiāng)黨莫如齒,輔世長民莫如德。惡得有其一以慢其二哉?故將大有為之君,必有所不召之臣;欲有謀焉,則就之。其尊德樂道,不如是,不足與有為也?!?(摘自《孟子·公孫丑下》) [注]①孟仲子:孟子的堂兄弟,跟孟子學(xué)習(xí)。②采薪之憂:謂有病不能上山打柴,是疾病的代詞,為當(dāng)時交際的習(xí)慣語。③不果:終于沒有實(shí)行。④達(dá)尊:普遍尊貴的事。 對下列句子中加點(diǎn)的詞的解釋,不正確的一項(xiàng)是( ) 寡人如就見者也如:應(yīng)當(dāng)。 君命召,不俟駕俟:等待。 不識可使寡人得見乎得:能夠。 使數(shù)人要于路要:要挾、威脅。 【小題2】下列詞語中,加點(diǎn)字的意義和用法相同的一項(xiàng)是( ) ①不得已而之景丑氏宿焉②猶且從師而問焉 ①請必?zé)o歸,而造于朝②吾嘗終日而思矣 ①未見所以敬王也②所以遣將守關(guān)者,備他盜之出入與非常也。 ①豈謂是與②吾王庶幾無疾病與 【小題3】本文的人物形象很生動,為了達(dá)到自己的目的,齊王、孟子、孟仲子都說過假話。根據(jù)原文內(nèi)容判斷,下面說的是真話的一句是 ( ) 寡人如就見也,有寒疾,不可以風(fēng) 不幸而有疾,不能造朝 請必?zé)o歸,而造于朝 今病小愈, 趨造于朝 【小題4】下列對原文有關(guān)內(nèi)容的分析和概括,不正確的一項(xiàng)是( ) 本文通過孟子不接受齊王的召見,表明了孟子對君臣關(guān)系的看法與態(tài)度,他認(rèn)為君臣關(guān)系應(yīng)建立在仁義的基礎(chǔ)上,國君應(yīng)該禮賢下士,謙遜待人。 孟子認(rèn)為國君的尊貴不應(yīng)該表現(xiàn)在地位的優(yōu)越上,臣子對國君的恭順不應(yīng)該只停留在禮節(jié)形 式上。 孟子還認(rèn)為國君不能因?yàn)樽约旱赂咄?就輕慢了地位和年齡比自己低的臣子,國君應(yīng)該表現(xiàn)出尊德樂道的風(fēng)范。 景丑氏認(rèn)為孟子對齊王不恭敬,孟子本來要見國君,可是一聽到齊王的命令反而不去了,景子覺得孟子這種做法與《禮記》上說的不相合。 【小題5】把下列句子翻譯成現(xiàn)代漢語。 ①朝,將視朝,不識可使寡人得見乎?” ②故將大有為之君,必有所不召之臣;欲有謀焉,則就之。 ③危而不持,顛而不扶,則將焉用彼相矣。 ④狗彘食人食而不知檢,涂有餓莩而不知發(fā)。

將杰卡德和改進(jìn)杰卡德算法的最佳結(jié)果放到工具測試與原搜索題干余下弦相似度

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

杰卡德算法相似得分最高的文本與原文本比較

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā? 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 100.0, 耗時: 1毫秒, 文本長度: 458/458
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 100.0, 耗時: 0毫秒, 文本長度: 458/458
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面二則《孟子 》選段,回答問題。 ①孟子曰:“不挾長,不挾貴,不挾兄弟而友。友也者,友其德也,不可以有挾也。孟獻(xiàn)子,百乘之家也,有友五人焉:樂正裘,牧仲,其三人.則予忘之矣。獻(xiàn)子之與此五人者友也,無獻(xiàn)子之家者也。此五人者,亦有獻(xiàn)子之家,則不與之友矣。非惟百乘之家為然也,雖小國之君亦有之。……” (《孟子·萬章下》) ②孟子謂萬章曰:“一鄉(xiāng)之善士,斯友一鄉(xiāng)之善士;一國之善士,斯友一國之善土;天下之善士斯友天下之善士。以友天下之善士為未足,又尚論古之人。頌其詩,讀其書,不知其人,可乎?是以論其事也,是尚友 也。(《孟子·萬章下》) 下列對原文內(nèi)容分析不正確的一項(xiàng)是( ) 與今人交友務(wù)必要頌讀其詩文,做到“知其人”后方可結(jié)交。 “又尚論古之人”的意思是:又向上追論古代的人。 孟子說的“不挾”即不要有倚仗的念頭。 選段②,孟子以層層推進(jìn)的形式闡述了自己對于交友的認(rèn)識。 【小題2】請你根據(jù)上面的文字,談?wù)劽献訉τ诮挥训恼J(rèn)識。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 25.0, 耗時: 2毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 68.21, 耗時: 1毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 73.16, 耗時: 0毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 77.52, 耗時: 0毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 85.62, 耗時: 1毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 90.75, 耗時: 0毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 90.73, 耗時: 1毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 90.71, 耗時: 0毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 90.69, 耗時: 1毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 90.67, 耗時: 0毫秒, 文本長度: 458/416
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 90.65, 耗時: 0毫秒, 文本長度: 458/416
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之。”曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下列《孟子》選段,按要求回答問題。 陳臻問日:,“前日子齊,王饋兼金一百而不受;于宋,饋七十錳而受;于薛,饋五十鎰而受。前日之不受是,則今日之受非也;今日之受是,則前日之不受非也。夫子必居一于此矣?!泵献釉?“皆是也。當(dāng)在宋也,予將有遠(yuǎn)行,行者必以贐;辭曰:‘饋贐。’予何為不受?當(dāng)在薛也,予有戒心;辭日: ‘聞戒,故為兵饋之?!?予何為不受?若于齊,則未有處也。無處而饋之,是貨之也。焉有君子而可以貨取乎?” ——《孟子·公孫丑下》 孟子曰:“大人者,言不必信,行不必果,惟義所在?!?——《孟子·離婁下》 請問這兩段話共同體現(xiàn)了孟子怎樣的行為準(zhǔn)則?請結(jié)合語段簡要說明。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 22.98, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 64.63, 耗時: 1毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 57.92, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 60.73, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 62.64, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 62.56, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 62.47, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 62.39, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/288
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/288
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面的文言文,完成小題。 孟子將朝王,王使人來曰:“寡人如就見者也,有寒疾,不可以風(fēng)。朝,將視朝,不識可使寡人得見乎?”對曰:“不幸而有疾,不能造朝。” 明日,出吊于東郭氏。公孫丑曰:“昔者辭以病,今日吊,或者不可乎?”曰:“昔日疾,今日愈,如之何不吊?”王使人問疾,醫(yī)來。孟仲子①對曰:“昔者有王命,有采薪之憂②,不能造朝。今病小愈,趨造于朝,我不識能至否乎?”使數(shù)人要于路,曰:“請必?zé)o歸,而造于朝!”不得已而之景丑氏宿焉。 景子曰:“內(nèi)則父子,外則君臣,人之大倫也。父子主恩,君臣主敬。丑見王之敬子也,未見所以敬王也。”曰:“惡!是何言也!齊人無以仁義與王言者,豈以仁義為不美也?其心曰‘是何足與言仁義也 ’云爾,則不敬莫大乎是。我非堯舜之道不敢以陳于王前,故齊人莫如我敬王也?!本白釉?“否,非此之謂也?!抖Y》曰:‘父召,無諾;君命召,不俟駕?!虒⒊?聞王命而遂不果③,宜與夫禮若不相似然?!?曰:“豈謂是與?天下有達(dá)尊④三:爵一,齒一,德一。朝廷莫如爵,鄉(xiāng)黨莫如齒,輔世長民莫如德。惡得有其一以慢其二哉?故將大有為之君,必有所不召之臣;欲有謀焉,則就之。其尊德樂道,不如是,不足與有為也?!?(摘自《孟子·公孫丑下》) [注]①孟仲子:孟子的堂兄弟,跟孟子學(xué)習(xí)。②采薪之憂:謂有病不能上山打柴,是疾病的代詞,為當(dāng)時交際的習(xí)慣語。③不果:終于沒有實(shí)行。④達(dá)尊:普遍尊貴的事。 對下列句子中加點(diǎn)的詞的解釋,不正確的一項(xiàng)是( ) 寡人如就見者也如:應(yīng)當(dāng)。 君命召,不俟駕俟:等待。 不識可使寡人得見乎得:能夠。 使數(shù)人要于路要:要挾、威脅。 【小題2】下列詞語中,加點(diǎn)字的意義和用法相同的一項(xiàng)是( ) ①不得已而之景丑氏宿焉②猶且從師而問焉 ①請必?zé)o歸,而造于朝②吾嘗終日而思矣 ①未見所以敬王也②所以遣將守關(guān)者,備他盜之出入與非常也。 ①豈謂是與②吾王庶幾無疾病與 【小題3】本文的人物形象很生動,為了達(dá)到自己的目的,齊王、孟子、孟仲子都說過假話。根據(jù)原文內(nèi)容判斷,下面說的是真話的一句是 ( ) 寡人如就見也,有寒疾,不可以風(fēng) 不幸而有疾,不能造朝 請必?zé)o歸,而造于朝 今病小愈, 趨造于朝 【小題4】下列對原文有關(guān)內(nèi)容的分析和概括,不正確的一項(xiàng)是( ) 本文通過孟子不接受齊王的召見,表明了孟子對君臣關(guān)系的看法與態(tài)度,他認(rèn)為君臣關(guān)系應(yīng)建立在仁義的基礎(chǔ)上,國君應(yīng)該禮賢下士,謙遜待人。 孟子認(rèn)為國君的尊貴不應(yīng)該表現(xiàn)在地位的優(yōu)越上,臣子對國君的恭順不應(yīng)該只停留在禮節(jié)形 式上。 孟子還認(rèn)為國君不能因?yàn)樽约旱赂咄?就輕慢了地位和年齡比自己低的臣子,國君應(yīng)該表現(xiàn)出尊德樂道的風(fēng)范。 景丑氏認(rèn)為孟子對齊王不恭敬,孟子本來要見國君,可是一聽到齊王的命令反而不去了,景子覺得孟子這種做法與《禮記》上說的不相合。 【小題5】把下列句子翻譯成現(xiàn)代漢語。 ①朝,將視朝,不識可使寡人得見乎?” ②故將大有為之君,必有所不召之臣;欲有謀焉,則就之。 ③危而不持,顛而不扶,則將焉用彼相矣。 ④狗彘食人食而不知檢,涂有餓莩而不知發(fā)。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 23.32, 耗時: 1毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 66.86, 耗時: 0毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 63.12, 耗時: 1毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 59.14, 耗時: 0毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 57.71, 耗時: 1毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 64.2, 耗時: 0毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 73.75, 耗時: 1毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 81.4, 耗時: 0毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 92.9, 耗時: 1毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/1264
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 458/1264
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀文化經(jīng)典《孟子》,按要求答題。 孟子謂戴不勝①曰:“子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?” 曰:“使齊人傅之。” 曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣;引而置之莊岳之間數(shù)年②,雖日撻而求其楚,亦不可得矣。子謂薛居州③,善士也,使之居于王所。在于王所者,長幼卑尊皆薛居州也,王誰與為不善?在王所者,長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?” (選自《孟子·滕文公下》) [注釋] ①戴不勝:宋臣。②莊岳:莊,街名;岳,里名,都在齊都城臨淄城內(nèi)。這里代指齊都中的鬧市區(qū)。③薛居州:宋國人。 下列各項(xiàng)中,對上面《孟子》選段的理解,不正確的一項(xiàng)是( ) 孟子認(rèn)為一個齊國人教楚國大夫的兒子學(xué)齊國話,雖然周圍有許多楚國人干擾他,但只要天天鞭打逼他學(xué)齊國話,就有可能學(xué)會的。 孟子認(rèn)為把楚國大夫的兒子帶到齊國都城的鬧市上住上幾年,即使天天鞭打他,要他講楚國話,也不可能的了。 如果在王宮中的人,不論年齡大小、地位高低,都是薛居州那樣的人.那么宋王就不能同誰一起干壞事了。 “一薛居州,獨(dú)如宋王何?”說明一個薛居州,不能對宋王起到重要作用。 請用一個成語概括選段的主要內(nèi)容,并分析孟子的觀點(diǎn)。(用自己的話回答)
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 50.42, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 75.48, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 76.68, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 79.04, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 81.01, 耗時: 1毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 82.63, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 83.33, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 83.75, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 84.3, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 84.27, 耗時: 0毫秒, 文本長度: 458/542
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 84.24, 耗時: 0毫秒, 文本長度: 458/542
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰: “子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸,使楚人傅諸?”(1)曰:“使齊人傅之?!?曰:“一齊人傅之,歡楚人咻之,(2)雖日撻而求其齊也不可得矣;(3)引而置之莊岳之間數(shù)年,(4)雖日撻而求其楚亦不可得矣。子謂薛居州善士 也,(5使之居于王所。在于王所者長幼卑尊皆薛居州也,王誰與為不善?在 王所者長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?”(6) 【注釋】 (1)傅:朱熹《集注》云:“教也?!?2)淋(xiū休):為“喧嘩”。(3)撻:責(zé)打。(4)莊岳:朱熹《集注》云:“齊街里名也?!?5)薛居州: 趙注云:“宋之善上也?!?6)獨(dú):王引之《經(jīng)傳釋詞》云:“獨(dú)猶將也?!?(1)下列各項(xiàng)中,對上面選段的理解不正確的一項(xiàng)是( ) A.孟子用設(shè)喻的方法反問戴不勝,楚國大夫的兒子要學(xué)會說齊國話,是找齊國的人來教他好呢,還是找楚國的人來教他好呢? B.孟子認(rèn)為如果一個齊國人來教他,卻有許多楚國人在他周圍用楚國話來干擾他,即使每天鞭打他,要求他說齊國話,那也是不可能的。 C.同樣的道理,如果在王宮中的人,無論年齡大小的還是地位高低的都居住在薛居州那里,那么君王和誰去做壞事呢? D.如果國君周圍多是好人,那么國君也就會和大家一起向善做好事。相反,如果國君周圍多是壞人,那么國君也就難做好人了。 (2)請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)劷邮芙逃c學(xué)習(xí)環(huán)境的關(guān)系。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 54.69, 耗時: 1毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 71.79, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 69.98, 耗時: 1毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 70.6, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 71.36, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 72.33, 耗時: 1毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 72.63, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 72.57, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 72.57, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 72.58, 耗時: 0毫秒, 文本長度: 458/628
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 72.54, 耗時: 4毫秒, 文本長度: 458/628
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之。”曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面的《孟子》選段,回答問題。 孟子謂戴不勝①曰:“子欲子之王之善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸,使楚人傅諸?”曰:“使齊人傅之。” 曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣;引而置之莊岳②之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長幼卑尊皆薛居州也,王誰與為不善?在王所者,長幼卑尊皆非薛居州也,王誰與為善?一薛居州,獨(dú)如宋王何?” (《滕文公下》6.6) 【注釋】①戴不勝:人名,宋國大臣 ②莊岳:齊國一個繁盛街道的名稱 (1)從“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣”一句中,可概括出成語 ;孟子運(yùn)用 方法,向戴不勝提出了 的建議。 (2)請概括選段的主旨并簡要分析。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 46.8, 耗時: 1毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 72.8, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 66.41, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 65.96, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 65.71, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 66.16, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 66.03, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 65.86, 耗時: 1毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 65.73, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 65.54, 耗時: 0毫秒, 文本長度: 458/338
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 65.46, 耗時: 0毫秒, 文本長度: 458/338
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:《孟子》選讀 齊人伐燕?;騿栐?“勸齊伐燕,有諸?”曰:“未也。沈同①問‘燕可伐與’,吾應(yīng)之曰:‘可’。彼然而伐之也。彼如曰:‘孰可以伐之?’則將應(yīng)之曰:‘為天吏②,則可以伐之?!裼袣⑷苏?或問之曰:‘人可殺與?’則將應(yīng)之曰:‘可’。彼如曰:‘孰可以殺之?’則將應(yīng)之曰:‘為士師,則可以殺之?!褚匝喾パ?何為勸之哉?” (選自《孟子·公孫丑下》) 【注釋】①沈同:齊國大臣。②為天吏:奉行天命的天子。 (1)下列各項(xiàng)中,對上面《孟子》選段的理解,不正確的一項(xiàng)是( ) A.齊國討伐燕國,是戰(zhàn)國中期的一項(xiàng)重大事件。孟子認(rèn)為,燕國的國政敗壞,民眾因此遭受苦難,所以是可以討伐的。 B.孟子指出,討伐燕國者必須施行優(yōu)于燕國的政治措施,否則,伐燕是沒有意義的,而且也不可能得到民眾的支持。 C.孟子認(rèn)為,燕國的國政敗壞,齊人身為天吏,替天行道,可以討伐燕國。但如果讓燕國人討伐燕國人,則不值得鼓勵。 D.孟子認(rèn)為,禮樂征伐這樣的大事,不是誰都有權(quán)力去做的,因此他明確反對讓像燕國一樣暴虐的同為諸侯國的齊國去討伐燕國。 (2)孟子是認(rèn)為燕國可以討伐,殺人犯可以殺掉么?為什么?
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 24.43, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 64.19, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 67.51, 耗時: 1毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 73.57, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 79.43, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 87.85, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 94.38, 耗時: 1毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 94.36, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 94.35, 耗時: 0毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 458/485
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/485
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之。”曰:“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面的《孟子》選段,回答問題。 孟子見齊宣王,曰:“所謂故國者,非謂有喬木之謂也,有世臣①之謂也。王無親臣矣,昔者所進(jìn),今日不知其亡也?!蓖踉?“吾何以識其不才而舍之?”曰:“國君進(jìn)賢,如不得已,將使卑逾尊,疏逾戚,可不慎與?左右皆曰‘賢’,未可也;諸大夫皆曰‘賢’,未可也;國人皆曰‘賢’,然后察之;見賢焉,然后用之。左右皆曰‘不可’,勿聽;諸大夫皆曰‘不可’,勿聽;國人皆曰‘不可’,然后察之;見不可焉,然后去之。左右皆曰‘可殺’,勿聽;諸大夫皆曰‘可殺’,勿聽;國人皆曰‘可殺’,然后察之,見可殺焉,然后殺之。故曰‘國人殺之’也。如此,然后可以為民父母。”(《孟子·梁惠王下》) 【注】①世臣:即“累世勛舊之臣,與國同休戚者也”(朱熹)。 下列對選段內(nèi)容的理解,不正確的一項(xiàng)是( ) 孟子認(rèn)為,一個國家要擁有長期為國效力立功的大臣,才能稱得上是“故國”,所以國君選拔任用人才很重要。 齊宣王認(rèn)為,齊國沒有“親臣”是因?yàn)樗羧諞]能分辨出“不才”之人,所以向孟子詢問“識其不才”的方法。 孟子告訴齊宣王,在人才的任用上,應(yīng)該以賢能與否為標(biāo)準(zhǔn),即使超越“尊尊親親”的倫常,也不必有所顧忌。 孟子認(rèn)為,國君只有運(yùn)用恰當(dāng)?shù)姆椒?正確地選拔賢才和罷黜“不才”之人,才能稱得上是人民的父母。 【小題2】“故曰:國人殺之也?!边@體現(xiàn)了孟子的什么思想?
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 28.41, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 68.1, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 68.72, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 76.33, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 78.12, 耗時: 1毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 79.93, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 79.89, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 79.86, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 79.82, 耗時: 1毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 79.79, 耗時: 0毫秒, 文本長度: 458/572
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 79.75, 耗時: 0毫秒, 文本長度: 458/572
 
- search text:閱讀下面《孟子》選段,回答問題。 孟子謂戴不勝曰:“子欲子之王善與?我明告子。有楚大夫于此,欲其子之齊語也,則使齊人傅諸?使楚人傅諸?”曰:“使齊人傅之?!痹?“一齊人傅之,眾楚人咻之,雖日撻而求其齊也,不可得矣。引而置之莊岳之間數(shù)年,雖日撻而求其楚,亦不可得矣。子謂薛居州,善士也,使之居于王所。在于王所者,長、幼、卑、尊皆薛居州也,王誰與為不善?在王所者,長、幼、卑、尊皆非薛居州也,王誰與為善?一薛居州獨(dú)如宋王何?” 下列各項(xiàng)對文段內(nèi)容理解錯誤的一項(xiàng)是( ) 孟子認(rèn)為楚國大夫的兒子要學(xué)會說齊國話,與其請一個齊國人過來教,不如把他送到齊國最繁華的街里莊岳去學(xué)。 孟子認(rèn)為戴不勝的國君做出不善之事,是因?yàn)樯剖垦又莶辉谒磉?不能給他及時有效的指導(dǎo)。 孟子運(yùn)用了設(shè)喻的方法來問戴不勝,讓他明白“欲王之善”的道理。 國君周圍多是好人,他就會和大家一起做好事。如果國君周圍多是壞人,他也就很難做好人了。 【小題2】荀子《勸學(xué)》中說“蓬生麻中,不扶自直;白沙在涅,與之俱黑”,請結(jié)合上面選段,聯(lián)系實(shí)際,談?wù)勛约旱目捶ā?- stem text:閱讀下面的文字,完成下面小題。 薛嵩,絳州萬泉人。祖仁貴,高宗朝名將,封平陽郡公。父楚玉,為范陽、平盧節(jié)度使。嵩少以門蔭,落拓不事家產(chǎn),有膂力,善騎射,不知書。自天下兵起,委質(zhì)逆徒。廣德元年,東都平,時皇太子為天下兵馬元帥,遣仆固懷恩東收河朔。嵩為賊守相州,聞賊朝義兵潰,王師至,嵩惶惑迎拜于懷恩馬前,懷恩釋之,令守舊職。時懷恩二心已萌。懷恩平河朔旋,乃奏嵩及田承嗣、張忠志、李懷仙分理河北道;詔遂以嵩為相州刺史,充相、衛(wèi)、洺、邢等州節(jié)度觀察使,承嗣鎮(zhèn)魏州,忠志鎮(zhèn)恒州,懷仙鎮(zhèn)幽州,各據(jù)數(shù)州之地。時多事之后,姑欲安人,遂以重寄委嵩。嵩感恩奉職,數(shù)年間,管內(nèi)粗理,累遷檢校右仆射。大歷八年正月卒。 嵩子平,年十二,嵩卒,軍吏欲用河北故事,脅平知留后務(wù),平偽許之,讓于叔父崿,一夕以喪歸。及免喪,累授右衛(wèi)將軍,在南衙凡三十年。宰相杜黃裳深器之,薦為汝州刺史、兼御史中丞,理有能名。元和七年,淮西用兵,自左龍武大將軍授兼御史大夫、滑州刺史、鄭滑節(jié)度觀察等使,累有戰(zhàn)功?;莩俏骶帱S河二里,每歲常為水患。平詢訪得古河道,接衛(wèi)州黎陽縣界。平率魏博節(jié)度使田弘正同上聞,開古河南北長十四里,決舊河以分水勢,滑人遂無水患。居鎮(zhèn)六年,入為左金吾大將軍。未幾,復(fù)為鄭滑節(jié)度觀察使。 長慶元年,幽鎮(zhèn)叛,杜叔良統(tǒng)橫海全軍討伐不勝,王庭湊圍牛元翼于深州。棣州為賊所窘朝廷乃委平以師援棣州平即遣將李叔佐以兵五百救之。居數(shù)月,刺史王稷饋給稍薄,兵士怨怒,叔佐不能戢,宵潰而歸。仍推突將馬狼兒為帥,行及青城鎮(zhèn),劫鎮(zhèn)將李自勸,并其眾;次至博昌鎮(zhèn),復(fù)劫其鎮(zhèn)兵,共得七千余人,徑逼青州城。城中兵士不敵,平悉府庫并家財(cái)募二千精卒,逆擊之,仍先以騎兵掩其家屬輜重,賊眾惶惑反顧,因大敗。狼兒與其同惡十?dāng)?shù)輩脫身竄匿,余黨降,稍后者斬于鞠場。明日,狼兒亦就擒戮,脅從者放歸田里。詔加右仆射,進(jìn)封魏國公,由是遠(yuǎn)近畏伏平之威略。 在鎮(zhèn)六周歲,兵甲完利,井賦均一。至是入覲,百姓遮道乞留,數(shù)日乃得出。在河中凡六年,召拜太子太保。明年,上疏乞老,以司徒致仕,居一年卒,冊贈太傅。 ——節(jié)選自《舊唐書·列傳第七十四》 對下列句子中加點(diǎn)的詞的解釋,不正確的一項(xiàng)是 ( ) 嵩少以門蔭,落拓不事家產(chǎn) 落拓:豪放,放蕩不羈 時多事之后,姑欲安人,遂以重寄委嵩 安:安排 自天下兵起,束身戎伍,委質(zhì)逆徒 委質(zhì):順從,歸附 兵甲完利,井賦均一 完利:堅(jiān)固鋒利 以下句子中,全都直接表明薛嵩與薛平父子二人功績的一組是 ( ) ①宰相杜黃裳深器之,薦為汝州刺史、兼御史中丞 ②嵩感恩奉職,數(shù)年間,管內(nèi)粗理,累遷檢校右仆射 ③自左龍武大將軍授兼御史大夫、滑州刺史、鄭滑節(jié)度觀察等使,累有戰(zhàn)功 ④至是入覲,百姓遮道乞留,數(shù)日乃得出 ⑤平悉府庫并家財(cái)募二千精卒,逆擊之 ⑥開古河南北長十四里,決舊河以分水勢,滑人遂無水患 ①③④ ①⑤⑥ ②③⑥ ②④⑤ 下列對原文有關(guān)內(nèi)容的分析和概括,不正確的一項(xiàng)是( ) 薛嵩原本替賊兵把守相州,賊兵敗后,王師到來,薛嵩就到懷恩馬前迎接叩拜,懷恩放了他,并讓他做了相州刺史。 宰相杜黃裳很器重薛平,推薦他做汝州刺史、兼任御史中丞,治理得好,在當(dāng)時很有名聲。在淮西戰(zhàn)事中,又屢有戰(zhàn)功。 薛平在滑州時,率領(lǐng)魏博節(jié)度使田弘正開鑿古河南北總長十四里,挖開舊河來分流水勢,滑州百姓于是沒有水患了。 青州城兵士不敵亂軍時,薛平拿出府庫和家里的全部錢財(cái)招募二千精銳的士兵,迎擊對方,仍然先用騎兵掩擊敵人的家屬輜重,叛賊士兵惶惑反顧,于是大敗。 對“軍吏欲用河北故事,脅平知留后務(wù),平偽許之,讓于叔父崿,一夕以喪歸”句翻譯最準(zhǔn)確的一項(xiàng)是( ) 軍吏想要采用河北的故事,脅迫薛平務(wù)必留下來,薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北舊例,脅迫薛平務(wù)必留下來,薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北舊例,脅迫薛平留下來管理后務(wù),薛平假裝答應(yīng)他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?軍吏想要遵照河北故事里的樣子,脅迫薛平留下來管理后務(wù),薛平答應(yīng)了他們,讓官給叔父薛崿,在一天夜里因?yàn)楸紗驶丶摇?下列對文章中畫波浪線部分的斷句,正確的一項(xiàng)是( ) 棣州為賊所窘/朝廷乃委平/以師援棣州/平即遣將李叔佐/以兵五百救之。 棣州為賊所窘/朝廷乃委平以師/援棣州/平即遣將李叔佐/以兵五百救之。 棣州為賊所窘/朝廷乃委平以師援棣州/平即遣將李叔佐以兵五百救之。 棣州為賊所窘/朝廷乃委平以師/援棣州/平即遣將李叔佐以兵五百救之。
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 16.43, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 57.63, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 61.32, 耗時: 0毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 68.3, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 76.28, 耗時: 0毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 73.07, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 72.95, 耗時: 0毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 72.82, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 72.7, 耗時: 0毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 458/1868
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 458/1868
 

2.3.4、召回CASE2

測試結(jié)論:本測試CASE發(fā)現(xiàn)

  • 改進(jìn)杰卡德在n-gram為2的時候計(jì)算最相似的結(jié)果和原生杰卡德計(jì)算最相似的結(jié)果一致

  • 改進(jìn)杰卡德在n-gram為1的時候發(fā)現(xiàn)即使結(jié)果文本長度很短,但是仍然被選為了最相似的,這個文本在杰卡德算法中是相似度最低的。

搜索題干:

腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,

其他試題題干:

杰卡德算法計(jì)算的相似度閾值:27.06766917293233,題干:
下列屬于造成組織水腫原因的有( ) 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 腎小管重吸收水分增強(qiáng)

杰卡德算法計(jì)算的相似度閾值:29.28571428571429,題干:
下列各項(xiàng)中,不可能造成組織水腫的是 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 食物過咸,抗利尿激素分泌增加,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出

杰卡德算法計(jì)算的相似度閾值:12.698412698412698,題干:
某人全身浮腫,其原因不包括 血漿蛋白減少 腎小球腎炎 毛細(xì)淋巴管堵塞 糖尿病

杰卡德算法計(jì)算的相似度閾值:26.515151515151516,題干:
下列不是造成組織水腫原因的是 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 腎小管重吸收水分增強(qiáng)

杰卡德算法計(jì)算的相似度閾值:30.597014925373134,題干:
下列各項(xiàng)中,不可能造成組織水腫的是( ) 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 病毒侵入機(jī)體時,抗體會從血漿進(jìn)入組織液

杰卡德算法計(jì)算的相似度閾值:17.46031746031746,題干:
下列敘述中不會引起組織水腫的是( ) 毛細(xì)淋巴管阻塞 注射蛋白質(zhì)類藥物 花粉過敏 腎小球腎炎

杰卡德算法計(jì)算的相似度閾值:30.0,題干:
下列各項(xiàng)中,不可能造成組織水腫的是( ) 食物過咸,抗利尿激素分泌增加,腎小管重吸收水分增多 患有腎小球腎炎癥,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出

杰卡德算法計(jì)算的相似度閾值:31.645569620253166,題干:
某人因急性腎小球腎炎而出現(xiàn)了全身水腫,同時伴有尿血、尿蛋白和少尿等癥狀,檢查發(fā)現(xiàn)該患者腎小球水鹽濾過率降低、全身毛細(xì)血管通透性改變、血漿蛋白含量下降,被確診為腎炎性水腫。下列說法正確的是( ) 患者腎小球?yàn)V過率降低導(dǎo)致其內(nèi)環(huán)境水鹽含量上升 患者血漿蛋白含量逐漸下降,也會加重組織水腫 患者毛細(xì)血管通透性改變,其組織細(xì)胞內(nèi)液滲透壓保持不變 若使用利尿劑增加尿量、改善腎小球通透性,可緩解患者病情

杰卡德算法計(jì)算的相似度閾值:28.776978417266186,題干:
下列各項(xiàng)中,不可能造成組織水腫的是( ) 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 食物過咸,細(xì)胞外液滲透壓升高,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出

杰卡德算法計(jì)算的相似度閾值:29.496402877697843,題干:
下列各項(xiàng)中,不可能造成組織水腫的是( ) 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 抗利尿激素分密增加,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列各項(xiàng)中,不可能造成組織水腫的是 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 食物過咸,抗利尿激素分泌增加,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 29.29, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 53.22, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 52.73, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 48.86, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 58.77, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 76.83, 耗時: 1毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/109
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/109
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:某人全身浮腫,其原因不包括 血漿蛋白減少 腎小球腎炎 毛細(xì)淋巴管堵塞 糖尿病
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 12.7, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 65.81, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 60.9, 耗時: 1毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 51.95, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 30.86, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 28.1, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 13.69, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/38
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/38
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列不是造成組織水腫原因的是 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 腎小管重吸收水分增強(qiáng)
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 26.52, 耗時: 1毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 51.97, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 51.63, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 53.0, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 69.25, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 98.37, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/86
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/86
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列各項(xiàng)中,不可能造成組織水腫的是( ) 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 病毒侵入機(jī)體時,抗體會從血漿進(jìn)入組織液
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 30.6, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 50.97, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 45.46, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 49.05, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 60.93, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 81.48, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/103
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 246/103
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列敘述中不會引起組織水腫的是( ) 毛細(xì)淋巴管阻塞 注射蛋白質(zhì)類藥物 花粉過敏 腎小球腎炎
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 17.46, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 63.72, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 58.46, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 64.15, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 53.09, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 52.07, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/46
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/46
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列各項(xiàng)中,不可能造成組織水腫的是( ) 食物過咸,抗利尿激素分泌增加,腎小管重吸收水分增多 患有腎小球腎炎癥,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 30.0, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 53.4, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 53.1, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 48.48, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 57.5, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 74.01, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/113
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/113
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:某人因急性腎小球腎炎而出現(xiàn)了全身水腫,同時伴有尿血、尿蛋白和少尿等癥狀,檢查發(fā)現(xiàn)該患者腎小球水鹽濾過率降低、全身毛細(xì)血管通透性改變、血漿蛋白含量下降,被確診為腎炎性水腫。下列說法正確的是( ) 患者腎小球?yàn)V過率降低導(dǎo)致其內(nèi)環(huán)境水鹽含量上升 患者血漿蛋白含量逐漸下降,也會加重組織水腫 患者毛細(xì)血管通透性改變,其組織細(xì)胞內(nèi)液滲透壓保持不變 若使用利尿劑增加尿量、改善腎小球通透性,可緩解患者病情
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 31.65, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 54.66, 耗時: 1毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 64.32, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 62.68, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 51.51, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 42.01, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 246/196
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/196
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列各項(xiàng)中,不可能造成組織水腫的是( ) 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 食物過咸,細(xì)胞外液滲透壓升高,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 28.78, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 53.57, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 52.57, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 48.35, 耗時: 1毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 57.81, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 74.69, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/112
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/112
 
- search text:腎小球?yàn)檠哼^濾器,血液經(jīng)腎小球過濾后進(jìn)入腎小囊形成原尿。正常情況下,血液中絕大部分蛋白質(zhì)不能濾過而保留于血液中,小分子物質(zhì)如尿素、葡萄糖、無機(jī)鹽等能濾過。腎小球發(fā)生炎癥時,血液內(nèi)原本不能從腎臟濾出的蛋白質(zhì)濾過至尿液內(nèi),出現(xiàn)蛋白尿。下列相關(guān)敘述正確的是A.腎小球腎炎患者血漿滲透壓的大小只與無機(jī)鹽和蛋白質(zhì)的含量有關(guān)B.腎小球具有血液過濾器的功能主要與生物膜的結(jié)構(gòu)特性有關(guān)C.腎小球腎炎患者血液中的抗體減少,機(jī)體免疫力下降D.腎小球腎炎患者會因血漿蛋白減少,組織液滲出至血漿的水增多而發(fā)生水腫,
- stem text:下列各項(xiàng)中,不可能造成組織水腫的是( ) 患有腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 抗利尿激素分密增加,腎小管重吸收水分增多 藥物或食物過敏,毛細(xì)血管通透性改變,血漿蛋白滲出
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 29.5, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 52.62, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 52.47, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 49.07, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 59.45, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 78.32, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/107
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 246/107
 

測試結(jié)果,排除完全相等的情況,對于普通的杰卡德計(jì)算相似度最高的為相似度得分為25.38,從10個中選取結(jié)果

  • 某人因急性腎小球腎炎而出現(xiàn)了全身水腫,同時伴有尿血、尿蛋白和少尿等癥狀,檢查發(fā)現(xiàn)該患者腎小球水鹽濾過率降低、全身毛細(xì)血管通透性改變、血漿蛋白含量下降,被確診為腎炎性水腫。下列說法正確的是( ) 患者腎小球?yàn)V過率降低導(dǎo)致其內(nèi)環(huán)境水鹽含量上升 患者血漿蛋白含量逐漸下降,也會加重組織水腫 患者毛細(xì)血管通透性改變,其組織細(xì)胞內(nèi)液滲透壓保持不變 若使用利尿劑增加尿量、改善腎小球通透性,可緩解患者病情

對于不同n-gram改進(jìn)杰卡德算法選取的最相似的結(jié)果

  • n-gram為1:某人全身浮腫,其原因不包括 血漿蛋白減少 腎小球腎炎 毛細(xì)淋巴管堵塞 糖尿病

  • n-gram為2:某人因急性腎小球腎炎而出現(xiàn)了全身水腫,同時伴有尿血、尿蛋白和少尿等癥狀,檢查發(fā)現(xiàn)該患者腎小球水鹽濾過率降低、全身毛細(xì)血管通透性改變、血漿蛋白含量下降,被確診為腎炎性水腫。下列說法正確的是( ) 患者腎小球?yàn)V過率降低導(dǎo)致其內(nèi)環(huán)境水鹽含量上升 患者血漿蛋白含量逐漸下降,也會加重組織水腫 患者毛細(xì)血管通透性改變,其組織細(xì)胞內(nèi)液滲透壓保持不變 若使用利尿劑增加尿量、改善腎小球通透性,可緩解患者病情

  • **n-gram為3:**下列敘述中不會引起組織水腫的是( ) 毛細(xì)淋巴管阻塞 注射蛋白質(zhì)類藥物 花粉過敏 腎小球腎炎

  • **n-gram為4、5:**下列不是造成組織水腫原因的是 花粉過敏,毛細(xì)血管通透性改變,血漿蛋白滲出 腎小球腎炎,蛋白質(zhì)隨尿液排出體外 攝入蛋白質(zhì)不足,營養(yǎng)不良,血漿蛋白含量下降 腎小管重吸收水分增強(qiáng)

  • **n-gram為6:**某人全身浮腫,其原因不包括 血漿蛋白減少 腎小球腎炎 毛細(xì)淋巴管堵塞 糖尿病

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn),# ElasticSearch,elasticsearch,學(xué)習(xí),算法,文本相似性,改進(jìn)Jaccard,萊溫斯坦距離

2.3.5、召回CASE3

測試結(jié)論:

對于相似度都不高的文本,兩種算法計(jì)算參考價值不大。

搜索題干:

行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),

其他題干:

杰卡德算法計(jì)算的相似度閾值:11.409395973154362,題干:
行駛的汽車急剎車時,司機(jī)身體會前傾,是由于他具有 .

杰卡德算法計(jì)算的相似度閾值:31.221719457013574,題干:
現(xiàn)代社會的交通運(yùn)輸是國家的經(jīng)濟(jì)命脈,到2010年底,我全國公路通車總里程達(dá)到398.4萬公里,居世界第二,了解一些高速公路上的行車常識很有必要. (1)為了防止高速行駛的汽車緊急剎車時乘員由于 繼續(xù)向前運(yùn)動而撞傷,公安部門要求小型客車的駕駛員和前排乘客必須使用安全帶,在汽車緊急剎車時,安全帶起緩沖作用,防止人向前撞到車的其他部件上受傷. (2)高速公路上為避免發(fā)生汽車追尾事故,有關(guān)部門在路邊豎立有距離確認(rèn)牌.從確認(rèn)牌開始,沿路分別豎有50m、100m、200m標(biāo)志牌.小明為了估測所乘汽車的速度,他用手表測出汽車從確認(rèn)牌到200m標(biāo)志牌的時間為5s,則他估測汽車的平均速度為 米/秒,合 千米/時.

杰卡德算法計(jì)算的相似度閾值:24.71264367816092,題干:
如圖為南方雪災(zāi)中的一個場景.汽車在緊急剎車時,總要滑行一段距離才停下來,這是由于汽車具有 的原因,當(dāng)路面有冰雪時,輪胎與地面間的摩擦?xí)?.為了避免此類事故的發(fā)生,請給司機(jī)提出一條合理建議: .

杰卡德算法計(jì)算的相似度閾值:18.93491124260355,題干:
汽車在緊急剎車時,總是滑行一段距離才能停下來,這是由于 ,當(dāng)雨天路面有水時,輪胎與地面間的摩擦力會變 ,汽車在緊急剎車后滑行的距離將比路面沒有水時 ,因此,司機(jī)駕車要注意:雨天路滑,小心慢行.

杰卡德算法計(jì)算的相似度閾值:21.965317919075144,題干:
遇到冰凍天氣,某大橋上汽車追尾事故頻發(fā),主要原因是:一方面,汽車在緊急剎車時,由于汽車具有 ,總要滑行一段距離才能停下來;另一方面,當(dāng)路面結(jié)冰時,輪胎與地面間的摩擦力變 ,汽車在緊急剎車后滑行的距離將比路面沒有冰雪時長.

杰卡德算法計(jì)算的相似度閾值:26.47058823529412,題干:
小明坐在汽車上,行駛過程中遇到了緊急情況,司機(jī)師傅采用急剎車的方法使汽車停止運(yùn)動,小明發(fā)現(xiàn)從剎車到停止運(yùn)動,汽車還要前進(jìn)一段路程,這是由于 ,此過程中汽車由于 ,運(yùn)動的速度越來越小.為減少交通事故,請你為司機(jī)師傅提出一條合理化建議: .

杰卡德算法計(jì)算的相似度閾值:14.210526315789473,題干:
今年“五一”旅游高峰期間,在我市某道路發(fā)生一起交通事故,兩輛同向行駛的汽車發(fā)生“追尾”,雖B車駕駛員緊急剎車,仍撞擊了A車(如圖所示),B車撞擊A車的力_A車撞擊B車的力(選填“>”、“<”、“=”),“追尾”后,A車駕駛員受到_(“安全氣囊”、“安全帶”、“汽車頭枕”)保護(hù)未嚴(yán)重受傷.

杰卡德算法計(jì)算的相似度閾值:20.33898305084746,題干:
冬天遇到冰凍天氣,道路上汽車的追尾事故明顯增多,主要原因是:汽車在緊急剎車時,由于汽車具有 ,總要滑行一段距離才能停下來:另外,當(dāng)路面結(jié)冰時,輪胎與地面間的摩擦變 ,同樣情況下汽車在急剎車后滑行的距離將比平時 .

杰卡德算法計(jì)算的相似度閾值:17.441860465116278,題干:
汽車超速行駛時造成交通事故的主要原因,快速行駛的汽車緊急剎車時,讓車輪停止轉(zhuǎn)動是通過增大 來增大剎車片與剎車盤之間的摩擦;輪胎在路面留下一道痕跡后汽車停下來,這是利用 的方法增大汽車輪胎與地面之間的摩擦.

杰卡德算法計(jì)算的相似度閾值:18.71345029239766,題干:
汽車在緊急剎車時,總是滑行一段距離才能停下來,這是由于 ;當(dāng)雨天路面有水時,輪胎與地面間的摩擦力會變 ,汽車在緊急剎車后滑行的距離將比路面沒有水時 ;汽車車輪停止轉(zhuǎn)動在路面上滑行時,對路面的壓強(qiáng) (選填“變大”“變小”或“不變”).

- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:行駛的汽車急剎車時,司機(jī)身體會前傾,是由于他具有 .
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 11.41, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 54.52, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 46.71, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 19.74, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/26
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:現(xiàn)代社會的交通運(yùn)輸是國家的經(jīng)濟(jì)命脈,到2010年底,我全國公路通車總里程達(dá)到398.4萬公里,居世界第二,了解一些高速公路上的行車常識很有必要. (1)為了防止高速行駛的汽車緊急剎車時乘員由于 繼續(xù)向前運(yùn)動而撞傷,公安部門要求小型客車的駕駛員和前排乘客必須使用安全帶,在汽車緊急剎車時,安全帶起緩沖作用,防止人向前撞到車的其他部件上受傷. (2)高速公路上為避免發(fā)生汽車追尾事故,有關(guān)部門在路邊豎立有距離確認(rèn)牌.從確認(rèn)牌開始,沿路分別豎有50m、100m、200m標(biāo)志牌.小明為了估測所乘汽車的速度,他用手表測出汽車從確認(rèn)牌到200m標(biāo)志牌的時間為5s,則他估測汽車的平均速度為 米/秒,合 千米/時.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 31.22, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 56.24, 耗時: 1毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 52.73, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 65.8, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 90.27, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/301
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/301
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:如圖為南方雪災(zāi)中的一個場景.汽車在緊急剎車時,總要滑行一段距離才停下來,這是由于汽車具有 的原因,當(dāng)路面有冰雪時,輪胎與地面間的摩擦?xí)?.為了避免此類事故的發(fā)生,請給司機(jī)提出一條合理建議: .
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 24.71, 耗時: 1毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 55.18, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 47.19, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 42.32, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 37.77, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 20.81, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 20.63, 耗時: 1毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/97
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/97
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:汽車在緊急剎車時,總是滑行一段距離才能停下來,這是由于 ,當(dāng)雨天路面有水時,輪胎與地面間的摩擦力會變 ,汽車在緊急剎車后滑行的距離將比路面沒有水時 ,因此,司機(jī)駕車要注意:雨天路滑,小心慢行.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 18.93, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 61.85, 耗時: 1毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 53.41, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 36.07, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 24.75, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 20.58, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 20.4, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/96
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/96
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:遇到冰凍天氣,某大橋上汽車追尾事故頻發(fā),主要原因是:一方面,汽車在緊急剎車時,由于汽車具有 ,總要滑行一段距離才能停下來;另一方面,當(dāng)路面結(jié)冰時,輪胎與地面間的摩擦力變 ,汽車在緊急剎車后滑行的距離將比路面沒有冰雪時長.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 21.97, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 55.96, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 46.53, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 34.39, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 27.86, 耗時: 1毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 23.71, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 23.54, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/110
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/110
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:小明坐在汽車上,行駛過程中遇到了緊急情況,司機(jī)師傅采用急剎車的方法使汽車停止運(yùn)動,小明發(fā)現(xiàn)從剎車到停止運(yùn)動,汽車還要前進(jìn)一段路程,這是由于 ,此過程中汽車由于 ,運(yùn)動的速度越來越小.為減少交通事故,請你為司機(jī)師傅提出一條合理化建議: .
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 26.47, 耗時: 1毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 55.3, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 48.63, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 45.55, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 25.67, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 25.5, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/118
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/118
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:今年“五一”旅游高峰期間,在我市某道路發(fā)生一起交通事故,兩輛同向行駛的汽車發(fā)生“追尾”,雖B車駕駛員緊急剎車,仍撞擊了A車(如圖所示),B車撞擊A車的力_A車撞擊B車的力(選填“>”、“<”、“=”),“追尾”后,A車駕駛員受到_(“安全氣囊”、“安全帶”、“汽車頭枕”)保護(hù)未嚴(yán)重受傷.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 14.21, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 58.76, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 47.99, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 63.25, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 62.95, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 50.11, 耗時: 1毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/144
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/144
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:冬天遇到冰凍天氣,道路上汽車的追尾事故明顯增多,主要原因是:汽車在緊急剎車時,由于汽車具有 ,總要滑行一段距離才能停下來:另外,當(dāng)路面結(jié)冰時,輪胎與地面間的摩擦變 ,同樣情況下汽車在急剎車后滑行的距離將比平時 .
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 20.34, 耗時: 1毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 61.05, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 47.91, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 38.19, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 36.13, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 22.82, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 22.65, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/106
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/106
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:汽車超速行駛時造成交通事故的主要原因,快速行駛的汽車緊急剎車時,讓車輪停止轉(zhuǎn)動是通過增大 來增大剎車片與剎車盤之間的摩擦;輪胎在路面留下一道痕跡后汽車停下來,這是利用 的方法增大汽車輪胎與地面之間的摩擦.
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 17.44, 耗時: 1毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 62.62, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 67.43, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 61.72, 耗時: 1毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 51.56, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/102
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/102
 
- search text:行駛中的汽車,在剎車后由于慣性作用還會繼續(xù)前行,向前滑行一段距離后才能停止,這段距離稱為“剎車距離”.下表是一輛行駛中的汽車在剎車后行駛的速度V( m/s )、剎車距離S(m)與行駛的時間t(s)的一些數(shù)據(jù): t(s) 0.5 1 1.5 2 V( m/s ) 24 18 12 6 S(m) 13.5 24 31.5 36 經(jīng)過研究分析,我們發(fā)現(xiàn),剎車后行駛的速度V與時間t成一次函數(shù)關(guān)系,剎車距離S與時間t成二次函數(shù)關(guān)系,請直接寫出剎車后行駛的速度V與時間t,剎車距離S與時間t的函數(shù)關(guān)系式(不需要寫出自變量的取值范圍). 若該汽車司機(jī)行駛中發(fā)現(xiàn)前方37米處有危險(xiǎn)從而緊急剎車,問該司機(jī)緊急剎車后,汽車能否在到達(dá)危險(xiǎn)處前停止?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合) 若該汽車司機(jī)在行駛的過程中發(fā)現(xiàn)前方突發(fā)交通事故,現(xiàn)緊急剎車,結(jié)果仍然與前車發(fā)生的追尾,后交警調(diào)查發(fā)現(xiàn),該汽車的剎車距離只有30米,問該司機(jī)至少需要提前多長時間剎車才能避免二次追尾事故?(假設(shè)汽車剎車后狀態(tài)與上表中數(shù)據(jù)完全吻合),
- stem text:汽車在緊急剎車時,總是滑行一段距離才能停下來,這是由于 ;當(dāng)雨天路面有水時,輪胎與地面間的摩擦力會變 ,汽車在緊急剎車后滑行的距離將比路面沒有水時 ;汽車車輪停止轉(zhuǎn)動在路面上滑行時,對路面的壓強(qiáng) (選填“變大”“變小”或“不變”).
 計(jì)算試題相似度(杰卡德,按照字符) 相似度: 18.71, 耗時: 1毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 1) 相似度: 61.86, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 2) 相似度: 48.97, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 3) 相似度: 37.51, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 4) 相似度: 30.07, 耗時: 1毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 5) 相似度: 25.06, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 6) 相似度: 24.89, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 7) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 8) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 9) 相似度: 0.0, 耗時: 1毫秒, 文本長度: 451/116
 計(jì)算試題相似度(基于n-gram改進(jìn)的杰卡德,window length : 10) 相似度: 0.0, 耗時: 0毫秒, 文本長度: 451/116
 

測試結(jié)果,排除完全相等的情況,對于普通的杰卡德計(jì)算相似度最高的為相似度得分為25.38,從10個中選取結(jié)果

  • 現(xiàn)代社會的交通運(yùn)輸是國家的經(jīng)濟(jì)命脈,到2010年底,我全國公路通車總里程達(dá)到398.4萬公里,居世界第二,了解一些高速公路上的行車常識很有必要. (1)為了防止高速行駛的汽車緊急剎車時乘員由于 繼續(xù)向前運(yùn)動而撞傷,公安部門要求小型客車的駕駛員和前排乘客必須使用安全帶,在汽車緊急剎車時,安全帶起緩沖作用,防止人向前撞到車的其他部件上受傷. (2)高速公路上為避免發(fā)生汽車追尾事故,有關(guān)部門在路邊豎立有距離確認(rèn)牌.從確認(rèn)牌開始,沿路分別豎有50m、100m、200m標(biāo)志牌.小明為了估測所乘汽車的速度,他用手表測出汽車從確認(rèn)牌到200m標(biāo)志牌的時間為5s,則他估測汽車的平均速度為 米/秒,合 千米/時.

對于不同n-gram改進(jìn)杰卡德算法選取的最相似的結(jié)果

  • **n-gram為1、2:**汽車超速行駛時造成交通事故的主要原因,快速行駛的汽車緊急剎車時,讓車輪停止轉(zhuǎn)動是通過增大 來增大剎車片與剎車盤之間的摩擦;輪胎在路面留下一道痕跡后汽車停下來,這是利用 的方法增大汽車輪胎與地面之間的摩

  • **n-gram為3、4:**現(xiàn)代社會的交通運(yùn)輸是國家的經(jīng)濟(jì)命脈,到2010年底,我全國公路通車總里程達(dá)到398.4萬公里,居世界第二,了解一些高速公路上的行車常識很有必要. (1)為了防止高速行駛的汽車緊急剎車時乘員由于 繼續(xù)向前運(yùn)動而撞傷,公安部門要求小型客車的駕駛員和前排乘客必須使用安全帶,在汽車緊急剎車時,安全帶起緩沖作用,防止人向前撞到車的其他部件上受傷. (2)高速公路上為避免發(fā)生汽車追尾事故,有關(guān)部門在路邊豎立有距離確認(rèn)牌.從確認(rèn)牌開始,沿路分別豎有50m、100m、200m標(biāo)志牌.小明為了估測所乘汽車的速度,他用手表測出汽車從確認(rèn)牌到200m標(biāo)志牌的時間為5s,則他估測汽車的平均速度為 米/秒,合 千米/時.

  • **n-gram為5:**汽車在緊急剎車時,總是滑行一段距離才能停下來,這是由于 ;當(dāng)雨天路面有水時,輪胎與地面間的摩擦力會變 ,汽車在緊急剎車后滑行的距離將比路面沒有水時 ;汽車車輪停止轉(zhuǎn)動在路面上滑行時,對路面的壓強(qiáng) (選填“變大”“變小”或“不變”).文章來源地址http://www.zghlxwxcb.cn/news/detail-773396.html

到了這里,關(guān)于ElasticSearch學(xué)習(xí)篇9_文本相似度計(jì)算方法現(xiàn)狀以及基于改進(jìn)的 Jaccard 算法代碼實(shí)現(xiàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • python實(shí)現(xiàn)文本相似度排名計(jì)算

    ? ?項(xiàng)目中,客戶突然提出需要根據(jù)一份企業(yè)名單查找對應(yīng)的內(nèi)部系統(tǒng)用戶信息,然后根據(jù)直接的企業(yè)社會統(tǒng)一信用號和企業(yè)名稱進(jìn)行匹配,發(fā)現(xiàn)匹配率只有2.86%,低得可憐。所以根據(jù)客戶的要求,需要將匹配率提高到70-80%左右,于是開始了折騰之路。 ? ? 上網(wǎng)一查,各種相

    2024年02月12日
    瀏覽(25)
  • Python文本分析 | 余弦相似度的計(jì)算

    Python文本分析 | 余弦相似度的計(jì)算

    本文首發(fā)于微信公眾號:Python for Finance 鏈接:https://mp.weixin.qq.com/s/i74pct7a4NBRSN39kg2NXA 余弦相似性通過計(jì)算兩個向量的余弦角來測量兩個向量之間的相似性。 D1 = ‘the best data science course’ D2 = ‘data science is popular’ 基于詞袋法構(gòu)造文本向量: D1:[1,1,1,1,1,0,0] D2:[0,

    2023年04月11日
    瀏覽(18)
  • LLM - LLaMA-2 獲取文本向量并計(jì)算 Cos 相似度

    LLM - LLaMA-2 獲取文本向量并計(jì)算 Cos 相似度

    目錄 一.引言 二.獲取文本向量 1.hidden_states 與 last_hidden_states ◆?hidden_states ◆?last_hidden_states? 2.LLaMA-2 獲取 hidden_states ◆ model config? ◆ get Embedding 三.獲取向量 Cos 相似度 1.向量選擇 2.Cos 相似度 3.BERT-whitening 特征白化 4.評估指標(biāo)對比 四.總結(jié) 前面提到了兩種基于統(tǒng)計(jì)的機(jī)器翻

    2024年02月10日
    瀏覽(20)
  • Elasticsearch:FMA 風(fēng)格的向量相似度計(jì)算

    Elasticsearch:FMA 風(fēng)格的向量相似度計(jì)算

    作者:Chris Hegarty 在 Lucene 9.7.0 中,我們添加了利用 SIMD 指令執(zhí)行向量相似性計(jì)算的數(shù)據(jù)并行化的支持。 現(xiàn)在,我們通過使用融合乘加 (Fused Mulitply-Add - FMA) 進(jìn)一步推動這一點(diǎn)。 乘法和加法是一種常見的運(yùn)算,它計(jì)算兩個數(shù)字的乘積并將該乘積與第三個數(shù)字相加。 這些類型的

    2024年02月01日
    瀏覽(12)
  • 自然語言處理 Paddle NLP - 文本語義相似度計(jì)算(ERNIE-Gram)

    自然語言處理 Paddle NLP - 文本語義相似度計(jì)算(ERNIE-Gram)

    基礎(chǔ) 自然語言處理(NLP) 自然語言處理PaddleNLP-詞向量應(yīng)用展示 自然語言處理(NLP)-前預(yù)訓(xùn)練時代的自監(jiān)督學(xué)習(xí) 自然語言處理PaddleNLP-預(yù)訓(xùn)練語言模型及應(yīng)用 自然語言處理PaddleNLP-文本語義相似度計(jì)算(ERNIE-Gram) 自然語言處理PaddleNLP-詞法分析技術(shù)及其應(yīng)用 自然語言處理Pa

    2024年02月08日
    瀏覽(23)
  • 文本挖掘?qū)W習(xí)筆記(三):文檔相似度、文檔分類和情感分析

    注:學(xué)習(xí)筆記基于文彤老師文本挖掘的系列課程 全文基于《射雕英雄傳》語料庫,下面是讀入數(shù)據(jù)的一個基于Pandas的通用操作框架。 計(jì)算兩個詞相似度的原理:簡單的說,就是將每個詞的向量在空間上進(jìn)行余弦運(yùn)算,當(dāng)cos越接近0時候,兩者越相似。 詞袋模型不考慮詞條之間

    2023年04月22日
    瀏覽(19)
  • 集成多元算法,打造高效字面文本相似度計(jì)算與匹配搜索解決方案,助力文本匹配冷啟動[BM25、詞向量、SimHash、Tfidf、SequenceMatcher]

    集成多元算法,打造高效字面文本相似度計(jì)算與匹配搜索解決方案,助力文本匹配冷啟動[BM25、詞向量、SimHash、Tfidf、SequenceMatcher]

    搜索推薦系統(tǒng)專欄簡介:搜索推薦全流程講解(召回粗排精排重排混排)、系統(tǒng)架構(gòu)、常見問題、算法項(xiàng)目實(shí)戰(zhàn)總結(jié)、技術(shù)細(xì)節(jié)以及項(xiàng)目實(shí)戰(zhàn)(含碼源) 專欄詳細(xì)介紹:搜索推薦系統(tǒng)專欄簡介:搜索推薦全流程講解(召回粗排精排重排混排)、系統(tǒng)架構(gòu)、常見問題、算法項(xiàng)目

    2024年02月05日
    瀏覽(30)
  • 【計(jì)算機(jī)視覺】使用 notebook 展示如何下載和運(yùn)行 CLIP models,計(jì)算圖片和文本相似度,實(shí)現(xiàn) zero-shot 圖片分類

    【計(jì)算機(jī)視覺】使用 notebook 展示如何下載和運(yùn)行 CLIP models,計(jì)算圖片和文本相似度,實(shí)現(xiàn) zero-shot 圖片分類

    項(xiàng)目地址: CLIP(Contrastive Language-Image Pretraining)是由OpenAI開發(fā)的一個深度學(xué)習(xí)模型,用于處理圖像和文本之間的聯(lián)合表示。它的目標(biāo)是將圖像和文本嵌入到一個共享的向量空間中,使得相似的圖像和文本在這個空間中距離較近,而不相似的圖像和文本距離較遠(yuǎn)。 CLIP模型的特

    2024年02月08日
    瀏覽(20)
  • Elasticsearch(實(shí)踐一)相似度方法L1、L2 、cos

    在文本使用三維向量的相似度時,對三種相似度的對比。 當(dāng)前基于已經(jīng)搭建好的Elasticsearch、Kibana。? 1、創(chuàng)建索引庫 創(chuàng)建成功: 2、放入數(shù)據(jù) 返回結(jié)果類似如下 3、查看所有數(shù)據(jù) 結(jié)果如下:? 4、L1方法查詢數(shù)據(jù) 結(jié)果中,id1和id2得分相同,但在文本向量空間中他們不同。 5、使

    2024年02月02日
    瀏覽(17)
  • LA@相似對角化判定定理和計(jì)算方法

    如果方陣 A ~ Λ bold{A}sim{bold{Lambda}} A ~ Λ ,且 Λ bold{Lambda} Λ 是一個對角陣(方陣),則稱 A bold{A} A 可以 相似對角化 (簡稱為 對角化 ) 相似對角化變換矩陣的性質(zhì) 設(shè) n n n 階矩陣 A bold{A} A 可以被分解為 A = P Λ P ? 1 bold{A=PLambda{P^{-1}}} A = PΛ P ? 1 (1) ,即 P ? 1 A P = Λ bold{P

    2024年02月10日
    瀏覽(17)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包