国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python統(tǒng)計(jì)詞頻的幾種方法

這篇具有很好參考價(jià)值的文章主要介紹了Python統(tǒng)計(jì)詞頻的幾種方法。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

本文介紹python統(tǒng)計(jì)詞頻的幾種方法,供大家參考

目錄

方法一:運(yùn)用集合去重方法

方法二:運(yùn)用字典統(tǒng)計(jì)

方法三:使用計(jì)數(shù)器

方法一:運(yùn)用集合去重方法

def word_count1(words,n):
    word_list = []
    for word in set(words):
        num = words.counts(word)
        word_list.append([word,num])
        word_list.sort(key=lambda x:x[1], reverse=True)
    for i in range(n):
        word, count = word_list[i]
        print('{0:<15}{1:>5}'.format(word, count))

說(shuō)明:運(yùn)用集合對(duì)文本字符串列表去重,這樣統(tǒng)計(jì)詞匯不會(huì)重復(fù),運(yùn)用列表的counts方法統(tǒng)計(jì)頻數(shù),將每個(gè)詞匯和其出現(xiàn)的次數(shù)打包成一個(gè)列表加入到word_list中,運(yùn)用列表的sort方法排序,大功告成。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-538403.html

方法二:運(yùn)用字典統(tǒng)計(jì)

def word_count2(words,n):
    counts = {}
    for word in words:
        if len(word) == 1:
            continue
        else:
            counts[word] = counts.get(word, 0) + 1
    items = list(counts.items())
    items.sort(key=lambda x:x[1], reverse=True)
    for i in range(n):
        word, count = items[i]
        print("{0:<15}{1:>5}".format(word, count))

方法三:使用計(jì)數(shù)器

def word_count3(words,n):
    from collections import Counter
    counts = Counter(words)
    for ch in "":  # 刪除一些不需要統(tǒng)計(jì)的元素
        del counts[ch]
    for word, count in counts.most_common(n):  # 已經(jīng)按數(shù)量大小排好了
        print("{0:<15}{1:>5}".format(word, count))

到了這里,關(guān)于Python統(tǒng)計(jì)詞頻的幾種方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Python安裝庫(kù)的幾種方法(使用Pycharm幾種方法)

    Python安裝庫(kù)的幾種方法(使用Pycharm幾種方法)

    1.我的Pycharm已經(jīng)改成中文格式了 首先在Pycharm中進(jìn)行安裝庫(kù) 進(jìn)入Python解釋器中。 里面搜素需要的庫(kù),可能速度很慢,有的庫(kù)沒(méi)有,可以采用別的方法。 2. cmd安裝庫(kù)文件 Windows+R進(jìn)入CMD命令下。 直接輸入 pip install *** 就可以了 就是自動(dòng)安裝需要的庫(kù)。 3.直接使用別人已經(jīng)安裝好

    2024年02月13日
    瀏覽(99)
  • python字典取值的幾種方法

    ? ? ? ? Python 字典(dictionary)是一種可變?nèi)萜髂P?,可以存?chǔ)任意數(shù)量的任意類型的數(shù)據(jù)。字典中的每個(gè)元素由一個(gè)鍵和一個(gè)值組成,鍵和值之間用冒號(hào)分隔。字典通常用于存儲(chǔ)鍵值對(duì)的數(shù)據(jù),例如在數(shù)據(jù)庫(kù)中存儲(chǔ)記錄。 以下是 Python 字典取值的幾種方法及其代碼演示: 方法

    2023年04月26日
    瀏覽(20)
  • python下載包的幾種方法

    python下載包的幾種方法

    有時(shí)候下載包總是報(bào)錯(cuò),各種各樣的錯(cuò)誤。參考了很多很多,最終想記下一些。按照從易到繁的順序。 最方便的就是通過(guò)pycharm編譯器,點(diǎn)擊加號(hào)搜索包。 然后是用anaconda prompt使用命令 pip install [-i 鏡像網(wǎng)址] 包名,方括號(hào)可有可無(wú),看下載速度或者是否報(bào)錯(cuò)。 接著就是跑到

    2024年02月15日
    瀏覽(22)
  • Spark大數(shù)據(jù)處理學(xué)習(xí)筆記(2.4)IDEA開發(fā)詞頻統(tǒng)計(jì)項(xiàng)目

    Spark大數(shù)據(jù)處理學(xué)習(xí)筆記(2.4)IDEA開發(fā)詞頻統(tǒng)計(jì)項(xiàng)目

    該文章主要為完成實(shí)訓(xùn)任務(wù),詳細(xì)實(shí)現(xiàn)過(guò)程及結(jié)果見【http://t.csdn.cn/0qE1L】 從Scala官網(wǎng)下載Scala2.12.15 - https://www.scala-lang.org/download/2.12.15.html 安裝在默認(rèn)位置 安裝完畢 在命令行窗口查看Scala版本(必須要配置環(huán)境變量) 啟動(dòng)HDFS服務(wù) 啟動(dòng)Spark集群 在master虛擬機(jī)上創(chuàng)建單詞文件

    2024年02月08日
    瀏覽(33)
  • 文本分析-使用Python做詞頻統(tǒng)計(jì)分析

    文本分析-使用Python做詞頻統(tǒng)計(jì)分析

    ???♂? 個(gè)人主頁(yè):@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介:Python學(xué)習(xí)者 ?? 希望大家多多支持,我們一起進(jìn)步!?? 如果文章對(duì)你有幫助的話, 歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 前言 前面我們已經(jīng)介紹了文本分析中的中文分詞和去除停用詞,這篇文章將詳細(xì)介紹分詞后

    2024年02月10日
    瀏覽(32)
  • python使用jieba分詞,詞頻統(tǒng)計(jì),基本使用

    python使用jieba分詞,詞頻統(tǒng)計(jì),基本使用

    python采用第三方庫(kù)進(jìn)行中文分詞,本文章只是記錄文章。 1.需要下載第三方庫(kù)jieba: ? ? ? ? ? ? ? ? cmd: pip install jieba 2.為了方便測(cè)試,在同級(jí)目錄下,準(zhǔn)備一個(gè)txt格式文件,文件名隨意,這里我也是隨便取的: ? ? ? ? ? ? ? ? 文件路徑可以是絕對(duì)路徑,也可以是相對(duì)路

    2024年02月07日
    瀏覽(24)
  • Python英文詞頻統(tǒng)計(jì)(哈姆雷特)程序示例

    Python英文詞頻統(tǒng)計(jì)(哈姆雷特)程序示例

    今天繼續(xù)給大家介紹Python相關(guān)知識(shí),本文主要內(nèi)容是Python英文詞頻統(tǒng)計(jì)程序示例,主要是對(duì)英文文本——《哈姆雷特》進(jìn)行分詞。 想要對(duì)《哈姆雷特》進(jìn)行英文單詞詞頻統(tǒng)計(jì),那么我們首先需要拿到《哈姆雷特》的原文,將之存儲(chǔ)為本地的txt文檔,然后使用Python打開該文件,

    2024年02月04日
    瀏覽(22)
  • Python調(diào)用剪切板的幾種方法

    最近在網(wǎng)上搜索Python調(diào)用剪切板的方法,得到比較多的說(shuō)法是調(diào)用ctypes包中自帶的函數(shù)get_clipboard和set_clipboard函數(shù),可是但我動(dòng)手實(shí)現(xiàn)時(shí)卻發(fā)現(xiàn)根本沒(méi)有這兩個(gè)函數(shù),于是我覺(jué)得自己寫一篇文字講述Python的剪切板,可能不全,敬請(qǐng)諒解。 網(wǎng)上看到有人說(shuō)pandas包里有 從剪切板到

    2024年02月02日
    瀏覽(21)
  • python 判斷是否漢字的幾種方法

    1. 使用Python內(nèi)置的ord() ord()函數(shù)將字符轉(zhuǎn)換為Unicode編碼,然后判斷其范圍是否在漢字的范圍內(nèi): 示例代碼: 2. 使用Python內(nèi)置的unicodedata庫(kù): 使用Python內(nèi)置的unicodedata庫(kù)可以用來(lái)判斷一個(gè)字符是否為漢字 示例代碼: 3. 使用正則表達(dá)式 可以使用正則表達(dá)式來(lái)判斷一個(gè)字符是否為

    2024年02月12日
    瀏覽(22)
  • python操作PDF的幾種常見方法

    python操作PDF的幾種常見方法

    大家好,有關(guān)python操作pdf的方法,各種語(yǔ)言處理起來(lái)都比較麻煩,而且各種第三方庫(kù)的應(yīng)用場(chǎng)景都不同。下面說(shuō)明一下python如何通過(guò)第三方庫(kù)如何處理pdf文件。 1.1、pdfplumber提取文本內(nèi)容 安裝pdfplumber pdfplumber提取PDF中文字代碼思路如下 利用pdfplumber打開一個(gè) PDF 文件 獲取指定

    2024年02月03日
    瀏覽(29)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包