国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

<em id="rkeaq"></em><legend id="rkeaq"><output id="rkeaq"></output></legend>

^{<tr id="rkeaq"></tr>}

Python統(tǒng)計(jì)詞頻的幾種方法

2年前作者：西西弗斯推石頭分類：Toy博客閱讀(27)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Python統(tǒng)計(jì)詞頻的幾種方法。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

本文介紹python統(tǒng)計(jì)詞頻的幾種方法，供大家參考

目錄

方法一：運(yùn)用集合去重方法

方法二：運(yùn)用字典統(tǒng)計(jì)

方法三：使用計(jì)數(shù)器

方法一：運(yùn)用集合去重方法

def word_count1(words,n):
    word_list = []
    for word in set(words):
        num = words.counts(word)
        word_list.append([word,num])
        word_list.sort(key=lambda x:x[1], reverse=True)
    for i in range(n):
        word, count = word_list[i]
        print('{0:<15}{1:>5}'.format(word, count))

說(shuō)明：運(yùn)用集合對(duì)文本字符串列表去重，這樣統(tǒng)計(jì)詞匯不會(huì)重復(fù)，運(yùn)用列表的counts方法統(tǒng)計(jì)頻數(shù)，將每個(gè)詞匯和其出現(xiàn)的次數(shù)打包成一個(gè)列表加入到word_list中，運(yùn)用列表的sort方法排序，大功告成。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-538403.html

方法二：運(yùn)用字典統(tǒng)計(jì)

def word_count2(words,n):
    counts = {}
    for word in words:
        if len(word) == 1:
            continue
        else:
            counts[word] = counts.get(word, 0) + 1
    items = list(counts.items())
    items.sort(key=lambda x:x[1], reverse=True)
    for i in range(n):
        word, count = items[i]
        print("{0:<15}{1:>5}".format(word, count))

方法三：使用計(jì)數(shù)器

def word_count3(words,n):
    from collections import Counter
    counts = Counter(words)
    for ch in "":  # 刪除一些不需要統(tǒng)計(jì)的元素
        del counts[ch]
    for word, count in counts.most_common(n):  # 已經(jīng)按數(shù)量大小排好了
        print("{0:<15}{1:>5}".format(word, count))

到了這里，關(guān)于Python統(tǒng)計(jì)詞頻的幾種方法的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

Python安裝庫(kù)的幾種方法（使用Pycharm幾種方法）
1.我的Pycharm已經(jīng)改成中文格式了首先在Pycharm中進(jìn)行安裝庫(kù) 進(jìn)入Python解釋器中。里面搜素需要的庫(kù)，可能速度很慢，有的庫(kù)沒(méi)有，可以采用別的方法。 2. cmd安裝庫(kù)文件 Windows+R進(jìn)入CMD命令下。直接輸入 pip install *** 就可以了就是自動(dòng)安裝需要的庫(kù)。 3.直接使用別人已經(jīng)安裝好
2024年02月13日
瀏覽(99)
python字典取值的幾種方法
? ? ? ? Python 字典(dictionary)是一種可變?nèi)萜髂Ｐ?，可以存?chǔ)任意數(shù)量的任意類型的數(shù)據(jù)。字典中的每個(gè)元素由一個(gè)鍵和一個(gè)值組成，鍵和值之間用冒號(hào)分隔。字典通常用于存儲(chǔ)鍵值對(duì)的數(shù)據(jù)，例如在數(shù)據(jù)庫(kù)中存儲(chǔ)記錄。以下是 Python 字典取值的幾種方法及其代碼演示：方法
2023年04月26日
瀏覽(20)
python下載包的幾種方法
有時(shí)候下載包總是報(bào)錯(cuò)，各種各樣的錯(cuò)誤。參考了很多很多，最終想記下一些。按照從易到繁的順序。最方便的就是通過(guò)pycharm編譯器，點(diǎn)擊加號(hào)搜索包。然后是用anaconda prompt使用命令 pip install [-i 鏡像網(wǎng)址] 包名，方括號(hào)可有可無(wú)，看下載速度或者是否報(bào)錯(cuò)。接著就是跑到
2024年02月15日
瀏覽(22)
Spark大數(shù)據(jù)處理學(xué)習(xí)筆記（2.4）IDEA開發(fā)詞頻統(tǒng)計(jì)項(xiàng)目
該文章主要為完成實(shí)訓(xùn)任務(wù)，詳細(xì)實(shí)現(xiàn)過(guò)程及結(jié)果見【http://t.csdn.cn/0qE1L】從Scala官網(wǎng)下載Scala2.12.15 - https://www.scala-lang.org/download/2.12.15.html 安裝在默認(rèn)位置安裝完畢在命令行窗口查看Scala版本（必須要配置環(huán)境變量）啟動(dòng)HDFS服務(wù) 啟動(dòng)Spark集群在master虛擬機(jī)上創(chuàng)建單詞文件
2024年02月08日
瀏覽(33)
文本分析-使用Python做詞頻統(tǒng)計(jì)分析
???♂? 個(gè)人主頁(yè)：@艾派森的個(gè)人主頁(yè) ???作者簡(jiǎn)介：Python學(xué)習(xí)者 ?? 希望大家多多支持，我們一起進(jìn)步！?? 如果文章對(duì)你有幫助的話，歡迎評(píng)論 ??點(diǎn)贊???? 收藏 ??加關(guān)注+ 前言前面我們已經(jīng)介紹了文本分析中的中文分詞和去除停用詞，這篇文章將詳細(xì)介紹分詞后
2024年02月10日
瀏覽(32)
python使用jieba分詞，詞頻統(tǒng)計(jì)，基本使用
python采用第三方庫(kù)進(jìn)行中文分詞，本文章只是記錄文章。 1.需要下載第三方庫(kù)jieba： ? ? ? ? ? ? ? ? cmd: pip install jieba 2.為了方便測(cè)試，在同級(jí)目錄下，準(zhǔn)備一個(gè)txt格式文件，文件名隨意，這里我也是隨便取的： ? ? ? ? ? ? ? ? 文件路徑可以是絕對(duì)路徑，也可以是相對(duì)路
2024年02月07日
瀏覽(24)
Python英文詞頻統(tǒng)計(jì)（哈姆雷特）程序示例
今天繼續(xù)給大家介紹Python相關(guān)知識(shí)，本文主要內(nèi)容是Python英文詞頻統(tǒng)計(jì)程序示例，主要是對(duì)英文文本——《哈姆雷特》進(jìn)行分詞。想要對(duì)《哈姆雷特》進(jìn)行英文單詞詞頻統(tǒng)計(jì)，那么我們首先需要拿到《哈姆雷特》的原文，將之存儲(chǔ)為本地的txt文檔，然后使用Python打開該文件，
2024年02月04日
瀏覽(22)
Python調(diào)用剪切板的幾種方法
最近在網(wǎng)上搜索Python調(diào)用剪切板的方法，得到比較多的說(shuō)法是調(diào)用ctypes包中自帶的函數(shù)get_clipboard和set_clipboard函數(shù)，可是但我動(dòng)手實(shí)現(xiàn)時(shí)卻發(fā)現(xiàn)根本沒(méi)有這兩個(gè)函數(shù)，于是我覺(jué)得自己寫一篇文字講述Python的剪切板，可能不全，敬請(qǐng)諒解。網(wǎng)上看到有人說(shuō)pandas包里有從剪切板到
2024年02月02日
瀏覽(21)
python 判斷是否漢字的幾種方法
1. 使用Python內(nèi)置的ord() ord()函數(shù)將字符轉(zhuǎn)換為Unicode編碼，然后判斷其范圍是否在漢字的范圍內(nèi)：示例代碼： 2. 使用Python內(nèi)置的unicodedata庫(kù)：使用Python內(nèi)置的unicodedata庫(kù)可以用來(lái)判斷一個(gè)字符是否為漢字示例代碼： 3. 使用正則表達(dá)式可以使用正則表達(dá)式來(lái)判斷一個(gè)字符是否為
2024年02月12日
瀏覽(22)
python操作PDF的幾種常見方法
大家好，有關(guān)python操作pdf的方法，各種語(yǔ)言處理起來(lái)都比較麻煩，而且各種第三方庫(kù)的應(yīng)用場(chǎng)景都不同。下面說(shuō)明一下python如何通過(guò)第三方庫(kù)如何處理pdf文件。 1.1、pdfplumber提取文本內(nèi)容安裝pdfplumber pdfplumber提取PDF中文字代碼思路如下利用pdfplumber打開一個(gè) PDF 文件獲取指定
2024年02月03日
瀏覽(29)

<object id="kqgij"></object>

<legend id="kqgij"></legend>

<tr id="kqgij"><strong id="kqgij"></strong></tr>