統(tǒng)計(jì)文本中的數(shù)字出現(xiàn)頻次:磁盤上有多個(gè)文本文件,統(tǒng)計(jì)數(shù)據(jù)寫入excel。
??(本筆記適合初通 Python 的 coder 翻閱)
-
Python 官網(wǎng):https://www.python.org/
-
Free:大咖免費(fèi)“圣經(jīng)”教程《 python 完全自學(xué)教程》,不僅僅是基礎(chǔ)那么簡(jiǎn)單……
地址:https://lqpybook.readthedocs.io/
??自學(xué)并不是什么神秘的東西,一個(gè)人一輩子自學(xué)的時(shí)間總是比在學(xué)校學(xué)習(xí)的時(shí)間長(zhǎng),沒(méi)有老師的時(shí)候總是比有老師的時(shí)候多。
????????????—— 華羅庚
- My CSDN主頁(yè)、My HOT博、My Python 學(xué)習(xí)個(gè)人備忘錄
- 好文力薦、 老齊教室

本文質(zhì)量分:
CSDN質(zhì)量分查詢?nèi)肟冢篽ttp://www.csdn.net/qc
◆?統(tǒng)計(jì)文本中的數(shù)字出現(xiàn)頻次
1、題目描述
【題目來(lái)源于 CSDN 問(wèn)答社區(qū)提問(wèn)“統(tǒng)計(jì)多個(gè)文本中的數(shù)字出現(xiàn)頻次】
??遍歷多個(gè)*.txt文本列表,依次統(tǒng)計(jì)數(shù)字出現(xiàn)頻次,將統(tǒng)計(jì)以*.txt為標(biāo)簽追加寫入目標(biāo)文本文件。由于我的python 環(huán)境沒(méi)有成功pip pandas ,就把統(tǒng)計(jì)結(jié)果寫入csv文本文件了。
2、解題思路
2.1 數(shù)據(jù)文本準(zhǔn)備
??沒(méi)有文本數(shù)據(jù)操練代碼?祭出python 的“隨機(jī)大法器”random,用choice()方法隨機(jī)在給定范圍選數(shù)100寫入文本,連寫10文本,搞定操練數(shù)據(jù)!??
-
隨機(jī)生成十個(gè)數(shù)字文本
-
python 代碼
#!/sur/bin/nve python
# coding: utf-8
from random import choice
mypath = '/sdcard/001/num001/'
def write_numfile(filename):
''' 隨機(jī)寫入100個(gè)整數(shù) '''
nums = range(5001)
with open(filename, 'w') as f:
for i in range(100):
f.write(f"{choice(nums)}\n")
def main():
for i in range(1, 11): # 生成10隨機(jī)文本文件。
write_numfile(f"{mypath}{i:0>3}.txt")
if __name__ == '__main__':
main()
2.2 遍歷輪詢統(tǒng)計(jì)文本中的數(shù)字出現(xiàn)頻次
??遍歷輪詢統(tǒng)計(jì)文本文件中的數(shù)字出現(xiàn)頻次:依次遍歷每個(gè)文件中的各個(gè)數(shù)據(jù)以數(shù)字為key,出現(xiàn)頻次為value 的字典統(tǒng)計(jì),不停的累加出現(xiàn)的數(shù)字,直到遍歷完整個(gè)文本中的數(shù)字。列表解析字典的統(tǒng)計(jì)數(shù)據(jù),按出現(xiàn)頻次排降序,依次寫入csv文本。(我的這python 環(huán)境沒(méi)有pip成功寫操作excel文件的庫(kù),所以僅用csv格式寫入文本)
-
循環(huán)遍歷輪詢文本文件,統(tǒng)計(jì)數(shù)字生成的tsv文本文件
-
tsv文本內(nèi)容
-
python 代碼
def count_num(filename):
''' 統(tǒng)計(jì)文本中的數(shù)字 '''
with open(filename) as f: # 讀取文本。
text = f.read()[:-1]
count_dict = {} # 數(shù)字統(tǒng)計(jì)字典。
for i in text.split('\n'): # 遍歷輪詢文本數(shù)字統(tǒng)計(jì)出現(xiàn)頻次。
count_dict[i] = count_dict.get(i, 0) + 1
count = [(num, count) for num,count in count_dict.items()] # 列表解析統(tǒng)計(jì)字典數(shù)據(jù)。
count.sort(reverse=True, key=lambda x: x[1])
with open(f"{filename[:-4]}_count.txt", 'w') as f:
f.write(f"數(shù)字,出現(xiàn)頻次")
for num,k in count:
f.write(f"\n{num},{k}")
def main():
for i in range(1, 11): # 生成10隨機(jī)文本文件。
write_numfile(f"{mypath}{i:0>3}.txt")
for i in range(1, 11): # 生成10隨機(jī)文本文件。
count_num(f"{mypath}{i:0>3}.txt")
if __name__ == '__main__':
main()
3、完整源碼
(源碼較長(zhǎng),點(diǎn)此跳過(guò)源碼)
#!/sur/bin/nve python
# coding: utf-8
from random import choice
mypath = '/sdcard/001/num001/'
def write_numfile(filename):
''' 隨機(jī)寫入100個(gè)整數(shù) '''
nums = range(201)
with open(filename, 'w') as f:
for i in range(100):
f.write(f"{choice(nums)}\n")
def count_num(filename):
''' 統(tǒng)計(jì)文本中的數(shù)字 '''
with open(filename) as f: # 讀取文本。
text = f.read()[:-1]
count_dict = {} # 數(shù)字統(tǒng)計(jì)字典。
for i in text.split('\n'): # 遍歷輪詢文本數(shù)字統(tǒng)計(jì)出現(xiàn)頻次。
count_dict[i] = count_dict.get(i, 0) + 1
count = [(num, count) for num,count in count_dict.items()] # 列表解析統(tǒng)計(jì)字典數(shù)據(jù)。
count.sort(reverse=True, key=lambda x: x[1])
with open(f"{filename[:-4]}_count.txt", 'w') as f:
f.write(f"數(shù)字,出現(xiàn)頻次")
for num,k in count:
f.write(f"\n{num},{k}")
def main():
for i in range(1, 11): # 生成10隨機(jī)文本文件。
write_numfile(f"{mypath}{i:0>3}.txt")
for i in range(1, 11): # 生成10隨機(jī)文本文件。
count_num(f"{mypath}{i:0>3}.txt")
if __name__ == '__main__':
main()
上一篇:? 學(xué)號(hào)編碼:TooY0ung的學(xué)院(結(jié)構(gòu)體)(根據(jù)6+6十二位編碼規(guī)則,用城市代碼和出生年編制學(xué)號(hào))
下一篇:?
我的HOT博:
??本次共計(jì)收集 220 篇博文筆記信息,總閱讀量 31.17w,平均閱讀量 1416。已生成 21 篇閱讀量不小于 3000 的博文筆記索引鏈接。數(shù)據(jù)采集于 2023-07-02 22:58:06 完成,用時(shí) 5 分 26.73 秒。
-
讓QQ群昵稱色變的神奇代碼
( 56405 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122566500
點(diǎn)贊:24?? 踩 :0??收藏:81??打賞:0??評(píng)論:17
本篇博文筆記于 2022-01-18 19:15:08 首發(fā),最晚于 2022-01-20 07:56:47 修改。 -
pandas 數(shù)據(jù)類型之 DataFrame
( 8763 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/124525814
點(diǎn)贊:6?? 踩 :0??收藏:31??打賞:0??評(píng)論:0
本篇博文筆記于 2022-05-01 13:20:17 首發(fā),最晚于 2022-05-08 08:46:13 修改。 -
個(gè)人信息提取(字符串)
( 6928 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/124244618
點(diǎn)贊:1?? 踩 :0??收藏:12??打賞:0??評(píng)論:0
本篇博文筆記于 2022-04-18 11:07:12 首發(fā),最晚于 2022-04-20 13:17:54 修改。 -
羅馬數(shù)字轉(zhuǎn)換器|羅馬數(shù)字生成器
( 6657 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122592047
點(diǎn)贊:0?? 踩 :0??收藏:1??打賞:0??評(píng)論:0
本篇博文筆記于 2022-01-19 23:26:42 首發(fā),最晚于 2022-01-21 18:37:46 修改。 -
Python字符串居中顯示
( 6573 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122163023
點(diǎn)贊:1?? 踩 :0??收藏:6??打賞:0??評(píng)論:1
本篇博文筆記于 2021-12-26 23:35:29 發(fā)布。 -
Python列表(list)反序(降序)的7種實(shí)現(xiàn)方式
( 5617 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/128271700
點(diǎn)贊:4?? 踩 :0??收藏:18??打賞:0??評(píng)論:8
本篇博文筆記于 2022-12-11 23:54:15 首發(fā),最晚于 2023-03-20 18:13:55 修改。 -
斐波那契數(shù)列的遞歸實(shí)現(xiàn)和for實(shí)現(xiàn)
( 5382 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122355295
點(diǎn)贊:4?? 踩 :0??收藏:2??打賞:0??評(píng)論:8
本篇博文筆記于 2022-01-06 23:27:40 發(fā)布。 -
練習(xí):字符串統(tǒng)計(jì)(坑:f‘string‘報(bào)錯(cuò))
( 4965 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/121723096
點(diǎn)贊:0?? 踩 :0??收藏:1??打賞:0??評(píng)論:0
本篇博文筆記于 2021-12-04 22:54:29 發(fā)布。 -
練習(xí):尼姆游戲(聰明版/傻瓜式?人機(jī)對(duì)戰(zhàn))
( 4722 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/121645399
點(diǎn)贊:14?? 踩 :0??收藏:42??打賞:0??評(píng)論:0
本篇博文筆記于 2021-11-30 23:43:17 發(fā)布。 -
python清屏
( 4695 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/120762101
點(diǎn)贊:0?? 踩 :0??收藏:5??打賞:0??評(píng)論:0
本篇博文筆記于 2021-10-14 13:47:21 發(fā)布。 -
回車符、換行符和回車換行符
( 4645 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/123109488
點(diǎn)贊:1?? 踩 :0??收藏:2??打賞:0??評(píng)論:0
本篇博文筆記于 2022-02-24 13:10:02 首發(fā),最晚于 2022-02-25 20:07:40 修改。 -
練習(xí):生成100個(gè)隨機(jī)正整數(shù)
( 4051 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122558220
點(diǎn)贊:1?? 踩 :0??收藏:6??打賞:0??評(píng)論:0
本篇博文筆記于 2022-01-18 13:31:36 首發(fā),最晚于 2022-01-20 07:58:12 修改。 -
密碼強(qiáng)度檢測(cè)器
( 4042 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/121739694
點(diǎn)贊:1?? 踩 :0??收藏:4??打賞:0??評(píng)論:0
本篇博文筆記于 2021-12-06 09:08:25 首發(fā),最晚于 2022-11-27 09:39:39 修改。 -
羅馬數(shù)字轉(zhuǎn)換器(用羅馬數(shù)字構(gòu)造元素的值取模實(shí)現(xiàn))
( 3925 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/122608526
點(diǎn)贊:0?? 踩 :0??收藏:0??打賞:0??評(píng)論:0
本篇博文筆記于 2022-01-20 19:38:12 首發(fā),最晚于 2022-01-21 18:32:02 修改。 -
練習(xí):班里有人和我同生日難嗎?(概率probability、蒙特卡洛隨機(jī)模擬法)
( 3725 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/124424935
點(diǎn)贊:1?? 踩 :0??收藏:3??打賞:0??評(píng)論:0
本篇博文筆記于 2022-04-26 12:46:25 首發(fā),最晚于 2022-04-27 21:22:07 修改。 -
我的 Python.color() (Python 色彩打印控制)
( 3701 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/123194259
點(diǎn)贊:2?? 踩 :0??收藏:7??打賞:0??評(píng)論:0
本篇博文筆記于 2022-02-28 22:46:21 首發(fā),最晚于 2022-03-03 10:30:03 修改。 -
練習(xí):仿真模擬福彩雙色球——中500w巨獎(jiǎng)到底有多難?跑跑代碼就曉得了。
( 3432 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/125415626
點(diǎn)贊:3?? 踩 :0??收藏:4??打賞:0??評(píng)論:3
本篇博文筆記于 2022-06-22 19:54:20 首發(fā),最晚于 2022-06-23 22:41:33 修改。 -
random.sample()將在python 3.9x后續(xù)版本中被棄用
( 3265 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/120657230
點(diǎn)贊:0?? 踩 :0??收藏:0??打賞:0??評(píng)論:0
本篇博文筆記于 2021-10-08 18:35:09 發(fā)布。 -
聊天消息敏感詞屏蔽系統(tǒng)(字符串替換 str.replace(str1, *) )
( 3253 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/124539589
點(diǎn)贊:3?? 踩 :0??收藏:2??打賞:0??評(píng)論:3
本篇博文筆記于 2022-05-02 13:02:39 首發(fā),最晚于 2022-05-21 06:10:42 修改。 -
Linux 腳本文件第一行的特殊注釋符(井號(hào)和感嘆號(hào)組合)的含義
( 3230 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/123087606
點(diǎn)贊:0?? 踩 :0??收藏:4??打賞:0??評(píng)論:3
本篇博文筆記于 2022-02-23 13:08:07 首發(fā),最晚于 2022-04-04 23:52:38 修改。 -
練習(xí):求列表(整數(shù)列表)平衡點(diǎn)
( 3104 閱讀)
博文地址:https://blog.csdn.net/m0_57158496/article/details/121737612
點(diǎn)贊:0?? 踩 :0??收藏:0??打賞:0??評(píng)論:0
本篇博文筆記于 2021-12-05 23:28:10 發(fā)布。

精品文章:
- 好文力薦:齊偉書稿 《python 完全自學(xué)教程》 Free連載(已完稿并集結(jié)成書,還有PDF版本百度網(wǎng)盤永久分享,點(diǎn)擊跳轉(zhuǎn)免費(fèi)??下載。)
- OPP三大特性:封裝中的property
- 通過(guò)內(nèi)置對(duì)象理解python'
- 正則表達(dá)式
- python中“*”的作用
- Python 完全自學(xué)手冊(cè)
- 海象運(yùn)算符
- Python中的 `!=`與`is not`不同
- 學(xué)習(xí)編程的正確方法
來(lái)源:老齊教室
◆ Python 入門指南【Python 3.6.3】
好文力薦:文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-516857.html
- 全棧領(lǐng)域優(yōu)質(zhì)創(chuàng)作者——[寒佬](還是國(guó)內(nèi)某高校學(xué)生)博文“非技術(shù)文—關(guān)于英語(yǔ)和如何正確的提問(wèn)”,“英語(yǔ)”和“會(huì)提問(wèn)”是編程學(xué)習(xí)的兩大利器。
- 【8大編程語(yǔ)言的適用領(lǐng)域】先別著急選語(yǔ)言學(xué)編程,先看它們能干嘛
- 靠譜程序員的好習(xí)慣
- 大佬帥地的優(yōu)質(zhì)好文“函數(shù)功能、結(jié)束條件、函數(shù)等價(jià)式”三大要素讓您認(rèn)清遞歸
CSDN實(shí)用技巧博文:文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-516857.html
- 8個(gè)好用到爆的Python實(shí)用技巧
- python忽略警告
- Python代碼編寫規(guī)范
- Python的docstring規(guī)范(說(shuō)明文檔的規(guī)范寫法)
到了這里,關(guān)于統(tǒng)計(jì)文本中的數(shù)字出現(xiàn)頻次的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!