国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

簡單的用Python采集下微博評論，制作可視化詞云圖

2年前作者：輕松學(xué)Python分類：Toy博客閱讀(17)違法舉報

這篇具有很好參考價值的文章主要介紹了簡單的用Python采集下微博評論，制作可視化詞云圖。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

簡單的用Python來獲取微博評論，制作詞云圖。

首先準(zhǔn)備環(huán)境模塊

環(huán)境使用

Python 3.8或以上版本即可
Pycharm 任意版本

模塊使用

import requests 
import wordcloud 
import jieba

?

以上三個模塊都需要安裝，直接pip install 加上模塊名安裝即可。

爬蟲基本流程

一. 數(shù)據(jù)來源分析

明確需求: 明確采集的網(wǎng)站以及數(shù)據(jù)內(nèi)容
- 網(wǎng)址: https://weibo.com/2803301701/NxcPMvW2l
- 數(shù)據(jù): 評論內(nèi)容
抓包分析: 通過開發(fā)者工具進行抓包
- 打開開發(fā)者工具: F12
- 刷新網(wǎng)頁
- 通過關(guān)鍵字查找對應(yīng)的數(shù)據(jù)
關(guān)鍵字: 評論的內(nèi)容
數(shù)據(jù)包地址: https://weibo.com/ajax/statuses/buildComments?is_reload=1&id=4979141627611265&is_show_bulletin=2&is_mix=0&count=10&uid=2803301701&fetch_level=0&locale=zh-CN

二. 代碼實現(xiàn)步驟

發(fā)送請求 -> 模擬瀏覽器對于url地址發(fā)送請求
獲取數(shù)據(jù) -> 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)
解析數(shù)據(jù) -> 提取評論內(nèi)容
保存數(shù)據(jù) -> 保存本地文件 (文本 csv Excel 數(shù)據(jù)庫)

代碼展示

數(shù)據(jù)采集部分

1、發(fā)送請求 -> 模擬瀏覽器對于url地址發(fā)送請求

# 模擬瀏覽器
headers = {
    # Referer 防盜鏈
    'Referer':'https://weibo.com/2803301701/NxcPMvW2l',
    # User-Agent 用戶代理
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

# 請求網(wǎng)址
url = 'https://weibo.com/ajax/statuses/buildComments'
# 請求參數(shù)
data = {
    'is_reload': '1',
    'id': '4979141627611265',
    'is_show_bulletin': '2',
    'is_mix': '0',
    'max_id': max_id,
    'uid': '2803301701',
    'fetch_level': '0',
    'locale': 'zh-CN',
}
# 發(fā)送請求
response = requests.get(url=url, params=data, headers=headers)

?

2、獲取數(shù)據(jù) -> 獲取服務(wù)器返回響應(yīng)數(shù)據(jù)

json_data = response.json()
print(json_data)

?

3、解析數(shù)據(jù) -> 提取評論內(nèi)容

# 提取評論所在列表
content_list = json_data['data']
# for循環(huán)遍歷, 提取列表里面元素
for index in content_list:
    content = index['text_raw']
    print(content)

?

4、保存數(shù)據(jù)

保存文本

with open('data.txt', mode='a', encoding='utf-8') as f:
    f.write(content)
    f.write('\n')
print(content)

?

保存表格

    with open('data.txt', mode='a', encoding='utf-8') as f:
        f.write(content)
        f.write('\n')
    print(content)

df = pd.DataFrame(lis)
df.to_excel(excel_writer:'data.xlsx', index=False) 
# 數(shù)據(jù)采集和可視化我還錄制了詳細的視頻講解 
# 跟代碼一起打包好放在這個摳裙了 708525271

?

可視化部分

# 導(dǎo)入結(jié)巴分詞
import jieba
# 導(dǎo)入詞云圖模塊
import wordcloud
 
"""詞云分析"""
# 讀取文件內(nèi)容
f = open('data.txt', encoding='utf-8').read()
# 分詞
txt = jieba.lcut(f)
# 把列表合并成字符串
string = ' '.join(txt)
# 制作詞云圖配置
wc = wordcloud.WordCloud(
    font_path='msyh.ttc',
    width=1000,  # 寬
    height=700, # 高
    background_color='white', # 背景顏色 默認黑色
)
# 導(dǎo)入內(nèi)容
wc.generate(string)
wc.to_file('詞云_3.png')
print(txt)

?

詞云圖效果展示

簡單的用Python采集下微博評論，制作可視化詞云圖

?

簡單的用Python采集下微博評論，制作可視化詞云圖
好了，本次分享就結(jié)束了，下次再見！

簡單的用Python采集下微博評論，制作可視化詞云圖文章來源地址http://www.zghlxwxcb.cn/news/detail-760550.html

到了這里，關(guān)于簡單的用Python采集下微博評論，制作可視化詞云圖的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符，請點擊違法舉報進行投訴反饋，一經(jīng)查實，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費用

大數(shù)據(jù)輿情評論數(shù)據(jù)分析：基于Python微博輿情數(shù)據(jù)爬蟲可視化分析系統(tǒng)(NLP情感分析+爬蟲+機器學(xué)習(xí))
基于Python的微博輿情數(shù)據(jù)爬蟲可視化分析系統(tǒng)，結(jié)合了NLP情感分析、爬蟲技術(shù)和機器學(xué)習(xí)算法。該系統(tǒng)的主要目標(biāo)是從微博平臺上抓取實時數(shù)據(jù)，對這些數(shù)據(jù)進行情感分析，并通過可視化方式呈現(xiàn)分析結(jié)果，以幫助用戶更好地了解輿情動向和情感傾向。系統(tǒng)首先利用爬蟲技術(shù)
2024年04月15日
瀏覽(29)
簡單的用Python采集股票數(shù)據(jù)，保存表格后分析歷史數(shù)據(jù)
字節(jié)跳動如果上市，那么鐘老板將成為我國第一個世界首富趁著現(xiàn)在還沒上市，咱們提前學(xué)習(xí)一下用Python分析股票歷史數(shù)據(jù)，抱住粗大腿坐等起飛~ 好了話不多說，我們直接開始正文環(huán)境使用 Python 3.10 解釋器 Pycharm 編輯器模塊使用 requests — 數(shù)據(jù)請求模塊 csv - 保存csv表格
2024年02月05日
瀏覽(30)
簡單的用Python實現(xiàn)一下JS逆向解密，采集空氣質(zhì)量數(shù)據(jù)
最近天氣降溫厲害，咱們用 Python 來分析一下空氣質(zhì)量如何~ 話不多說，我們直接開始上手。環(huán)境使用 Python 3.8 Pycharm nodejs 模塊使用 import requests import execjs import json requests 和 execjs 都是第三方模塊，需要手動安裝，直接pip install 加上模塊名字即可。明確需求: 明確采集的網(wǎng)站
2024年02月05日
瀏覽(27)
微博數(shù)據(jù)采集，微博爬蟲，微博網(wǎng)頁解析，完整代碼（主體內(nèi)容+評論內(nèi)容）
參加新聞比賽，需要獲取大眾對某一方面的態(tài)度信息，因此選擇微博作為信息收集的一部分微博主體內(nèi)容微博評論內(nèi)容一級評論內(nèi)容二級評論內(nèi)容以華為發(fā)布會這一熱搜為例子，我們可以通過開發(fā)者模式得到信息基本都包含在下面的 div tag中我們通過網(wǎng)絡(luò)這一模塊進行解
2024年03月14日
瀏覽(23)
簡單的用Python抓取動態(tài)網(wǎng)頁數(shù)據(jù)，實現(xiàn)可視化數(shù)據(jù)分析
一眨眼明天就周末了，一周過的真快！今天咱們用Python來實現(xiàn)一下動態(tài)網(wǎng)頁數(shù)據(jù)的抓取最近不是有消息說世界首富馬上要變成中國人了嗎，這要真成了，可就是歷史上首位中國世界首富了！那我們就以富豪排行榜為例，爬取一下2023年國內(nèi)富豪五百強，最后實現(xiàn)一下可視化分
2024年02月05日
瀏覽(24)
爬蟲實戰(zhàn) - 微博評論數(shù)據(jù)可視化
我們都知道在數(shù)據(jù)比較少的情況下，我們是可以很輕易的獲取到數(shù)據(jù)中的信息。但是當(dāng)數(shù)據(jù)比較龐大的時候呢，我們就很難看出來了。尤其是面對現(xiàn)如今數(shù)以萬計的數(shù)據(jù)，就更了。不過好在我們可以通過計算機來幫我們進行分析，其中比較高效的手段便是數(shù)據(jù)可視化了。通過
2024年02月03日
瀏覽(19)
Python爬蟲—爬取微博評論數(shù)據(jù)
今日，分享編寫Python爬蟲程序來實現(xiàn)微博評論數(shù)據(jù)的下載。具體步驟如下??????： Step1 ：電腦訪問手機端微博_https://m.weibo.cn/_ Step2 ：打開一條微博_https://m.weibo.cn/detail/4907031376694279_ Step3 ：URL地址中的_49070__31376694279_就是需要爬取的微博ID Step4 ：將ID填寫到_main_下即可，也支
2024年03月21日
瀏覽(17)
大數(shù)據(jù)畢業(yè)設(shè)計Python+Django旅游景點評論數(shù)據(jù)采集分析可視化系統(tǒng) NLP情感分析 LDA主題分析 bayes分類旅游爬蟲旅游景點評論爬蟲機器學(xué)習(xí) 深度學(xué)習(xí) 人工智能計算機畢業(yè)設(shè)計
畢業(yè)論文（設(shè)計）開題報告學(xué)生姓名學(xué) ?號所在學(xué)院信息工程學(xué)院專 ?業(yè) 指導(dǎo)教師姓名指導(dǎo)教師職稱工程師助教指導(dǎo)教師單位論文（設(shè)計）題目基于樸素貝葉斯算法旅游景點線上評價情感分析開 ?題 ?報 ?告 ?內(nèi) ?容選題依據(jù)及研究內(nèi)容（國內(nèi)、外研究現(xiàn)狀，初步
2024年04月17日
瀏覽(109)
用python語言爬蟲爬取微博評論--上--初步爬蟲(超詳細版，大學(xué)生不騙大學(xué)生)
目錄一、找到頁面 ?二、學(xué)會使用檢查元素 2.1 打開檢查元素界面 2.2 找到所有評論所在的位置 2.2.1 搜索評論 2.2.2 ?找到data表三、基礎(chǔ)部分代碼實現(xiàn)???????? 全部已經(jīng)更完（下面兩個鏈接是中和下） https://blog.csdn.net/m0_68325382/article/details/137234661?spm=1001.2014.3001.5502 爬
2024年04月10日
瀏覽(34)
基于Python Django 的微博輿論、微博情感分析可視化系統(tǒng)（V2.0）
基于Python的微博輿論分析，微博情感分析可視化系統(tǒng)，項目后端分爬蟲模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)存儲模塊、業(yè)務(wù)邏輯模塊組成。 Python基于微博的輿情分析，情感分析可視化系統(tǒng) 《基于Python的微博輿論分析，微博情感分析可視化系統(tǒng)》該項目含有源碼、配套開發(fā)軟件、軟件
2024年02月08日
瀏覽(34)

<sub id="oawts"></sub>

<table id="oawts"><font id="oawts"></font></table>

<style id="oawts"><optgroup id="oawts"><kbd id="oawts"></kbd></optgroup></style>