国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

簡單的用Python獲取一下視頻彈幕,新手練手實戰(zhàn)項目,非常簡單!

這篇具有很好參考價值的文章主要介紹了簡單的用Python獲取一下視頻彈幕,新手練手實戰(zhàn)項目,非常簡單!。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

昨天看到個視頻,彈幕挺有意思的,于是想著用Python給他全部扒下來。

代碼非常簡單,接下來我們看看 具體操作。

需要準(zhǔn)備這些

軟件

  • Python 3.8
  • Pycharm

模塊使用

  • import requests 數(shù)據(jù)請求
  • import jieba 分詞
  • import wordcloud 詞云
  • import parsel 數(shù)據(jù)解析
  • import re 正則

win + R 輸入cmd 輸入安裝命令 pip install 模塊名 (如果你覺得安裝速度比較慢, 你可以切換國內(nèi)鏡像源)

本次目標(biāo)

視頻地址: https://www.bilibili.com/video/BV1Nz4y1x7tA/
彈幕內(nèi)容: https://www.ibilibili.com/video/BV1Nz4y1x7tA/
彈幕地址: https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547

流程步驟

基本實現(xiàn)步驟: <公式>

  1. 發(fā)送請求 --> 數(shù)據(jù)所對應(yīng)鏈接地址
    https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547
  2. 獲取數(shù)據(jù) --> 獲取整個頁面數(shù)據(jù)內(nèi)容
  3. 解析數(shù)據(jù) --> 提取具體數(shù)據(jù)內(nèi)容
  4. 保存數(shù)據(jù) --> 保存本地文件

代碼展示

模塊導(dǎo)入# 數(shù)據(jù)請求模塊 --> 第三方模塊 需要安裝 pip install requests

import requests   
# 導(dǎo)入正則表達式 --> 內(nèi)置模塊不需要安裝
import re
# 導(dǎo)入數(shù)據(jù)解析模塊 --> 第三方模塊 需要安裝 pip install parsel
# 視頻講解+代碼我都打包好了,直接在這個q裙自取:708525271
import parsel

?

發(fā)送請求

# 請求鏈接
url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547'
# 調(diào)用requests模塊里面get請求方法對于url地址發(fā)送請求
response = requests.get(url)
print(response)

?

獲取數(shù)據(jù)

獲取文本響應(yīng)數(shù)據(jù)

print(response.text)

?

當(dāng)我們獲取數(shù)據(jù)出現(xiàn)亂碼怎么辦呢?

response .encoding = 'utf-8'

?

數(shù)據(jù)解析

正則匹配數(shù)據(jù)

re_content = re.findall('<d p=".*?">(.*?)</d>',html_data)
content = re.findall('<source>(.*?)</source>', html_data)
print(re_content)
print(content)

?

轉(zhuǎn)化數(shù)據(jù)

把獲取到響應(yīng)文本數(shù)據(jù),轉(zhuǎn)成可解析對象。

selector = parsel.Selector(html_data) # 選擇器對象

# d 標(biāo)簽名字 d::text -提取d標(biāo)簽里的文本內(nèi)容
css_content = selector.css('d::text').getall()

print(selector)

?

保存數(shù)據(jù)

for content in css_content:
    # mode 保存方式 --> w寫入數(shù)據(jù), 會覆蓋 a 追加保存
    with open('彈幕_1.txt', mode='a', encoding='utf-8') as f:
        f.write(content)
        f.write('\n')
    print(content)

?

好了,今天的分享就到這里結(jié)束了,咱們下次見!文章來源地址http://www.zghlxwxcb.cn/news/detail-626240.html

到了這里,關(guān)于簡單的用Python獲取一下視頻彈幕,新手練手實戰(zhàn)項目,非常簡單!的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 簡單的用Python抓取動態(tài)網(wǎng)頁數(shù)據(jù),實現(xiàn)可視化數(shù)據(jù)分析

    簡單的用Python抓取動態(tài)網(wǎng)頁數(shù)據(jù),實現(xiàn)可視化數(shù)據(jù)分析

    一眨眼明天就周末了,一周過的真快! 今天咱們用Python來實現(xiàn)一下動態(tài)網(wǎng)頁數(shù)據(jù)的抓取 最近不是有消息說世界首富馬上要變成中國人了嗎,這要真成了,可就是歷史上首位中國世界首富了! 那我們就以富豪排行榜為例,爬取一下2023年國內(nèi)富豪五百強,最后實現(xiàn)一下可視化分

    2024年02月05日
    瀏覽(24)
  • 簡單的用Python采集下微博評論,制作可視化詞云圖

    簡單的用Python采集下微博評論,制作可視化詞云圖

    簡單的用Python來獲取微博評論,制作詞云圖。 環(huán)境使用 Python 3.8或以上版本即可 Pycharm 任意版本 模塊使用 ? 以上三個模塊都需要安裝,直接pip install 加上模塊名安裝即可。 一. 數(shù)據(jù)來源分析 明確需求: 明確采集的網(wǎng)站以及數(shù)據(jù)內(nèi)容 - 網(wǎng)址: https://weibo.com/2803301701/NxcPMvW2l - 數(shù)據(jù)

    2024年02月04日
    瀏覽(18)
  • 簡單的用Python采集獵聘招聘數(shù)據(jù)內(nèi)容,并做可視化分析!

    現(xiàn)在剛畢業(yè),很多小伙伴因為找不到工作或者找了很多也不喜歡,再有懶一點的,太熱了根本不想出門到處找。 所以今天給大家分享如何在家就能找到心儀工作 使用Python批量采集招聘數(shù)據(jù),進行可視化分析,輕松找到心儀工作! 話不多說,我們直接開始~ 軟件工具 Python 3.

    2024年02月17日
    瀏覽(26)
  • python爬蟲練手項目之獲取某地企業(yè)名錄

    python爬蟲練手項目之獲取某地企業(yè)名錄

    因為很多網(wǎng)站都增加了登錄驗證,所以需要添加一段利用cookies跳過登陸驗證碼的操作 cookies獲取方式 chrmoe瀏覽器,F(xiàn)12,把name和value填入cookies agent獲取方式 任意點擊一條網(wǎng)絡(luò)資源,右側(cè)headers往下翻到底 測試訪問是否成功 訪問成功的話進入下一步 一般翻頁后查看網(wǎng)址變化就能

    2024年02月07日
    瀏覽(19)
  • 利用python對b站某GPT-4解說視頻的近萬條彈幕進行爬取、數(shù)據(jù)挖掘、數(shù)據(jù)分析、彈幕數(shù)量預(yù)測及情緒分類

    利用python對b站某GPT-4解說視頻的近萬條彈幕進行爬取、數(shù)據(jù)挖掘、數(shù)據(jù)分析、彈幕數(shù)量預(yù)測及情緒分類

    ???????? 目錄 一、利用Python爬取彈幕 ?二、利用幾行代碼直接生成詞云 三、將彈幕屬性和內(nèi)容放入mysql當(dāng)中 ?四、分析彈幕在視頻各節(jié)點的數(shù)量 1、分析視頻各個片段出現(xiàn)的彈幕數(shù)量 2、分析視頻各大章節(jié)出現(xiàn)的彈幕數(shù)量 3.分析視頻各小節(jié)出現(xiàn)的彈幕數(shù)量 五、分析彈幕數(shù)

    2024年02月11日
    瀏覽(22)
  • Node.js新手在哪兒找小項目練手?

    Node.js新手在哪兒找小項目練手?

    前言 可以參考一下下面的nodejs相關(guān)的項目,希望對你的學(xué)習(xí)有所幫助,廢話少說,讓我們直接進入正題 1、? NodeBB Star: 13.3k 一個基于Node.js的現(xiàn)代化社區(qū)論壇軟件,具有快速、可擴展、易于使用和靈活的特點。它支持多種數(shù)據(jù)庫,包括MongoDB、Redis和PostgreSQL,并且可以輕松地進

    2024年02月13日
    瀏覽(16)
  • 最近臺風(fēng)肆虐,讓我們用Python獲取天氣數(shù)據(jù),分析一下臺風(fēng)到底要去哪!

    最近臺風(fēng)肆虐,讓我們用Python獲取天氣數(shù)據(jù),分析一下臺風(fēng)到底要去哪!

    最近臺風(fēng)肆虐,已進入我國24小時警戒線!臺風(fēng)“卡努”到底要去哪兒? 作為一個Python程序員,雖然我?guī)筒簧厦?,但是時時關(guān)注一下還是可以的,順便祈禱一下臺風(fēng)往東邊某個小日子過得不錯的小島吹。 于是我花了一分鐘,用Python寫了一個獲取天氣數(shù)據(jù)的代碼,然后進行數(shù)據(jù)

    2024年02月14日
    瀏覽(24)
  • 視頻號直播彈幕采集

    訓(xùn)練地址:https://www.qiulianmao.com websocket逆向 http攔截 websocket攔截 視頻號直播彈幕采集 實戰(zhàn)一:Http輪詢彈幕攔截 更新中

    2024年02月06日
    瀏覽(22)
  • 爬蟲練手項目——獲取龍族小說全文

    爬蟲練手項目——獲取龍族小說全文

    目標(biāo)網(wǎng)站信息如下:包含了龍族1-5全部內(nèi)容? 視頻錄制:真實記錄寫爬蟲代碼全過程【以龍族小說為例】_嗶哩嗶哩_bilibili

    2024年02月13日
    瀏覽(21)
  • python簡單認(rèn)識一下字面量并嘗試編寫輸出字面量在控制臺

    python簡單認(rèn)識一下字面量并嘗試編寫輸出字面量在控制臺

    首先 還是顧名思義 什么是字面量? 在代碼中寫下來的固定的值 我們稱之為 字面量 python的字面量主要是以下幾種 當(dāng)然 前期不需要那么急 我們先熟悉 數(shù)字類型中的 整數(shù) 浮點數(shù) 和字符串類型 然后后續(xù)再慢慢擴展即可 整數(shù)呢 就相當(dāng)于 我們數(shù)學(xué)中的 正整數(shù) 例如 1 10 45 50 浮點

    2023年04月11日
    瀏覽(103)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包