国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

這篇具有很好參考價值的文章主要介紹了用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前言

彈幕可以給觀眾一種“實時互動”的錯覺,雖然不同彈幕的發(fā)送時間有所區(qū)別,但是其只會在視頻中特定的一個時間點出現(xiàn),因此在相同時刻發(fā)送的彈幕基本上也具有相同的主題,在參與評論時就會有與其他觀眾同時評論的錯覺。

在國內的視頻網(wǎng)站里,彈幕先是從A站被大家知道,隨后B站發(fā)揚光大,導致現(xiàn)在全部視頻平臺和部分漫畫平臺都有彈幕功能,在欣賞動漫的同時,還能看一下大家的看法,也是一件非常有趣的事。

現(xiàn)在,彈幕文化成為了很多人看視頻的習慣,今天就教大家如何獲取彈幕的數(shù)據(jù)

環(huán)境

  • python 3.8
  • pycharm
  • requests
  • re

獲取方式一: <簡單, 但是彈幕很少>

先打開網(wǎng)站,找到你想要的視頻,然后在網(wǎng)址bili前加個i,這樣你就可以直接的找到彈幕的地址
復制地址打開,你就可以看到你想要的彈幕數(shù)據(jù),寫代碼時直接請求這個地址就可以了

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

請求數(shù)據(jù)

url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=967256583'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

獲取數(shù)據(jù)

response.encoding = 'utf-8'
print(response.text)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

解析數(shù)據(jù)

content_list = re.findall('<d p=".*?">(.*?)</d>', response.text)
content = '\n'.join(content_list)
print(content_list)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

保存數(shù)據(jù)

with open('方式一.txt', mode='a', encoding='utf-8') as f:
    f.write(content)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

獲取方式二: <復雜一點點, 彈幕比較多,按日期來>

先回到視頻播放地址,打開開發(fā)者工具,選擇其他日期天數(shù),然后會出現(xiàn)帶有當天日期的數(shù)據(jù)包,右邊就是我們要找的url地址

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

也出現(xiàn)了亂碼的彈幕數(shù)據(jù)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)

請求數(shù)據(jù)

url = f'https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid=967256583&date=2023-02-23'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36',
    'cookie': '加自己的'
}
response = requests.get(url=url, headers=headers)

解析數(shù)據(jù)

content_list = re.findall('[\u4e00-\u9fa5]+', response.text)
content = '\n'.join(content_list)

翻頁

for page in range(1, 24):
    url = f'https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid=967256583&date=2023-02-{page}'

保存數(shù)據(jù)

with open('方式二.txt', mode='a', encoding='utf-8') as f:
    f.write(content)
print(content_list)

用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)文章來源地址http://www.zghlxwxcb.cn/news/detail-426413.html

很多同學抓包的時候發(fā)現(xiàn),數(shù)據(jù)全是亂碼,可能不是我們想要的。但是要很多東西要自己實踐過之后才能知道的
??問題解答 · 源碼獲取 · 技術交流 · 抱團學習請聯(lián)系??

到了這里,關于用Python獲取彈幕的兩種方式(一種簡單但量少,另一量大管飽)的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如若轉載,請注明出處: 如若內容造成侵權/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領支付寶紅包贊助服務器費用

相關文章

  • js 實現(xiàn)彈幕效果的兩種方法

    首先,在HTML文件中創(chuàng)建畫布元素,并在CSS中設置其位置和大?。?接著,在JavaScript中獲取畫布元素并創(chuàng)建畫布上下文對象: 然后,定義一個彈幕類,包含文本、顏色、字體大小、位置和速度等屬性: 在彈幕類中添加繪制彈幕的方法: 然后,在頁面加載完畢后,創(chuàng)建一個彈幕

    2024年02月16日
    瀏覽(31)
  • android 9.0以上版本,獲取U盤路徑的兩種方式

    第一種,通過DocumentProvider: 第二種,通過StorageManager,無法使用的記得用反射;

    2024年02月13日
    瀏覽(27)
  • MyBatis中獲取參數(shù)值的兩種方式:${} 和 #{},以及它們之間區(qū)別是什么?

    ${}:的本質就是字符串拼接 #{}:的本質就是占位符賦值 ① 使用${}占位符,在字符串拼接的方式拼接sql,若為字符串類型或為日期類型的字段進行賦值時,需要手動加單引號 ② 使用#{}占位符賦值的方式拼接sql,此時為字符串類型或日期類型的字段進行賦值時,自動添加單引

    2024年02月04日
    瀏覽(22)
  • 簡單的用Python獲取一下視頻彈幕,新手練手實戰(zhàn)項目,非常簡單!

    昨天看到個視頻,彈幕挺有意思的,于是想著用Python給他全部扒下來。 代碼非常簡單,接下來我們看看 具體操作。 軟件 Python 3.8 Pycharm 模塊使用 import requests 數(shù)據(jù)請求 import jieba 分詞 import wordcloud 詞云 import parsel 數(shù)據(jù)解析 import re 正則 win + R 輸入cmd 輸入安裝命令 pip install 模塊

    2024年02月14日
    瀏覽(18)
  • 【測試】Python反編譯的兩種方式

    【測試】Python反編譯的兩種方式

    以前聽說py編譯的程序不安全,容易被反。這兩天刮臺風了,閑著也是閑著,自己也跟著搗鼓了一番。 為了不給別人帶來不好的影響,我編譯我自己寫的代碼來做測試,代碼頭部如下圖,引用了幾個常見庫: 用pyinstaller進行完整打包: 打包結束,在dist目錄得到目標程序g.ex

    2024年02月03日
    瀏覽(35)
  • 【釘釘小程序】釘釘小程序預覽文件的兩種方式,從獲取權限到預覽文件全過程

    【釘釘小程序】釘釘小程序預覽文件的兩種方式,從獲取權限到預覽文件全過程

    最近寫釘釘小程序項目過程中,要實現(xiàn)頁面展示pdf、word、ppt等文件的功能。在網(wǎng)上搜了很多文章,研究了很久,總結了一下有兩種實現(xiàn)該功能的方法,方法一:借助web-view組件打開外部網(wǎng)頁;方法二:通過上傳到釘盤,從釘盤打開文件。具體過程如下。 釘釘開放文檔-web-vie

    2024年02月15日
    瀏覽(146)
  • uni-app中實現(xiàn)彈幕的滾動效果

    在uni-app中實現(xiàn)彈幕的滾動效果,可以通過以下步驟實現(xiàn): 在頁面中創(chuàng)建一個容器,用于顯示彈幕內容??梢允褂?view 標簽或者其他適合的標簽作為容器。 使用CSS樣式設置容器的位置和樣式,例如設置 position: fixed 使其固定在頁面上的某個位置,設置 overflow: hidden 隱藏超出容

    2024年01月21日
    瀏覽(142)
  • VMware中Ubuntu拓展磁盤容量的兩種方式 &圖形化方式&命令行磁盤分區(qū)方式(親測有效&簡單且詳細)&linux磁盤分區(qū)

    VMware中Ubuntu拓展磁盤容量的兩種方式 &圖形化方式&命令行磁盤分區(qū)方式(親測有效&簡單且詳細)&linux磁盤分區(qū)

    在用VMware虛擬機的情況下,一開始分配的容量在使用過程中,出現(xiàn)不夠的情況。針對這種情況,如何拓展磁盤容量? 下面整理歸納了兩種方式進行拓展。一種是Ubuntu自帶的磁盤工具,另一種是命令行方式的磁盤分區(qū)方式。同時滿足不同擴容需求,這里也進行了擴容方式的拓展

    2024年02月14日
    瀏覽(22)
  • python讀取Excel繪制餅圖的兩種方式

    python讀取Excel繪制餅圖的兩種方式

    matplotlib 簡單方便,適合數(shù)據(jù)作圖或科學作圖(論文發(fā)表) pyecharts 流程略復雜,但功能強大,圖形具有交互式,適合項目開發(fā)或商業(yè)分析報告,但是 它是一個非常新的庫,開發(fā)不穩(wěn)定 本文介紹用 pandas庫 讀取Excel (csv)數(shù)據(jù),分別用 matplotlib庫 和 pyecharts庫 繪制餅圖。 注: 實

    2024年02月11日
    瀏覽(23)
  • python爬蟲中通用的兩種亂碼解決方式(自用)

    問題:在python爬蟲爬取的時候,我們有時會遇到諸如以下的亂碼: 解決方法一:用utf-8來轉碼,具體在請求過程中如下 解決方法二:用通用的中文亂碼處理方式: 下面給出具體的運用例子:(僅供學習交流)

    2024年02月16日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領取紅包,優(yōu)惠每天領

二維碼1

領取紅包

二維碼2

領紅包