国产无码综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python爬蟲(chóng)——urllib_ajax的get請(qǐng)求爬取豆瓣電影前十頁(yè)

2年前作者：錯(cuò)過(guò)人間飛鴻分類：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了Python爬蟲(chóng)——urllib_ajax的get請(qǐng)求爬取豆瓣電影前十頁(yè)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

ajax： 就是一段js代碼，通過(guò)這段代碼，可以讓頁(yè)面發(fā)送異步的請(qǐng)求，或者向服務(wù)器發(fā)送一個(gè)東西，即和服務(wù)器進(jìn)行交互

對(duì)于ajax：

一定會(huì)有 url，請(qǐng)求方法(get, post)，可能有數(shù)據(jù)
一般使用 json 格式

打開(kāi)豆瓣電影，F(xiàn)12打開(kāi)控制臺(tái)（我這里是科幻類排行榜）
這是第一頁(yè)

第二頁(yè)
Python爬蟲(chóng)——urllib_ajax的get請(qǐng)求爬取豆瓣電影前十頁(yè),Python爬蟲(chóng),python,爬蟲(chóng)
第三頁(yè)就不放了
得到一個(gè)規(guī)律start =(page-1)*20文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-566432.html

import urllib.request
import urllib.parse

# 用函數(shù)封裝
# 下載豆瓣電影前10頁(yè)的數(shù)據(jù)
def create_request(page):
    base_url = 'https://movie.douban.com/j/chart/top_list?type=17&interval_id=100%3A90&action=&'

    headers = {
        '',
    }
    data = {
        'start': (page - 1) * 20,
        'limit': 20
    }

    data = urllib.parse.urlencode(data)
    url = base_url + data

    # 請(qǐng)求對(duì)象定制
    request = urllib.request.Request(url, headers=headers)

    return request

# 獲取響應(yīng)數(shù)據(jù)
def get_content(request):
    response = urllib.request.urlopen(request)

    content = response.read().decode('utf-8')

    return content

# 下載數(shù)據(jù)
def down_load(page, content):
    with open('douban' + str(page) + '.json', 'w', encoding='utf-8') as fp:
        fp.write(content)

if __name__ == '__main__':
    start_page = 1
    end_page = 10
    for page in range(start_page, end_page+1):
        request = create_request(page)
        content = get_content(request)
        down_load(page, content)

到了這里，關(guān)于Python爬蟲(chóng)——urllib_ajax的get請(qǐng)求爬取豆瓣電影前十頁(yè)的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來(lái)自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

python爬蟲(chóng)小練習(xí)——爬取豆瓣電影top250
將爬取的數(shù)據(jù)導(dǎo)入到表格中，方便人為查看。三大功能 1，下載所有網(wǎng)頁(yè)內(nèi)容。 2，處理網(wǎng)頁(yè)中的內(nèi)容提取自己想要的數(shù)據(jù) 3，導(dǎo)入到表格中 https://www.bilibili.com/video/BV1CY411f7yh/?p=15
2024年01月17日
瀏覽(22)
Python爬蟲(chóng)：一個(gè)爬取豆瓣電影人像的小案例
從谷歌瀏覽器的開(kāi)發(fā)工具進(jìn)入選擇圖片右鍵點(diǎn)擊檢查翻頁(yè)之后發(fā)現(xiàn)網(wǎng)址變化的只有start數(shù)值，每次變化值為30 Python代碼把爬取的圖片全部放到新建的文件夾中存放
2024年02月10日
瀏覽(88)
【Python】爬蟲(chóng)練習(xí)-爬取豆瓣網(wǎng)電影評(píng)論用戶的觀影習(xí)慣數(shù)據(jù)
目錄前言一、配置環(huán)境 1.1、安裝Python 1.2、?安裝Requests庫(kù)和BeautifulSoup庫(kù) 1.3.、安裝Matplotlib 二、登錄豆瓣網(wǎng)（重點(diǎn)） 2.1、獲取代理 2.2、測(cè)試代理ip是否可用 2.3、設(shè)置大量請(qǐng)求頭隨機(jī)使用 2.4、登錄豆瓣網(wǎng) 三、爬取某一部熱門電影數(shù)據(jù) 3.1、爬取全部長(zhǎng)、短評(píng)論 3.2、獲取用戶
2024年02月09日
瀏覽(27)
python爬蟲(chóng)——爬取豆瓣top250電影數(shù)據(jù)（適合初學(xué)者）
爬取豆瓣top250其實(shí)是初學(xué)者用于練習(xí)和熟悉爬蟲(chóng)技能知識(shí)的簡(jiǎn)單實(shí)戰(zhàn)項(xiàng)目，通過(guò)這個(gè)項(xiàng)目，可以讓小白對(duì)爬蟲(chóng)有一個(gè)初步認(rèn)識(shí)，因此，如果你已經(jīng)接觸過(guò)爬蟲(chóng)有些時(shí)間了，可以跳過(guò)該項(xiàng)目，選擇更有挑戰(zhàn)性的實(shí)戰(zhàn)項(xiàng)目來(lái)提升技能。當(dāng)然，如果你是小白，這個(gè)項(xiàng)目就再適合不過(guò)
2024年02月07日
瀏覽(23)
[Python練習(xí)]使用Python爬蟲(chóng)爬取豆瓣top250的電影的頁(yè)面源碼
在終端中輸入以下代碼（直接在cmd命令提示符中，不需要打開(kāi)Python）從豆瓣網(wǎng)提供的鏡像網(wǎng)站下載requests第三方庫(kù) 是從國(guó)外網(wǎng)站下載，速度慢甚至有時(shí)候無(wú)法下載運(yùn)行代碼之后，沒(méi)反應(yīng)，無(wú)輸出結(jié)果可以看一下返回的頁(yè)面請(qǐng)求狀態(tài)碼是多少：狀態(tài)碼是 418 ，所有4開(kāi)頭的狀態(tài)
2024年01月17日
瀏覽(23)
Python網(wǎng)頁(yè)爬蟲(chóng)爬取豆瓣Top250電影數(shù)據(jù)——Xpath數(shù)據(jù)解析
1.1 查看原頁(yè)面信息首先打開(kāi)豆瓣Top250電影頁(yè)面，其網(wǎng)址是：https://movie.douban.com/top250。可以發(fā)現(xiàn)，該頁(yè)面展示的電影信息有中英文電影名、導(dǎo)演、主演、上映年份、國(guó)籍、電影類型、評(píng)分等。下滑到頁(yè)面底部，發(fā)現(xiàn)第一頁(yè)有25部電影的數(shù)據(jù)，并且可以點(diǎn)擊頁(yè)碼數(shù)實(shí)現(xiàn)頁(yè)面跳轉(zhuǎn)
2024年02月05日
瀏覽(29)
Python爬蟲(chóng)案例分享【爬取豆瓣電影排行榜的電影名稱和評(píng)分】
注意：在運(yùn)行此代碼之前，請(qǐng)確保已安裝 requests 和 beautifulsoup4 庫(kù)
2024年01月19日
瀏覽(31)
【Python爬蟲(chóng)開(kāi)發(fā)實(shí)戰(zhàn)①】使用urllib以及XPath爬取可愛(ài)小貓圖片
個(gè)人主頁(yè) ：為夢(mèng)而生~ 關(guān)注我一起學(xué)習(xí)吧！專欄：python網(wǎng)絡(luò)爬蟲(chóng)從基礎(chǔ)到實(shí)戰(zhàn) 歡迎訂閱！后面的內(nèi)容會(huì)越來(lái)越有意思~ 往期推薦：【Python爬蟲(chóng)開(kāi)發(fā)基礎(chǔ)⑦】urllib庫(kù)的基本使用【Python爬蟲(chóng)開(kāi)發(fā)基礎(chǔ)⑧】XPath庫(kù)及其基本用法我們?cè)谥耙呀?jīng)有8篇文章講述基礎(chǔ)知識(shí)了，下面我們
2024年02月11日
瀏覽(168)
【Python爬蟲(chóng)開(kāi)發(fā)實(shí)戰(zhàn)②】使用urllib以及jsonpath爬取即將上映電影信息
?? 個(gè)人主頁(yè) ：為夢(mèng)而生~ 關(guān)注我一起學(xué)習(xí)吧！ ?? 專欄：python網(wǎng)絡(luò)爬蟲(chóng)從基礎(chǔ)到實(shí)戰(zhàn) 歡迎訂閱！后面的內(nèi)容會(huì)越來(lái)越有意思~ ?? 往期推薦： ??首先，我們前面講了多篇基礎(chǔ)內(nèi)容：【Python爬蟲(chóng)開(kāi)發(fā)基礎(chǔ)④】爬蟲(chóng)原理【Python爬蟲(chóng)開(kāi)發(fā)基礎(chǔ)⑤】HTML概述與基本標(biāo)簽詳解【P
2024年02月12日
瀏覽(29)
python爬取豆瓣電影排行前250獲取電影名稱和網(wǎng)絡(luò)鏈接[靜態(tài)網(wǎng)頁(yè)]————爬蟲(chóng)實(shí)例（1）
目錄 1.算法原理： 2.程序流程： 3.程序代碼： 4.運(yùn)行結(jié)果(部分結(jié)果展示)： 5.結(jié)果分析：（1）利用import命令導(dǎo)入模塊或者導(dǎo)入模塊中的對(duì)象； ①利用requests庫(kù)獲取數(shù)據(jù)； ②用BeautifulSoup庫(kù)將網(wǎng)頁(yè)源代碼轉(zhuǎn)換成BeautifulSoup類型，以便于數(shù)據(jù)的解析和處理； ③用time庫(kù)進(jìn)行時(shí)間延時(shí)
2023年04月16日
瀏覽(97)