国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python爬蟲:汽車之家爬蟲(完整代碼)

這篇具有很好參考價值的文章主要介紹了Python爬蟲:汽車之家爬蟲(完整代碼)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

??????????歡迎來到我的博客??????????
??作者:秋無之地

??簡介:CSDN爬蟲、后端、大數(shù)據(jù)領(lǐng)域創(chuàng)作者。目前從事python爬蟲、后端和大數(shù)據(jù)等相關(guān)工作,主要擅長領(lǐng)域有:爬蟲、后端、大數(shù)據(jù)開發(fā)、數(shù)據(jù)分析等。

??歡迎小伙伴們點(diǎn)贊????、收藏??、留言??、關(guān)注??,關(guān)注必回關(guān)

一、確定目標(biāo)數(shù)據(jù)

1、先打開目標(biāo)網(wǎng)站,找到目標(biāo)數(shù)據(jù)所在的頁面

汽車之家爬蟲,爬蟲,python,爬蟲,汽車?

2、找到目標(biāo)數(shù)據(jù)所在的api或頁面

通過f12打開調(diào)試模式,通過搜索關(guān)鍵詞,找到關(guān)鍵詞所在的api或頁面

汽車之家爬蟲,爬蟲,python,爬蟲,汽車

汽車之家爬蟲,爬蟲,python,爬蟲,汽車

3、觀察請求參數(shù)

1)header參數(shù):沒有加密數(shù)據(jù),無需登錄因此不用cookie

汽車之家爬蟲,爬蟲,python,爬蟲,汽車

2)翻頁:url參數(shù)變動了,0-1表示第一頁,0-3表示第三頁。

汽車之家爬蟲,爬蟲,python,爬蟲,汽車

二、請求接口

使用requests庫請求接口,返回?cái)?shù)據(jù)

    def get_data(self,page=1):
        '''請求接口'''
        url = f"https://car.autohome.com.cn/price/list-15_20-0-0-0-0-0-0-0-0-0-0-0-0-0-0-{page}.html"
        res = requests.get(url=url, headers=self.header).text
        # print(res)
        #返回?cái)?shù)據(jù)
        if '用戶評分' in res:
            return res
        else:
            return ""

三、數(shù)據(jù)解析

將返回的數(shù)據(jù)進(jìn)行正則匹配,然后通過遍歷提取目標(biāo)數(shù)據(jù)

 def data_deal(self,data_text=None):
        '''數(shù)據(jù)解析'''
        new_list = []
        #詳情鏈接+車名
        url_name_li = re.findall(r'<a href="/price/series-(\d+).html#pvareaid=(\d+)" target="_self" class="font-bold">(.*?)</a>',data_text)
        #用戶評分
        score_number_li = re.findall(r'<span class="score-number">(.*?)</span>',data_text)
        #級別
        info_gray_li = re.findall(r'別:<span class="info-gray">(.*?)</span>',data_text)
        #官方指導(dǎo)價
        price_li = re.findall(r'指導(dǎo)價:<span class="lever-price red"><span class="font-arial">(.*?)</span>',data_text)
        for i in range(len(url_name_li)):
            url_id1,url_id2,car_name = url_name_li[i]
            # 詳情鏈接
            info_url = f'https://car.autohome.com.cn/price/series-{url_id1}.html#pvareaid={url_id2}'
            # 用戶評分
            score_number = score_number_li[i]
            # 級別
            info_gray = info_gray_li[i]
            # 官方指導(dǎo)價
            price = price_li[i]
            new_list.append([car_name,info_url,score_number,info_gray,price])
        return new_list

四、數(shù)據(jù)存儲

數(shù)據(jù)解析后,對數(shù)據(jù)進(jìn)行拼接,然后持久化,存在csv文件

    def data_to_csv(self,data_li=None):
        '''數(shù)據(jù)存儲'''
        df = pd.DataFrame(data_li)
        df.to_csv("test2.csv", index=False)

文件內(nèi)容:

汽車之家爬蟲,爬蟲,python,爬蟲,汽車

五、完整代碼

完整代碼如下:

# -*- coding: utf-8 -*-
import math
import re

import requests
import pandas as pd


class Car_home_class():
    '''汽車之家'''

    def __init__(self):
        self.header = {
            "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36",
            "Referer":"https://car.autohome.com.cn/price/list-15_20-0-0-0-0-0-0-0-0-0-0-0-0-0-0-1.html",
        }

    def get_data(self,page=1):
        '''請求接口'''
        url = f"https://car.autohome.com.cn/price/list-15_20-0-0-0-0-0-0-0-0-0-0-0-0-0-0-{page}.html"
        res = requests.get(url=url, headers=self.header).text
        # print(res)
        #返回?cái)?shù)據(jù)
        if '用戶評分' in res:
            return res
        else:
            return ""

    def data_deal(self,data_text=None):
        '''數(shù)據(jù)解析'''
        new_list = []
        #詳情鏈接+車名
        url_name_li = re.findall(r'<a href="/price/series-(\d+).html#pvareaid=(\d+)" target="_self" class="font-bold">(.*?)</a>',data_text)
        #用戶評分
        score_number_li = re.findall(r'<span class="score-number">(.*?)</span>',data_text)
        #級別
        info_gray_li = re.findall(r'別:<span class="info-gray">(.*?)</span>',data_text)
        #官方指導(dǎo)價
        price_li = re.findall(r'指導(dǎo)價:<span class="lever-price red"><span class="font-arial">(.*?)</span>',data_text)
        for i in range(len(url_name_li)):
            url_id1,url_id2,car_name = url_name_li[i]
            # 詳情鏈接
            info_url = f'https://car.autohome.com.cn/price/series-{url_id1}.html#pvareaid={url_id2}'
            # 用戶評分
            score_number = score_number_li[i]
            # 級別
            info_gray = info_gray_li[i]
            # 官方指導(dǎo)價
            price = price_li[i]
            new_list.append([car_name,info_url,score_number,info_gray,price])
        return new_list

    def data_to_csv(self,data_li=None):
        '''數(shù)據(jù)存儲'''
        df = pd.DataFrame(data_li)
        df.to_csv("test2.csv", index=False)


    def run(self):
        # 翻頁獲取數(shù)據(jù)
        all_list = []
        all_list.append(["車名", "詳情鏈接", "用戶評分", "級別", "官方指導(dǎo)價"])
        #爬取10頁
        for page in range(1,2):
            print("當(dāng)前頁數(shù):",page)
            data_text = self.get_data(page=page)
            out_date = self.data_deal(data_text=data_text)
            print("*"*100)
            print(out_date)
            all_list += out_date
            self.data_to_csv(data_li=all_list)


if __name__ == '__main__':
    ddc = Car_home_class()
    ddc.run()

六、總結(jié)

Python爬蟲主要分三步:

  1. 請求接口
  2. 數(shù)據(jù)解析
  3. 數(shù)據(jù)存儲

版權(quán)聲明

本文章版權(quán)歸作者所有,未經(jīng)作者允許禁止任何轉(zhuǎn)載、采集,作者保留一切追究的權(quán)利。文章來源地址http://www.zghlxwxcb.cn/news/detail-760481.html

到了這里,關(guān)于Python爬蟲:汽車之家爬蟲(完整代碼)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 【Python爬蟲】利用爬蟲抓取雙色球開獎號碼,獲取完整數(shù)據(jù),簡潔45行代碼實(shí)現(xiàn),更新時間2023-06-28

    【Python爬蟲】利用爬蟲抓取雙色球開獎號碼,獲取完整數(shù)據(jù),簡潔45行代碼實(shí)現(xiàn),更新時間2023-06-28

    鏈接:https://pan.baidu.com/s/18oE308_NVNPaCOACw_H5Hw?pwd=abc1? 利用爬蟲抓取雙色球開獎號碼,獲取完整數(shù)據(jù),簡潔45行代碼實(shí)現(xiàn),更新時間2023-06-28 這是網(wǎng)上的數(shù)據(jù),怎么將它爬取下來 它將只爬取最近30期的雙色球開獎號碼,并將結(jié)果寫入到名為 \\\"雙色球開獎結(jié)果.csv\\\" 的文件中。 ? 生成

    2024年02月15日
    瀏覽(130)
  • Python爬蟲-新能源汽車對應(yīng)的“年份月份”銷量榜

    Python爬蟲-新能源汽車對應(yīng)的“年份月份”銷量榜

    前言 本文是該專欄的第15篇,后面會持續(xù)分享python爬蟲干貨知識,記得關(guān)注。 在本專欄前面,筆者有單獨(dú)詳細(xì)介紹采集新能源汽車銷量榜,感興趣的同學(xué),可以往前翻閱查看《Python爬蟲-新能源汽車銷量榜》。而之后,也有很多同學(xué)單獨(dú)私信,那如果要單獨(dú)采集 某個年份 ,

    2024年02月03日
    瀏覽(109)
  • 汽車之家Unity前端通用架構(gòu)升級實(shí)踐

    汽車之家Unity前端通用架構(gòu)升級實(shí)踐

    背景介紹 隨著之家3D虛擬化需求的增加,各產(chǎn)品線使用Unity引擎的項(xiàng)目也越來越多,新老項(xiàng)目共存,代碼維護(hù)成本也隨之增加。代碼質(zhì)量參差加之代碼規(guī)范仍沒有完全統(tǒng)一產(chǎn)生高昂學(xué)習(xí)成本進(jìn)一步加重了項(xiàng)目維護(hù)負(fù)擔(dān)。 為應(yīng)對這些問題,我們決定借助主機(jī)廠數(shù)科產(chǎn)品線銷冠神

    2024年02月03日
    瀏覽(13)
  • 汽車之家10年系統(tǒng)架構(gòu)演進(jìn)與平臺化架構(gòu)實(shí)踐

    汽車之家10年系統(tǒng)架構(gòu)演進(jìn)與平臺化架構(gòu)實(shí)踐

    目錄: 一、前言 二、架構(gòu)演進(jìn) 1、起步階段 2、微服務(wù)階段 3、主數(shù)據(jù)階段 4、平臺化架構(gòu)階段 三、平臺化架構(gòu)實(shí)踐 1、業(yè)務(wù)身份化 2、服務(wù)編排化 3、業(yè)務(wù)配置化 4、開發(fā)工具化 5、數(shù)據(jù)可視化 6、知識沉淀 四、尾聲 1、探索新零售 2、架構(gòu)升級 ? 一、前言 ? 汽車之家電商系統(tǒng)

    2024年02月06日
    瀏覽(22)
  • 汽車之家主機(jī)廠離線化 H5 Hybrid 實(shí)踐

    汽車之家主機(jī)廠離線化 H5 Hybrid 實(shí)踐

    1.背景 H5 頁面做秒開優(yōu)化是業(yè)務(wù)的常規(guī)操作,一般正常通過網(wǎng)絡(luò)請求的 H5 頁面,我們都是圍繞資源加載速度優(yōu)化展開。優(yōu)化手段主要分兩個方向,一個是提升網(wǎng)絡(luò)速度,一個是減少資源大小。 提升網(wǎng)絡(luò)速度,一般的手段有 DNS 預(yù)解析、多域名、升級 HTTP2、使用 CDN、SSR。而即

    2024年02月08日
    瀏覽(21)
  • Python:使用爬蟲抓取網(wǎng)頁中的視頻并下載(完整源碼)

    Python:使用爬蟲抓取網(wǎng)頁中的視頻并下載(完整源碼) 在今天的程序開發(fā)世界中,網(wǎng)站是不可或缺的一部分。人們使用網(wǎng)站來獲取有用的信息、購買商品和娛樂自己。這些網(wǎng)站的內(nèi)容通常包含了各種類型的文件,其中最常見的就是視頻。對于有經(jīng)驗(yàn)的程序開發(fā)者來說,使用

    2024年02月16日
    瀏覽(46)
  • Python爬蟲實(shí)戰(zhàn)(六)——使用代理IP批量下載高清小姐姐圖片(附上完整源碼)

    Python爬蟲實(shí)戰(zhàn)(六)——使用代理IP批量下載高清小姐姐圖片(附上完整源碼)

    本次爬取的目標(biāo)是某網(wǎng)站4K高清小姐姐圖片: 實(shí)現(xiàn)批量下載指定的圖片,存放到指定文件夾中: Python:3.10 編輯器:PyCharm 第三方模塊,自行安裝: 爬蟲使用代理IP的好處有以下幾點(diǎn): 輪換IP地址 :使用代理IP可以輪換IP地址,降低被封禁的風(fēng)險(xiǎn),從而保持爬取的連續(xù)性

    2024年02月07日
    瀏覽(93)
  • 汽車減震器彈簧阻尼模型及python代碼

    汽車減震器彈簧阻尼模型及python代碼

    U為主動減震施加的力。 ? 通過python control庫,可以得到在單位脈沖激勵下X1的響應(yīng)曲線 ?

    2024年02月15日
    瀏覽(23)
  • 【項(xiàng)目實(shí)訓(xùn)】汽車租貸系統(tǒng)(完整代碼)

    本實(shí)驗(yàn)旨在設(shè)計(jì)和實(shí)現(xiàn)一個汽車租賃系統(tǒng),供客戶使用。該系統(tǒng)能夠根據(jù)客戶的選擇自動計(jì)算租金、租車日期、注意事項(xiàng)以及優(yōu)惠金額等內(nèi)容,并提供相應(yīng)的服務(wù)和提示。 2.1 類的設(shè)計(jì)與實(shí)現(xiàn) 在設(shè)計(jì)與實(shí)現(xiàn)過程中,我們使用了面向?qū)ο蟮姆椒?,并按照以下步驟進(jìn)行: ①實(shí)現(xiàn)類

    2024年02月06日
    瀏覽(20)
  • 【Python爬蟲實(shí)戰(zhàn)】汽車城最好的十款車,第一名竟是這款車...Python教你一鍵采集二手車數(shù)據(jù)信息實(shí)現(xiàn)數(shù)據(jù)可視化展示哦~(附視頻教程)

    【Python爬蟲實(shí)戰(zhàn)】汽車城最好的十款車,第一名竟是這款車...Python教你一鍵采集二手車數(shù)據(jù)信息實(shí)現(xiàn)數(shù)據(jù)可視化展示哦~(附視頻教程)

    駕考不易,天天早起去練車,無論烈日還是下雨,通通都在室外進(jìn)行,但想要拿證,一定要堅(jiān) 持不懈的去練車。 粉絲白嫖源碼福利,請移步至CSDN社區(qū)或文末公眾hao即可免費(fèi)。 小編就是在一復(fù)一日的練習(xí)中,終于得到了我人生中以為不可能考證之駕照到手了! 這不?駕照到

    2024年02月02日
    瀏覽(28)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包