国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

selenium+xpath爬取二手房標(biāo)題

這篇具有很好參考價值的文章主要介紹了selenium+xpath爬取二手房標(biāo)題。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報違法"按鈕提交疑問。

selenium爬取我愛我家二手房,selenium,python,爬蟲

貝殼找房標(biāo)題爬取需要注意的是,在頁面中間有一個小廣告

而他就在ul的li下面,當(dāng)我們進(jìn)行title所以輸出時,會報錯。

所以在進(jìn)行頁面解析之前必須把廣告叉掉,不然也把廣告那一部分的li給爬取下來了

selenium爬取我愛我家二手房,selenium,python,爬蟲

所以,我們,定位到上面箭頭那里,進(jìn)行?x掉,也就是利用click事件進(jìn)行處理

然后第二個就是當(dāng)進(jìn)行下一頁時,url會更換

所以當(dāng)我們要第23456……頁時,必須刷新新的url

(如果換頁時,url沒變的情況下,則只需元素定位到下一頁的按鈕進(jìn)行click事件處理即可)。

要注意的就是以上那么多,代碼如下

?

from selenium import webdriver
from lxml import etree
from selenium.webdriver.common.by import By
from time import sleep
from selenium.webdriver import ChromeOptions
cho=ChromeOptions()
cho.add_experimental_option('excludeSwitches',['enable-automation'])
#瀏覽器驅(qū)動
bro=webdriver.Chrome(options=cho)
sleep(1)
all_page=[]
for i in range(5):
    bro.get(f'https://bj.ke.com/ershoufang/pg{i+1}/')
    # 睡個兩秒,防止頁面沒有加載完成
    sleep(2)
    #把廣告去掉,因?yàn)閺V告是ul下的一個li。
    bro.find_element(By.CLASS_NAME,'daoliu_close').click()
    #點(diǎn)擊后進(jìn)行解析,并且放進(jìn)列表里面
    all_page.append(bro.page_source)
    print(f'已經(jīng)把第{i+1}頁HTML內(nèi)容放入列表中')
    print('--------------------------------------------------------------------------------------------------------------')

s=1
#頁面列表循環(huán)遍歷進(jìn)行解析。
for page in all_page:
    tree=etree.HTML(page)
    #睡個兩秒,防止頁面沒有加載完成
    sleep(2)
    li_list=tree.xpath('/html/body/div[1]/div[4]/div[1]/div[4]/ul/li')
    #再睡個兩秒,防止頁面沒有加載完成
    sleep(2)
    print(f"正在爬取第{s}頁內(nèi)容****************************************************")
    sleep(1)
    #打印測試有沒有空元素
    print(len(li_list))
    for dl in li_list:
      title=dl.xpath('./a/@title')[0]#@title只有一個所以【0】就行
      print(title)
    print(f'第{s}爬取完成*********************************************************')
    s=s+1
    sleep(1)
sleep(2)
bro.quit()

selenium爬取我愛我家二手房,selenium,python,爬蟲

selenium爬取我愛我家二手房,selenium,python,爬蟲?文章來源地址http://www.zghlxwxcb.cn/news/detail-807712.html

到了這里,關(guān)于selenium+xpath爬取二手房標(biāo)題的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 大數(shù)據(jù)畢業(yè)設(shè)計 二手房數(shù)據(jù)爬取與分析可視化系統(tǒng) -python

    大數(shù)據(jù)畢業(yè)設(shè)計 二手房數(shù)據(jù)爬取與分析可視化系統(tǒng) -python

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計項(xiàng)

    2024年02月16日
    瀏覽(31)
  • 計算機(jī)畢設(shè) 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    計算機(jī)畢設(shè) 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計項(xiàng)

    2024年02月04日
    瀏覽(30)
  • python畢設(shè)選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    python畢設(shè)選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計項(xiàng)

    2024年01月20日
    瀏覽(30)
  • 大數(shù)據(jù)畢設(shè)分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    大數(shù)據(jù)畢設(shè)分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長分享優(yōu)質(zhì)畢業(yè)設(shè)計項(xiàng)

    2024年01月23日
    瀏覽(34)
  • Python二手房價格預(yù)測(三)——二手房價格預(yù)測模型baseline

    Python二手房價格預(yù)測(三)——二手房價格預(yù)測模型baseline

    一、Python二手房價格預(yù)測(一)——數(shù)據(jù)獲取 二、Python二手房價格預(yù)測(二)——數(shù)據(jù)處理及數(shù)據(jù)可視化 ? ? ? ? 在上次分享中我們對數(shù)據(jù)進(jìn)行了部分預(yù)處理和數(shù)據(jù)可視化,接下來將對數(shù)據(jù)完全處理,并且使用幾種基線模型對二手房的價格進(jìn)行預(yù)測。 ? ? ? ? 上次分享中我

    2024年01月20日
    瀏覽(27)
  • Python爬蟲-貝殼二手房

    Python爬蟲-貝殼二手房

    前言 本文是該專欄的第3篇,后面會持續(xù)分享python爬蟲案例干貨,記得關(guān)注。 本文以某二手房網(wǎng)為例,如下圖所示,采集對應(yīng)城市的二手房源數(shù)據(jù)。具體思路和方法跟著筆者直接往下看正文詳細(xì)內(nèi)容。(附帶完整代碼) 正文 地址 :aHR0cHM6Ly9zei5rZS5jb20vZXJzaG91ZmFuZy8= 目標(biāo) :采集

    2024年02月16日
    瀏覽(20)
  • python抓取上海某二手房交易網(wǎng)站數(shù)據(jù)

    python抓取上海某二手房交易網(wǎng)站數(shù)據(jù)

    1.使用mysql創(chuàng)建lianjiaershoufang的數(shù)據(jù)庫 2.創(chuàng)建chengjiao table,屬性如下: 3.爬取數(shù)據(jù)將數(shù)據(jù)一條一條導(dǎo)入數(shù)據(jù)庫 獲取月均價和月成交量,并作圖

    2024年02月04日
    瀏覽(34)
  • Python房價分析和可視化<anjuke二手房>

    Python房價分析和可視化<anjuke二手房>

    本文是Python數(shù)據(jù)分析實(shí)戰(zhàn)的房價分析系列,本文分析二線城市貴陽的二手房。 數(shù)據(jù)獲取 本文的數(shù)據(jù)來源于2022年7月anjuke的二手房數(shù)據(jù)。對數(shù)據(jù)獲取不感興趣可以跳過此部分看分析和可視化。 anjuke二手房數(shù)據(jù)和新房數(shù)據(jù)一樣,不需要抓包,直接拼接url即可。步驟如下: 1.訪問

    2024年02月06日
    瀏覽(25)
  • 基于python的二手房數(shù)據(jù)分析,思路+代碼范例

    基于python的二手房數(shù)據(jù)分析,思路+代碼范例

    本篇博客將基于 Python ,梳理二手房數(shù)據(jù)分析的整體過程。 數(shù)據(jù)收集 :從網(wǎng)站或其他數(shù)據(jù)源收集二手房數(shù)據(jù),并將其存儲在 CSV 或其他數(shù)據(jù)格式中。 數(shù)據(jù)清洗 :讀取數(shù)據(jù)并進(jìn)行數(shù)據(jù)清洗,刪除缺失或異常數(shù)據(jù)。 數(shù)據(jù)分析 :使用 Python 中的數(shù)據(jù)分析庫,如 pandas 和 numpy,對數(shù)

    2024年02月11日
    瀏覽(29)
  • Python房價分析和可視化<房天下二手房>

    Python房價分析和可視化<房天下二手房>

    本文是Python數(shù)據(jù)分析實(shí)戰(zhàn)的房價分析系列,本文分析二線城市貴陽的二手房。 數(shù)據(jù)獲取 本文的數(shù)據(jù)來源于2022年8月房天下的二手房數(shù)據(jù)。對數(shù)據(jù)獲取不感興趣可以跳過此部分看分析和可視化。 1.訪問目標(biāo)頁面 進(jìn)入網(wǎng)站首頁,點(diǎn)擊選擇城市和二手房進(jìn)入二手房信息頁面,篩選

    2023年04月08日
    瀏覽(14)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包