国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python爬蟲(chóng)之用Selenium做爬蟲(chóng)

這篇具有很好參考價(jià)值的文章主要介紹了Python爬蟲(chóng)之用Selenium做爬蟲(chóng)。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

我們?cè)谟胮ython做爬蟲(chóng)的時(shí)候,除了直接用requests的架構(gòu),還有Scrapy、Selenium等方式可以使用,那么今天我們就來(lái)聊一聊使用Selenium如何實(shí)現(xiàn)爬蟲(chóng)。

Selenium是什么?

Selenium是一個(gè)瀏覽器自動(dòng)化測(cè)試框架,是一款用于Web應(yīng)用程序測(cè)試的工具??蚣艿讓邮褂肑avaScript模擬真實(shí)用戶對(duì)瀏覽器進(jìn)行操作。測(cè)試腳本執(zhí)行時(shí),瀏覽器自動(dòng)按照腳本代碼做出點(diǎn)擊,輸入,打開(kāi),驗(yàn)證等操作,就像真實(shí)用戶所做的一樣,從終端用戶的角度測(cè)試應(yīng)用程序。使瀏覽器兼容性測(cè)試自動(dòng)化成為可能,盡管在不同的瀏覽器上依然有細(xì)微的差別。使用簡(jiǎn)單,可使用Java,Python等多種語(yǔ)言編寫(xiě)用例腳本。(百度百科)

如何使用Selenium?

首先下載Selenium這個(gè)庫(kù),pip install selenium。接著查看Selenium支持的瀏覽器,這里就使用都會(huì)有的chrome谷歌瀏覽器,如果想要查看能用什么瀏覽器可以使用下面這些代碼,就可以看到支持的瀏覽器和版本:

from selenium import webdriver
help(webdriver)

python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取

然后再對(duì)應(yīng)著瀏覽器的版本找相應(yīng)的瀏覽器驅(qū)動(dòng)。

驅(qū)動(dòng)的位置一定要放在沒(méi)有中文字符的文件夾中,好這個(gè)地址,有用。

使用Selenium主要是調(diào)用它的webdriver模塊,具體操作如下:

from selenium import webdriver
path = '/Users/14163/Downloads/chromedriver_win32/chromedriver.exe'#這里是保存的驅(qū)動(dòng)的位置
browser = webdriver.Chrome(executable_path=path)  #初始化驅(qū)動(dòng)對(duì)象

browser.get('http://www.baidu.com')        #獲取url
print(browser.page_source)                #輸出獲取到的文件數(shù)據(jù)
browser.close()                          #關(guān)閉瀏覽器

結(jié)果:
python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取

再對(duì)比一下requests獲取的網(wǎng)頁(yè)的數(shù)據(jù):
python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取

很明顯selenium能獲取得到的內(nèi)容更多selenium有相應(yīng)的函數(shù)去查找數(shù)據(jù),單個(gè)元素的三種不同的方式去獲取響應(yīng)的元素,第一種是通過(guò)id的方式,第二個(gè)中是CSS選擇器,第三種是xpath選擇器,結(jié)果都是相同的。

這里是按id去查找,可以加text或者tag獲取里面的內(nèi)容。

python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取

或者可以調(diào)用另一個(gè)庫(kù)去獲取id,By

先 導(dǎo)入庫(kù):

from selenium.webdriver.common.by import By

python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取
這樣就可以獲取網(wǎng)頁(yè)的數(shù)據(jù)。

這些只是獲取一個(gè)元素的,可以獲取多個(gè)元素加用find_elements即可。

交互操作:

對(duì)網(wǎng)頁(yè)進(jìn)行操作,比如在百度的搜索框輸入孤獨(dú)的s,然后點(diǎn)擊搜索就可以這樣:

按以下代碼:

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
path = '/Users/14163/Downloads/chromedriver_win32/chromedriver.exe'
browser = webdriver.Chrome(executable_path=path)
browser.get('http://www.baidu.com')
input_first = browser.find_element(By.ID,"kw")
print(input_first)
input_first.send_keys("孤獨(dú)的s")
time.sleep(0.1)
button = browser.find_element_by_class_name('s_btn_wr')  #這里獲取百度搜索的那個(gè)按鈕
button.click()# 點(diǎn)擊

結(jié)果:
python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取

在chrome中想要找到對(duì)應(yīng)的按鈕的元素或者id,可以點(diǎn)擊紅圈這個(gè),然后再去移動(dòng)去原網(wǎng)頁(yè),就可以知道結(jié)果:
python selenium爬蟲(chóng),python,爬蟲(chóng),selenium,開(kāi)發(fā)語(yǔ)言,數(shù)據(jù)抓取
不得不說(shuō),selenium真便利。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-535107.html

到了這里,關(guān)于Python爬蟲(chóng)之用Selenium做爬蟲(chóng)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • python 配置 selenium爬蟲(chóng)

    python 配置 selenium爬蟲(chóng)

    這兩天學(xué)習(xí)Python爬蟲(chóng),記錄一下這個(gè)折磨我一兩個(gè)小時(shí)的配置。 值得注意的是,下載的chromedriver.exe文件必須放在和運(yùn)行的.py文件同一目錄下,否則就會(huì)報(bào)錯(cuò): selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH. Please see https://chromedriver.chromium.or

    2024年02月03日
    瀏覽(24)
  • python爬蟲(chóng)(selenium)

    目錄 準(zhǔn)備 體驗(yàn)示例 創(chuàng)建瀏覽器驅(qū)動(dòng)對(duì)象 訪問(wèn)頁(yè)面 查找節(jié)點(diǎn) 節(jié)點(diǎn)交互 切換Frame 延時(shí)等待 前進(jìn)和后退 Cookies 選項(xiàng)卡管理 準(zhǔn)備 (1)瀏覽器驅(qū)動(dòng) :http://chromedriver.storage.googleapis.com/index.html (2)selenium第三方庫(kù) :pip install selenium 注意: 瀏覽器驅(qū)動(dòng)需要根據(jù)自身瀏覽器版本去下

    2024年02月03日
    瀏覽(28)
  • python爬蟲(chóng)——selenium

    python爬蟲(chóng)——selenium

    目錄 一、背景?編輯 1.1、selenium的發(fā)展 1.2、在爬蟲(chóng)中的應(yīng)用 1.3selenium執(zhí)行原理圖 1.4、WebDriver,與WebElement 二、準(zhǔn)備?編輯 2.1、下載驅(qū)動(dòng) 2.2、安裝Selenium庫(kù) 2.3、簡(jiǎn)單使用 三、實(shí)用操作?編輯 3.1、查找節(jié)點(diǎn) 3.1.1、查找元素在網(wǎng)頁(yè)中的位置(網(wǎng)址為www.baidu.com,代碼中的注釋很詳

    2024年02月09日
    瀏覽(21)
  • python selenium 爬蟲(chóng)教程

    Python和Selenium是很強(qiáng)大的爬蟲(chóng)工具,可以用于自動(dòng)化地模擬瀏覽器行為,從網(wǎng)頁(yè)中提取數(shù)據(jù)。下面是一個(gè)簡(jiǎn)單的使用Python和Selenium進(jìn)行爬蟲(chóng)的案例。 1. 安裝和配置: 首先,你需要安裝Python和Selenium??梢允褂胮ip命令來(lái)安裝Selenium庫(kù): pip install selenium 。 然后,你還需要下載對(duì)應(yīng)

    2024年02月09日
    瀏覽(86)
  • python爬蟲(chóng)-Selenium

    python爬蟲(chóng)-Selenium

    Selenium是一個(gè)用于Web應(yīng)用程序測(cè)試的工具,Selenium 測(cè)試直接運(yùn)行在瀏覽器中,就像真正的用戶在操作一樣。模擬瀏覽器功能,自動(dòng)執(zhí)行網(wǎng)頁(yè)中的js代碼,實(shí)現(xiàn)動(dòng)態(tài)加載。 打開(kāi)谷歌瀏覽器--右上角三個(gè)點(diǎn)--幫助--關(guān)于 下載地址:http://chromedriver.storage.googleapis.com/index.html 找到對(duì)應(yīng)瀏

    2024年02月09日
    瀏覽(24)
  • Python:爬蟲(chóng)財(cái)經(jīng)數(shù)據(jù)-selenium

    Python:爬蟲(chóng)財(cái)經(jīng)數(shù)據(jù)-selenium

    最近十年中,各類(lèi)因果推斷方法層出不窮。令人欣喜的同時(shí),也讓很多人無(wú)所適從。雖然借助 Stata,R,Python 等軟件很容易「跑出」結(jié)果,但很多人應(yīng)該都經(jīng)歷過(guò)如下「囧境」: 雖然有很多方法可以用,但由于不清楚原理,不知道該用哪個(gè)? 雖然自己很努力地跑代碼、看文獻(xiàn)

    2024年04月28日
    瀏覽(26)
  • python爬蟲(chóng)10:selenium庫(kù)

    python爬蟲(chóng)10:selenium庫(kù)

    前言 ? python實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲(chóng)非常簡(jiǎn)單,只需要掌握一定的基礎(chǔ)知識(shí)和一定的庫(kù)使用技巧即可。本系列目標(biāo)旨在梳理相關(guān)知識(shí)點(diǎn),方便以后復(fù)習(xí)。 申明 ? 本系列所涉及的代碼僅用于個(gè)人研究與討論,并不會(huì)對(duì)網(wǎng)站產(chǎn)生不好影響。 目錄結(jié)構(gòu) 1. 概述與安裝 1.1 概述 ? selenium其實(shí)嚴(yán)

    2024年02月11日
    瀏覽(16)
  • Python爬蟲(chóng)基礎(chǔ)之 Selenium

    Python爬蟲(chóng)基礎(chǔ)之 Selenium

    1.1什么是Selenium? Selenium是一個(gè)瀏覽器自動(dòng)化測(cè)試框架,是一款用于Web應(yīng)用程序測(cè)試的工具。框架底層使用JavaScript模擬真實(shí)用戶對(duì)瀏覽器進(jìn)行操作。測(cè)試腳本執(zhí)行時(shí),瀏覽器自動(dòng)按照腳本代碼做出點(diǎn)擊,輸入,打開(kāi),驗(yàn)證等操作,就像真實(shí)用戶所做的一樣,從終端用戶的角度

    2024年01月23日
    瀏覽(21)
  • python爬蟲(chóng)----selenium特征去除

    文件下載:https://download.csdn.net/download/Natalie_Lv/86723031

    2024年02月15日
    瀏覽(22)
  • Python爬蟲(chóng)——selenium_交互

    交互: 點(diǎn)擊:button.click() 輸入:inputs.send_keys() 后退操作:browser.back() 前進(jìn)操作:browser.forword() 模擬js滾動(dòng):browser. 獲取網(wǎng)頁(yè)代碼:page_source 退出: browser.quit() 完整代碼:

    2024年02月09日
    瀏覽(12)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包