国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用

這篇具有很好參考價值的文章主要介紹了網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用

第3章 爬蟲高級

學(xué)習(xí)目標(biāo):

  • 使用Selenium庫爬取前端渲染的網(wǎng)頁
  • 反反爬蟲技術(shù)

Selenium簡介

官方原文介紹:

Selenium automates browsers. That’s it! What you do with that power is entirely up to you. Primarily, it is for automating web applications for testing purposes, but is certainly not limited to just that. Boring web-based administration tasks can (and should!) be automated as well.

Selenium has the support of some of the largest browser vendors who have taken (or are taking) steps to make Selenium a native part of their browser. It is also the core technology in countless other browser automation tools, APIs and frameworks.

百度百科介紹:

Selenium [1] 是一個用于Web應(yīng)用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。支持的瀏覽器包括IE(7, 8, 9, 10, 11),[Mozilla Firefox](https://baike.baidu.com/item/Mozilla Firefox/3504923),Safari,Google Chrome,Opera等。這個工具的主要功能包括:測試與瀏覽器的兼容性——測試你的應(yīng)用程序看是否能夠很好得工作在不同瀏覽器和操作系統(tǒng)之上。測試系統(tǒng)功能——創(chuàng)建回歸測試檢驗軟件功能和用戶需求。支持自動錄制動作和自動生成 .Net、Java、Perl等不同語言的測試腳本。

簡單總結(jié):

Selenium是一個Web應(yīng)用的自動化測試框架,可以創(chuàng)建回歸測試來檢驗軟件功能和用戶需求,通過框架可以編寫代碼來啟動瀏覽器進(jìn)行自動化測試,換言之,用于做爬蟲就可以使用代碼啟動瀏覽器,讓真正的瀏覽器去打開網(wǎng)頁,然后去網(wǎng)頁中獲取想要的信息!從而實現(xiàn)真正意義上無懼反爬蟲手段!

Selenium的基本使用

  1. 根據(jù)平臺下載需要的webdriver
  2. 項目中安裝selenium-webdriver包
  3. 根據(jù)官方文檔寫一個小demo

根據(jù)平臺選擇webdriver

瀏覽器 webdriver
Chrome chromedriver(.exe)
Internet Explorer IEDriverServer.exe
Edge MicrosoftWebDriver.msi
Firefox geckodriver(.exe)
Safari safaridriver

選擇版本和平臺:

網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用,node.js進(jìn)階,爬蟲,selenium,測試工具

下載后放入項目根目錄

安裝selenium-webdriver的包

npm i selenium-webdriver

自動打開百度搜索“黑馬程序員“

const { Builder, By, Key, until } = require('selenium-webdriver');

(async function example() {
  let driver = await new Builder().forBrowser('chrome').build();
  // try {
  await driver.get('https://www.baidu.com');
  await driver.findElement(By.id('kw')).sendKeys('黑馬程序員', Key.ENTER);
  console.log(await driver.wait(until.titleIs('黑馬程序員_百度搜索'), 1000))
  // } finally {
  //   await driver.quit();
  // }
})();
實例

Selenium目錄

網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用,node.js進(jìn)階,爬蟲,selenium,測試工具

第一步:安包

第二步:npm i 安裝依賴

package.json

{
  "name": "selenium-demo",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "keywords": [],
  "author": "",
  "license": "ISC",
  "dependencies": {
    "selenium-webdriver": "^4.0.0-alpha.4"
  }
}

第三步:新建demo文件

helloworld.js

const { Builder, By, Key, until } = require('selenium-webdriver');

(async function example() {
  let driver = await new Builder().forBrowser('chrome').build();
  try {
    // 自動打開百度,并搜索黑馬程序員(webdriver)
    await driver.get('https://www.boxuegu.com');
    // 找到元素, 向里面發(fā)送一個關(guān)鍵字并按回車 sendKeys第一個參數(shù)是搜索的關(guān)鍵詞
    await driver.findElement(By.id('kw')).sendKeys('webdriver', Key.RETURN);
    // 驗證是否搜索成功
    // await driver.wait(until.titleIs('webdriver - Google Search'), 1000);
  } finally {
    // 退出
    // await driver.quit();
  }
})();

第四步:運行測試

node .\helloworld.js

此時,自動新開啟瀏覽器并進(jìn)行搜索

網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用,node.js進(jìn)階,爬蟲,selenium,測試工具文章來源地址http://www.zghlxwxcb.cn/news/detail-821353.html

到了這里,關(guān)于網(wǎng)絡(luò)爬蟲開發(fā)(五)01-爬蟲高級——Selenium簡介 & 根據(jù)平臺選擇安裝selenium-webdriver包 & Selenium的基本使用的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 電商數(shù)據(jù)抓取的幾種方式分享-開發(fā)平臺接口、網(wǎng)絡(luò)爬蟲數(shù)據(jù)、數(shù)據(jù)挖掘

    電商數(shù)據(jù)抓取的幾種方式分享-開發(fā)平臺接口、網(wǎng)絡(luò)爬蟲數(shù)據(jù)、數(shù)據(jù)挖掘

    隨著網(wǎng)絡(luò)的普及,人們網(wǎng)絡(luò)購物已然成為日常生活方式之一。電商們也是在不斷壯大成長,各電商平臺的數(shù)據(jù)量是越來越大。如何將電商大數(shù)據(jù)轉(zhuǎn)化為能為我們所用的,給我們帶來利益增長的工具呢?抓取電商數(shù)據(jù)是第一步,能夠通過快速便捷低成本的方式獲取電商數(shù)據(jù),這

    2024年02月05日
    瀏覽(90)
  • Python爬蟲技術(shù)系列-06selenium完成自動化測試V01

    Python爬蟲技術(shù)系列-06selenium完成自動化測試V01

    使用selenium庫完成動點擊下一頁,點擊視頻操作等過程, 如果你非要說這是XX,那我也不過多辯解,畢竟 批評不自由,贊美無意義 。 本案例僅是技術(shù)演示,所以會隱去相關(guān)網(wǎng)址等,讀者可以重點查看這里使用的selenium技術(shù)點即可。另外本版本為V01版本,所以僅僅是可用,很多

    2024年02月05日
    瀏覽(25)
  • Selenium + Chrome WebDriver + JS:實現(xiàn)高級爬蟲技巧,獲取網(wǎng)頁響應(yīng)狀態(tài)碼!

    隨著爬蟲技術(shù)的發(fā)展,我們使用requests庫能夠輕松獲取響應(yīng)狀態(tài)碼,但對于Selenium爬蟲,同樣可以迎刃而解。通過執(zhí)行JavaScript腳本,我們可以智能地捕獲網(wǎng)頁的響應(yīng)狀態(tài)碼,實現(xiàn)高級的爬蟲功能。 在開始之前,確保你已正確安裝Selenium和Chrome WebDriver,并配置好環(huán)境變量。 以下

    2024年02月07日
    瀏覽(19)
  • 01 Python 網(wǎng)絡(luò)爬蟲:爬蟲技術(shù)的核心原理

    不夸張地說,現(xiàn)在哪怕是初中生,只要花點兒時間、精力稍微按「網(wǎng)絡(luò)爬蟲」的開發(fā)步驟學(xué)習(xí)了解一下,也能把它玩得賊溜。 聽起來感覺是很高大上的東西,但實際上并不復(fù)雜,也就是使用了某種編程語言按照一定步驟、規(guī)則主動通過互聯(lián)網(wǎng)來抓取某些特定信息的代碼程序。

    2024年02月12日
    瀏覽(17)
  • 01-無線傳感器網(wǎng)絡(luò)(WSN)簡介

    01-無線傳感器網(wǎng)絡(luò)(WSN)簡介

    01-1定義 無線傳感器網(wǎng)絡(luò)(WSN)集成了傳感器技術(shù)、嵌入式技術(shù)、計算機(jī)網(wǎng)絡(luò)和無線通信技術(shù)等,在各個領(lǐng)域的應(yīng)用不斷擴(kuò)展,被認(rèn)為是21世紀(jì)最有影響力的技術(shù)之一。無線傳感器網(wǎng)絡(luò)是由大量靜止或移動的傳感器以自組織和多跳的方式構(gòu)成的無線網(wǎng)絡(luò),目的是協(xié)作地探測、處

    2024年02月06日
    瀏覽(24)
  • Python爬蟲實戰(zhàn):selenium爬取電商平臺商品數(shù)據(jù)(1)

    Python爬蟲實戰(zhàn):selenium爬取電商平臺商品數(shù)據(jù)(1)

    def index_page(page): “”\\\" 抓取索引頁 :param page: 頁碼 “”\\\" print(‘正在爬取第’, str(page), ‘頁數(shù)據(jù)’) try: url = ‘https://search.jd.com/Search?keyword=iPhoneev=exbrand_Apple’ driver.get(url) if page 1: input = driver.find_element_by_xpath(‘//*[@id=“J_bottomPage”]/span[2]/input’) button = driver.find_element_by_xpath(‘

    2024年04月28日
    瀏覽(39)
  • 【Python網(wǎng)絡(luò)爬蟲】企查查高級搜索及批量查詢接口爬蟲

    【Python網(wǎng)絡(luò)爬蟲】企查查高級搜索及批量查詢接口爬蟲

    寫在前面: 本文所介紹的企查查爬蟲代碼需要用到cookie,且cookie所對應(yīng)的賬號需要為vip或以上等級具有高級搜索和批量查詢的功能,無此功能的賬號暫不支持; 本文所介紹的是在其他人分析了前端headers哈希加密后的基礎(chǔ)上的進(jìn)一步補充和完善,并會提供完整的請求代碼;

    2024年02月03日
    瀏覽(16)
  • 網(wǎng)絡(luò)協(xié)議與攻擊模擬_01winshark工具簡介

    網(wǎng)絡(luò)協(xié)議與攻擊模擬_01winshark工具簡介

    網(wǎng)絡(luò)接口層(沒有特定的協(xié)議)? ? 物理層:PPPOE寬帶撥號(應(yīng)用場景:寬帶撥號,運營商切網(wǎng)過來沒有固定IP就需要撥號,家庭帶寬一般都采用的是撥號方式) 數(shù)據(jù)鏈路層 網(wǎng)絡(luò)層:IP(v4/v6) ARP(地址解析協(xié)議) RARP 、ICMP(internet控制報文協(xié)議) IGMP 傳輸層:TCP(傳輸控制

    2024年01月22日
    瀏覽(22)
  • 技能樹-網(wǎng)絡(luò)爬蟲-selenium

    技能樹-網(wǎng)絡(luò)爬蟲-selenium

    大家好,我是空空star,本篇給大家分享一下 《技能樹-網(wǎng)絡(luò)爬蟲-selenium》 。 Selenium是web自動化測試工具集,爬蟲可以利用其實現(xiàn)對頁面動態(tài)資源的采集,對于其這種說法錯誤的是: A.selenium本質(zhì)是驅(qū)動瀏覽器來發(fā)送請求,模擬瀏覽器的行為 B.頁面執(zhí)行 js 才能呈現(xiàn)的內(nèi)容,可以

    2024年02月16日
    瀏覽(10)
  • 14.網(wǎng)絡(luò)爬蟲—selenium詳講

    14.網(wǎng)絡(luò)爬蟲—selenium詳講

    前言 : ??????個人簡介:以山河作禮。 ??????:Python領(lǐng)域新星創(chuàng)作者,CSDN實力新星認(rèn)證 ?????第一篇文章《1.認(rèn)識網(wǎng)絡(luò)爬蟲》獲得 全站熱榜第一,python領(lǐng)域熱榜第一 。 ?? ??第四篇文章《4.網(wǎng)絡(luò)爬蟲—Post請求(實戰(zhàn)演示)》 全站熱榜第八 。 ?? ??第八篇文章《8.網(wǎng)

    2023年04月14日
    瀏覽(23)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包