国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Java爬蟲(chóng)Selenium+Java+ChromeDriver【抓取百度信息】

這篇具有很好參考價(jià)值的文章主要介紹了Java爬蟲(chóng)Selenium+Java+ChromeDriver【抓取百度信息】。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問(wèn)。

一、爬蟲(chóng)工具

  • selenium
    是一個(gè)模擬瀏覽器操作的工具,背后有g(shù)oogle 維護(hù)源代碼,支持全部主流瀏覽器,支持主流的編程語(yǔ)言,包括:java,Python,C#,PHP,Ruby,等,在本項(xiàng)目上使用的Java語(yǔ)言。
    官網(wǎng):https://www.selenium.dev/documentation/
    chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

  • ChromeDriver
    使用selenium是需要瀏覽器的配合, chromeDriver,是谷歌瀏覽器的一個(gè)驅(qū)動(dòng), selenium借助chromeDriver,實(shí)現(xiàn)模擬對(duì)瀏覽器的各種操作?!?/p>

二、環(huán)境搭建

1、下載chromeDriver

http://chromedriver.storage.googleapis.com/index.html

下載的驅(qū)動(dòng)要和自己安裝的谷歌瀏覽器版本相互匹配
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

解壓以后找個(gè)位置放一下
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

2、創(chuàng)建idea項(xiàng)目

chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

3、導(dǎo)入maven依賴(lài)

chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

	<dependencies>
        <dependency>
            <groupId>org.seleniumhq.selenium</groupId>
            <artifactId>selenium-java</artifactId>
            <version>3.141.59</version>
        </dependency>
        <dependency>
            <groupId>com.google.guava</groupId>
            <artifactId>guava</artifactId>
            <version>23.0</version>
        </dependency>
        <dependency>
            <groupId>com.google.code.gson</groupId>
            <artifactId>gson</artifactId>
            <version>2.8.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.14</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.14</version>
        </dependency>
        <dependency>
            <groupId>commons-io</groupId>
            <artifactId>commons-io</artifactId>
            <version>2.8.0</version>
        </dependency>
    </dependencies>

4、編寫(xiě)測(cè)試類(lèi)

chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium

三、運(yùn)行案例

案例:百度搜索王者榮耀,
將搜索出的內(nèi)容列表保存成excel文件,
內(nèi)容主要包含內(nèi)容名稱(chēng)和url

package com.xw;

import org.openqa.selenium.By;
import org.openqa.selenium.JavascriptExecutor;
import org.openqa.selenium.Keys;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.interactions.Actions;

import java.util.List;
import java.util.concurrent.TimeUnit;

public class Test {
    public static void main(String[] args) {
        //加載谷歌瀏覽器驅(qū)動(dòng)
        System.getProperties().setProperty("webdriver.chrome.driver","D:\\ProgramSoftware\\chromedriver_win32\\chromedriver_win32 (2)\\chromedriver.exe");
        ChromeDriver chromeDriver = new ChromeDriver();
        try {
            Thread.sleep(3000);
        }catch (Exception e){
            e.printStackTrace();
        }
        //設(shè)置訪問(wèn)地址
        String url = "https://www.baidu.com/";
        chromeDriver.get(url);
        //在id為kw的輸入框當(dāng)中輸入內(nèi)容
        WebElement kw = chromeDriver.findElement(By.id("kw"));
        kw.sendKeys("王者榮耀");
        //在id為su的按鈕上點(diǎn)擊
        WebElement su = chromeDriver.findElement(By.id("su"));
        su.click();
        try {
            //設(shè)置等待
            chromeDriver.manage().timeouts().implicitlyWait(60, TimeUnit.SECONDS);
        }catch (Exception e){
            e.printStackTrace();
        }
        //找到搜索后左邊的內(nèi)容
        WebElement content_left = chromeDriver.findElement(By.id("content_left"));
        List<WebElement> elements = content_left.findElements(By.cssSelector(".c-container"));
        //遍歷出來(lái)需要的元素和內(nèi)容
        for (WebElement page : elements) {
            WebElement h3_a = page.findElement(By.cssSelector("h3 a"));
            String text = h3_a.getText();
            String href = h3_a.getAttribute("href");
            System.out.println(text);
            System.out.println(href);
            WebElement a = page.findElement(By.cssSelector("a"));
            String hrefa =  a.getAttribute("href");
            System.out.println(hrefa);
        }
        try {
            Thread.sleep(5000);
        }catch (Exception e){
            e.printStackTrace();
        }
        chromeDriver.quit();
    }

}

chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium
運(yùn)行成功
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium
chromedriver java,Java[精選]一篇精通系列【頭腦風(fēng)暴】,爬蟲(chóng),java,爬蟲(chóng),selenium文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-787918.html

到了這里,關(guān)于Java爬蟲(chóng)Selenium+Java+ChromeDriver【抓取百度信息】的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來(lái)自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • chromedriver+Selenium+springboot+Java實(shí)現(xiàn)后端截圖

    chromedriver+Selenium+springboot+Java實(shí)現(xiàn)后端截圖

    chromedriver這種方法實(shí)現(xiàn)截圖,依賴(lài)服務(wù)器端的谷歌瀏覽器軟件,需要在服務(wù)器端下載谷歌瀏覽器。 Windows服務(wù)器說(shuō)明 1.下載谷歌瀏覽器 2.根據(jù)第一步下載的谷歌瀏覽器版本,下載chromedriver,可以在這個(gè)頁(yè)面找到和版本相近的版本去下載https://googlechromelabs.github.io/chrome-for-testin

    2024年01月21日
    瀏覽(28)
  • 【Java-Crawler】爬取動(dòng)態(tài)頁(yè)面(WebMagic、Selenium、ChromeDriver)

    【Java-Crawler】爬取動(dòng)態(tài)頁(yè)面(WebMagic、Selenium、ChromeDriver)

    在上一篇說(shuō)WebMagic框架的時(shí)候( 一文學(xué)會(huì)WebMagic爬蟲(chóng)框架),提到了WebMagic僅能解析靜態(tài)頁(yè)面,滿足不了小編的爬蟲(chóng)需求了,小編現(xiàn)在要爬取動(dòng)態(tài)的頁(yè)面,需要爬取JavaScript被解析后的頁(yè)面了。 “多的不說(shuō),少的不辣”,先直接給出本篇博客需要的資源和依賴(lài)。 根據(jù)GPT的答案所

    2024年02月13日
    瀏覽(26)
  • CentOS7 啟動(dòng)谷歌瀏覽器 java+Selenium+chrome+chromedriver

    CentOS7 啟動(dòng)谷歌瀏覽器 java+Selenium+chrome+chromedriver

    前言:自己想使用該技術(shù)實(shí)現(xiàn)自動(dòng)化抓取音樂(lè),目前在window上運(yùn)行成功,需要在Linux Centos服務(wù)上跑,配置上出現(xiàn)了許多問(wèn)題,特此記錄。 參考文檔:CentOS7 安裝Selenium+chrome+chromedriver+java_遠(yuǎn)方丿的博客-CSDN博客? 我們明確的是,在window上是安裝了chrome和自帶了chromeDriver的,之所

    2024年02月11日
    瀏覽(430)
  • selenium 更新 chromedriver 驅(qū)動(dòng)

    selenium 更新 chromedriver 驅(qū)動(dòng)

    selenium 要想使用 chromedriver 驅(qū)動(dòng),必須版本要正確 在瀏覽器的導(dǎo)航欄中輸入 chrome://version 可以看到當(dāng)前瀏覽器版本為 98.0.4758.82 驅(qū)動(dòng)下載地址:http://chromedriver.storage.googleapis.com/index.html 找到對(duì)應(yīng)版本的文件夾進(jìn)入,點(diǎn)擊自己系統(tǒng)的進(jìn)行下載 其中包含了 linux 、 mac 、 windows 多版

    2024年02月11日
    瀏覽(36)
  • 【selenium--Chromedriver的簡(jiǎn)單安裝】

    selenium--Chromedriver的簡(jiǎn)單安裝 剛開(kāi)始學(xué)習(xí)selenium UI自動(dòng)化測(cè)試,寫(xiě)一個(gè)小小的筆記( 安裝教程應(yīng)該也算筆記ba ) 首先了解什么是自動(dòng)化測(cè)試,根據(jù)我極為淺顯的學(xué)習(xí)理解,就是以機(jī)器代替人工,比如說(shuō)用某些程序來(lái)代替人工測(cè)試。(好像說(shuō)了又好像沒(méi)說(shuō),大概概念是這樣吧)

    2024年02月08日
    瀏覽(17)
  • 自動(dòng)更新Selenium驅(qū)動(dòng)chromedriver

    由于谷歌游覽器經(jīng)常自動(dòng)更新導(dǎo)致selenium驅(qū)動(dòng)失效需要重新下載,如何讓代碼自動(dòng)更新selenium驅(qū)動(dòng)的方法呢? selenium連接谷歌游覽器拋出異常時(shí),會(huì)展示當(dāng)前谷歌游覽器的版本信息,我們可以到selenium驅(qū)動(dòng)下載的網(wǎng)站獲取全部版本信息,然后找個(gè)一個(gè)匹配的版本進(jìn)行下載并解壓

    2024年02月09日
    瀏覽(16)
  • ChromeDriver / Selenium-server

    ChromeDriver / Selenium-server

    ChromeDriver 是一個(gè) WebDriver 的實(shí)現(xiàn),專(zhuān)門(mén)用于自動(dòng)化控制 Google Chrome 瀏覽器。以下是關(guān)于 ChromeDriver 的詳細(xì)說(shuō)明: 定義與作用: ????????ChromeDriver 是一個(gè)獨(dú)立的服務(wù)器程序,作為客戶端庫(kù)與 Google Chrome 瀏覽器之間的橋梁,允許對(duì)瀏覽器進(jìn)行編程控制。 ????????它遵循

    2024年04月17日
    瀏覽(20)
  • selenium 谷歌驅(qū)動(dòng)(ChromeDriver)安裝教程

    selenium 谷歌驅(qū)動(dòng)(ChromeDriver)安裝教程

    首先,下載與當(dāng)前Chrome對(duì)應(yīng)的chromedriver.exe 打開(kāi)谷歌瀏覽器 找到幫助-關(guān)于?Google Chrome ?查看版本號(hào)如果顯示無(wú)法更新,可以在凌晨時(shí)分進(jìn)去查看,會(huì)更容易建立連接 第二,下載chromedriver驅(qū)動(dòng)包 下載地址:http://chromedriver.storage.googleapis.com/index.html 選擇與自己的谷歌版本相近的

    2024年02月11日
    瀏覽(109)
  • 【Selenium】下載最新117版本的ChromeDriver

    【Selenium】下載最新117版本的ChromeDriver

    用Selenium自動(dòng)化Chrome網(wǎng)頁(yè)操作,需要下載與Chrome版本配套的ChromeDriver。 Chrome經(jīng)常更新,所以常常需要下載新版本的ChromeDriver,今天發(fā)現(xiàn)最新版本的117 Driver在我過(guò)去常去的下載站上下不到了,跑了好幾個(gè)ChromeDriver的下載站,最新的都停留在114版本。 這里有最新的,選擇相應(yīng)系

    2024年02月06日
    瀏覽(16)
  • selenium下載安裝對(duì)應(yīng)的chromedriver并執(zhí)行

    selenium下載安裝對(duì)應(yīng)的chromedriver并執(zhí)行

    selenium Selenium 是廣泛使用的模擬瀏覽器運(yùn)行的庫(kù),它是一個(gè)用于 Web 應(yīng)用程序測(cè)試的工具。 Selenium 測(cè)試直接運(yùn)行在瀏覽器中,就像真正的用戶在操作一樣,并且支持大多數(shù)現(xiàn)代 Web 瀏覽器。 對(duì)應(yīng)版本chrome驅(qū)動(dòng)下載 查看瀏覽器對(duì)應(yīng)的chrome版本 瀏覽器輸入 chrome://version/ 114以及之

    2024年02月05日
    瀏覽(22)

覺(jué)得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包