国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

爬蟲之Cookie獲取:利用瀏覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法

這篇具有很好參考價值的文章主要介紹了爬蟲之Cookie獲?。豪脼g覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

爬蟲之Cookie獲?。豪脼g覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法

  • 在爬蟲或模擬請求時,特別是獲取驗證碼的時候,反爬蟲的網(wǎng)站的cookie或定期失效,復(fù)制出來使用是不行的
  • 為了應(yīng)對這種方式,我們可能就需要像瀏覽器打開網(wǎng)站一樣,取得它信任的cookie
  • selenium就是一個很好的手段

一、什么是selenium

  • Selenium最初是一個自動化測試工具,Selenium可以驅(qū)動瀏覽器自動執(zhí)行自定義好的邏輯代碼,即通過代碼完全模擬使用瀏覽器自動訪問目標(biāo)站點并操作,所以也可以用來爬蟲。

二、準(zhǔn)備工作

  • 安裝Chrome
  • 下載對應(yīng)版本的chromedriver.exe
2.1 chrome 查看版本
# chrome地址欄輸入下面的內(nèi)容即可查看
chrome://version/

爬蟲之Cookie獲取:利用瀏覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法,Java,爬蟲,java文章來源地址http://www.zghlxwxcb.cn/news/detail-795309.html

2.2 下載對應(yīng)版本的chromedriver.exe
  • 上下2圖的版本號要對應(yīng)上(最新版本的chrome的driver可能還沒有)
    爬蟲之Cookie獲?。豪脼g覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法,Java,爬蟲,java
2.3 一組對應(yīng)上的chrome和driver
  • 微信搜索“數(shù)字續(xù)堅”,在“資源”TAB頁面,輸入“selenium”,然后復(fù)制百度網(wǎng)盤的下載地址
  • 注意:chrome會自動更新,建議安裝chrome前,先在hosts文件中加入如下內(nèi)容,屏蔽chrome的自動升級
127.0.0.1 update.googleapis.com

三、編碼實現(xiàn)

  • 這里就不廢話了,如下代碼
	// Java 代碼
	//目標(biāo)網(wǎng)站的網(wǎng)址,也可以直接是驗證碼鏈接
	String targetUrl = "https://www.baidu.com";
	//設(shè)置chromedriver.exe的路徑,下方是在當(dāng)前目錄下
	System.setProperty("webdriver.chrome.driver", "./chromedriver100.exe");
	ChromeDriver chromeDriver =new ChromeDriver();
	chromeDriver.get(url);
	//讀取cookie
	Set<Cookie> cookies = chromeDriver.manage().getCookies();
	String cookieStr = "";
	for (Cookie cookie : cookies) {
	    cookieStr += cookie.getName() + "=" + cookie.getValue() + ";";
	}
	//打印cookie結(jié)果
	System.out.println(cookieStr);

四、快速獲取cookie的辦法

  • 針對其他語言、其他系統(tǒng)或不想配置chrome+driver的兄弟,這里提供了快速獲取的辦法
  • 見文檔。

到了這里,關(guān)于爬蟲之Cookie獲取:利用瀏覽器模擬一個cookie出來、面對反爬蟲、加密的cookie的應(yīng)對方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • 阿里巴巴面試算法題利用Selenium模擬瀏覽器進行爬蟲,【工作經(jīng)驗分享

    阿里巴巴面試算法題利用Selenium模擬瀏覽器進行爬蟲,【工作經(jīng)驗分享

    def clickMoreButton() - bool: try: moreButton = driver.find_element_by_css_selector(‘button.page-last-btn’) moreButton.click() return True except: return False def main(): while True: try: driver.switch_to.frame(driver.find_element_by_css_selector(“iframe[title=‘livere-comment’]”)) except: pass commentList = getCommentList() waitTime = 0 while co

    2024年04月16日
    瀏覽(56)
  • 使用selenium驅(qū)動瀏覽器時攜帶cookie實現(xiàn)模擬登陸

    使用selenium驅(qū)動瀏覽器時攜帶cookie實現(xiàn)模擬登陸

    selenium可以幫助我們驅(qū)動瀏覽器打開網(wǎng)頁,并進行一些特定的操作。但是現(xiàn)在越來越多的網(wǎng)站,也會識別selenium,并且限制了訪問條件,比如:必須登錄。 在selenium中,get_cookies()方法可以幫助我們獲取cookie。這里以知乎為例演示一下使用。 這里用到的瀏覽器驅(qū)動對象為?unde

    2024年04月14日
    瀏覽(46)
  • 通過selenium獲取瀏覽器的cookie等頭部信息

    一、背景介紹 二、實現(xiàn)方式 三、實現(xiàn)過程 1、安裝selenium-writ庫 下載路徑:https://pan.baidu.com/s/17SsvS3uF_G6PC7M1FIRveg 提取碼:ivfz 下載之后,使用pip進行安裝, cd 文件所在目錄 pip install 文件名稱 此時就安裝完成 2、導(dǎo)入使用第三方庫 此類庫就替代了selenium庫來使用 from seleniumwir

    2024年02月12日
    瀏覽(29)
  • 劃線驗證碼一直出錯?最新瀏覽器獲取京東cookie教程

    劃線驗證碼一直出錯?最新瀏覽器獲取京東cookie教程

    由于JD項目的濫用導(dǎo)致的京東滑塊驗證碼以及劃線驗證碼一直出現(xiàn)驗證失敗 1.打開手機京東app 2.進入 “我的” 頁面 3.點擊右上方的設(shè)置按鈕 4.進入“賬戶與安全” 5.修改密碼(自己記得住的) 1.打開瀏覽器開發(fā)者模式(F12)打開 m.jd.com 2.在登陸時選擇“使用密碼登錄” 3.使用

    2024年02月09日
    瀏覽(50)
  • 爬蟲進階之selenium模擬瀏覽器

    爬蟲進階之selenium模擬瀏覽器

    Selenium是一個用于自動化瀏覽器操作的工具,通常用于Web應(yīng)用測試。然而,它也可以用作爬蟲,通過模擬用戶在瀏覽器中的操作來提取網(wǎng)頁數(shù)據(jù)。以下是有關(guān)Selenium爬蟲的一些基本介紹: 瀏覽器自動化: Selenium允許你通過編程方式控制瀏覽器的行為,包括打開網(wǎng)頁、點擊按鈕

    2024年01月20日
    瀏覽(105)
  • python爬蟲之selenium模擬瀏覽器

    python爬蟲之selenium模擬瀏覽器

    之前在異步加載(AJAX)網(wǎng)頁爬蟲的時候提到過,爬取這種ajax技術(shù)的網(wǎng)頁有兩種辦法:一種就是通過瀏覽器審查元素找到包含所需信息網(wǎng)頁的真實地址,另一種就是通過selenium模擬瀏覽器的方法[1]。當(dāng)時爬的是豆瓣,比較容易分析出所需信息的真實地址,不過一般大點的網(wǎng)站像

    2024年02月03日
    瀏覽(91)
  • 【python爬蟲】設(shè)計自己的爬蟲 4. 封裝模擬瀏覽器 Selenium

    有些自動化工具可以獲取瀏覽器當(dāng)前呈現(xiàn)的頁面的源代碼,可以通過這種方式來進行爬取 一般常用的的有Selenium, playwright, pyppeteer,考慮到他們的使用有許多相同之處,因此考慮把他們封裝到一套api中 先看基類 Selenium是一個自動化測試工具,利用它可以驅(qū)動瀏覽器完成特定

    2024年02月03日
    瀏覽(91)
  • [爬蟲]2.2.1 使用Selenium庫模擬瀏覽器操作

    [爬蟲]2.2.1 使用Selenium庫模擬瀏覽器操作

    Selenium是一個非常強大的工具,用于自動化Web瀏覽器的操作。它可以模擬真實用戶的行為,如點擊按鈕,填寫表單,滾動頁面等。由于Selenium可以直接與瀏覽器交互,所以它可以處理那些需要JavaScript運行的動態(tài)網(wǎng)頁。 首先,我們需要安裝Selenium庫。你可以使用pip命令來安裝:

    2024年02月16日
    瀏覽(97)
  • 如何利用 Playwright 對已打開的瀏覽器進行爬蟲

    如何利用 Playwright 對已打開的瀏覽器進行爬蟲

    之前寫過一篇關(guān)于如何利用 Selenium 操作已經(jīng)打開的瀏覽器進行爬蟲的文章 如何利用 Selenium 對已打開的瀏覽器進行爬蟲! 最近發(fā)現(xiàn)很多人都開始摒棄 Selenium,全面擁抱 Playwright 了,那如何利用 Playwright 進行爬蟲,以應(yīng)對一些反爬嚴(yán)格的網(wǎng)站呢? 對 Playwright 不了解的小伙伴,

    2024年01月19日
    瀏覽(18)
  • 如何利用 Selenium 對已打開的瀏覽器進行爬蟲

    如何利用 Selenium 對已打開的瀏覽器進行爬蟲

    大家好! 在對某些網(wǎng)站進行爬蟲時,如果該網(wǎng)站做了限制,必須完成登錄才能展示數(shù)據(jù),而且只能通過短信驗證碼才能登錄 這時候,我們可以通過一個已經(jīng)開啟的瀏覽器完成登錄,然后利用程序繼續(xù)操作這個瀏覽器,即可以完成數(shù)據(jù)的爬取了 具體操作步驟如下: 1-1 安裝依

    2024年02月09日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包