国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

爬蟲筆記--Selenium實(shí)現(xiàn)有驗(yàn)證碼網(wǎng)站模擬登錄

這篇具有很好參考價值的文章主要介紹了爬蟲筆記--Selenium實(shí)現(xiàn)有驗(yàn)證碼網(wǎng)站模擬登錄。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

代碼如下:

import time

import ddddocr
import requests
from selenium import webdriver
from selenium.webdriver.common.by import By

# 打開google瀏覽器
option = webdriver.ChromeOptions()
option.add_argument(
    "--user-data-dir=C:\\Users\\Administrator\\AppData\\Local\\Google\\Chrome\\crawl\\Default")  # 瀏覽器存儲用戶配置文件的目錄。
option.add_argument("--profile-directory=Default")  # 選擇要與啟動的瀏覽器關(guān)聯(lián)的配置文件目錄
# 反反爬配置
option.add_argument("--disable-blink-features=AutomationControlled")  # 禁用blink特征
option.add_experimental_option('excludeSwitches', ['enable-automation'])
# 開始獲取cookie
browser = webdriver.Chrome(options=option)
browser.get("https://adv.aiclk.com/#/index/login~force=1")
time.sleep(10)
# 我們就一個賬戶, 所以在這里寫死用戶名和密碼
user_name = 'user_name'
password = 'password'
try:
    browser.find_element(By.XPATH, "http://input[@id='ctrltextusername']").click()
    browser.find_element(By.XPATH, "http://input[@id='ctrltextusername']").clear()
    browser.find_element(By.XPATH, "http://input[@id='ctrltextusername']").send_keys(user_name)
    time.sleep(2)
    browser.find_element(By.XPATH, "http://input[@id='ctrltextpassword']").click()
    browser.find_element(By.XPATH, "http://input[@id='ctrltextpassword']").clear()
    browser.find_element(By.XPATH, "http://input[@id='ctrltextpassword']").send_keys(password)
    time.sleep(3)
    # 獲取src
    code_image = browser.find_element(By.XPATH, "http://img[@id='code_image']")
    url = code_image.get_attribute('src')
    # 下載
    r = requests.get(url)
    # 識別驗(yàn)證碼
    ocr = ddddocr.DdddOcr()
    res = ocr.classification(r.content)
    print(res)
    browser.find_element(By.XPATH, "http://input[@id='ctrltextcode']").send_keys(res)
    browser.find_element(By.XPATH, "http://div[@id='ctrlbuttonsubmit']").click()
    time.sleep(10)
    cookie = ""
    for item in browser.get_cookies():
        cookie += item["name"] + "=" + item["value"] + ";"
    print(cookie)
    # 把拿到的cookie放在txt里, 之后爬取數(shù)據(jù)先拿這里的cookie, 如果過期了再來重新獲取
    with open('C:\\Users\\Administrator\\Desktop\\quick_report_crawl\\xxx.txt', 'w') as f:
        f.write(cookie)
except Exception as e:
    print('廣點(diǎn)通用戶登錄失敗, 失敗原因是: ', e)
# 至此cookie就拿到啦, 后面就是正常的業(yè)務(wù)代碼

一點(diǎn)說明:

  • 安利個巨好用的識別驗(yàn)證碼的庫<ddddocr> gitHub:https://github.com/sml2h3/ddddocr

  • 可能會在版本上遇到問題,我的報(bào)錯參考這篇文檔解決:https://blog.csdn.net/zhuchengchengct/article/details/124854199

  • 我用的版本作為參考:python是3.9.13,ddddocr是1.4.2

如有問題,歡迎大家批評指正~~文章來源地址http://www.zghlxwxcb.cn/news/detail-589239.html

到了這里,關(guān)于爬蟲筆記--Selenium實(shí)現(xiàn)有驗(yàn)證碼網(wǎng)站模擬登錄的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • Python爬蟲-使用Selenium模擬百度登錄

    Python爬蟲-使用Selenium模擬百度登錄

    ? ? 前面我已經(jīng)安裝好了Selenium并模擬成功了一下打開百度頁面并進(jìn)行查詢,讓我這個python初學(xué)者信心倍增,今天再來試一試百度登錄 把打開百度的代碼放到構(gòu)造方法中 ps:那個文件目錄是用于后面滑塊驗(yàn)證圖片保存的。 點(diǎn)擊右上角的“登錄”按鈕,打開登錄框, 代碼如下:

    2024年02月06日
    瀏覽(26)
  • 使用selenium模擬登錄解決滑塊驗(yàn)證問題

    目錄 1.登錄入口 2.點(diǎn)擊“賬號密碼登錄” 3.輸入賬號、密碼并點(diǎn)擊登錄 4.滑塊驗(yàn)證過程 5.小結(jié) 本次主要是使用selenium模擬登錄網(wǎng)頁端的TX新聞,本來最開始是模擬請求的,但是某一天突然發(fā)現(xiàn),部分賬號需要經(jīng)過滑塊驗(yàn)證才能正常登錄,如果還是模擬請求,需要的參數(shù)太多了

    2024年02月16日
    瀏覽(18)
  • python selenium模擬登錄某網(wǎng)站的滑塊拖動操作

    python selenium模擬登錄某網(wǎng)站的滑塊拖動操作

    參考文章: https://blog.csdn.net/u010945216/article/details/120838385

    2024年02月16日
    瀏覽(24)
  • Python爬蟲入門:使用selenium庫,webdriver庫模擬瀏覽器爬蟲,模擬用戶爬蟲,爬取網(wǎng)站內(nèi)文章數(shù)據(jù),循環(huán)爬取網(wǎng)站全部數(shù)據(jù)。

    Python爬蟲入門:使用selenium庫,webdriver庫模擬瀏覽器爬蟲,模擬用戶爬蟲,爬取網(wǎng)站內(nèi)文章數(shù)據(jù),循環(huán)爬取網(wǎng)站全部數(shù)據(jù)。

    *嚴(yán)正聲明:本文僅限于技術(shù)討論與分享,嚴(yán)禁用于非法途徑。 目錄 準(zhǔn)備工具: 思路: 具體操作: 調(diào)用需要的庫: 啟動瀏覽器驅(qū)動: 代碼主體: ?完整代碼(解析注釋): Python環(huán)境; 安裝selenium庫; Python編輯器; 待爬取的網(wǎng)站; 安裝好的瀏覽器; 與瀏覽器版本相對應(yīng)的

    2023年04月24日
    瀏覽(103)
  • java爬蟲遇到網(wǎng)頁驗(yàn)證碼怎么辦?(使用selenium模擬瀏覽器并用python腳本解析驗(yàn)證碼圖片)

    ????????筆者這幾天在爬取數(shù)據(jù)的時候遇到了一個很鬧心的問題,就是在我爬取數(shù)據(jù)的時候遇到了驗(yàn)證碼,而這個驗(yàn)證碼又是動態(tài)生成的,嘗試了很多方法都沒能繞開這個驗(yàn)證碼問題。 ? ? ? ? 我的解決方案是:使用selenium模擬瀏覽器行為,獲取到動態(tài)生成的驗(yàn)證碼后用

    2024年02月09日
    瀏覽(175)
  • Python小姿勢 - # Python網(wǎng)絡(luò)爬蟲之如何通過selenium模擬瀏覽器登錄微博

    Python小姿勢 - # Python網(wǎng)絡(luò)爬蟲之如何通過selenium模擬瀏覽器登錄微博

    Python網(wǎng)絡(luò)爬蟲之如何通過selenium模擬瀏覽器登錄微博 微博登錄接口很混亂,需要我們通過selenium來模擬瀏覽器登錄。 首先我們需要安裝selenium,通過pip安裝: ``` pip install selenium ``` 然后我們需要下載一個瀏覽器驅(qū)動,推薦使用Chrome,下載地址:http://chromedriver.storage.googleapis.c

    2024年02月03日
    瀏覽(94)
  • Selenium入門(二)Java整合Selenium實(shí)現(xiàn)模擬登錄

    Selenium入門(二)Java整合Selenium實(shí)現(xiàn)模擬登錄

    上一篇文章已經(jīng)講述了Java搭建Selenium環(huán)境: Selenium入門(一)Java 搭建 Selenium 環(huán)境 下面接著實(shí)現(xiàn)模擬登錄功能,這里拿自己的網(wǎng)站來進(jìn)行測試,如下圖 ? 這里我把驗(yàn)證碼固定了,所以不需要輸入驗(yàn)證碼即可實(shí)現(xiàn)。 實(shí)現(xiàn)思路 首先輸入登錄url,用WebDriver模擬打開登錄頁面 然后

    2023年04月08日
    瀏覽(18)
  • 【爬蟲】5.4 Selenium 實(shí)現(xiàn)用戶登錄

    【爬蟲】5.4 Selenium 實(shí)現(xiàn)用戶登錄

    目錄 任務(wù)目標(biāo) 創(chuàng)建模擬網(wǎng)站 創(chuàng)建服務(wù)器程序 ?鍵盤輸入動作 鼠標(biāo)點(diǎn)擊動作 編寫爬蟲程序 Selenium 查找的 HTML 元素是一個 WebElemen t對象, 這個對象不但可以獲取元素的屬性值,而且還能執(zhí)行一 些 鍵盤輸入send_keys() 與 鼠標(biāo)點(diǎn)擊click() 的動作 我們設(shè)計(jì)一個實(shí)現(xiàn) 用戶登錄并爬取

    2024年02月13日
    瀏覽(14)
  • 用Selenium實(shí)現(xiàn)滑塊驗(yàn)證碼登錄

    用Selenium實(shí)現(xiàn)滑塊驗(yàn)證碼登錄

    現(xiàn)在很多網(wǎng)站的登錄,都采用了拖動圖片滑塊的驗(yàn)證碼方式來進(jìn)行驗(yàn)證登錄,比如嗶哩嗶哩和京東等。在使用爬蟲等自動化程序時,如何通過滑塊驗(yàn)證,就成了需要解決的問題。 這里通過大名鼎鼎的ddddocr圖片識別庫,和模擬瀏覽器操作的selenium庫來實(shí)現(xiàn) 安裝瀏覽器driver 首先

    2024年01月22日
    瀏覽(17)
  • selenium+opencv實(shí)現(xiàn)模擬登陸(滑塊驗(yàn)證碼)

    selenium+opencv實(shí)現(xiàn)模擬登陸(滑塊驗(yàn)證碼)

    很多網(wǎng)站登錄登陸時都要用到滑塊驗(yàn)證碼,在某些場景例如使用爬蟲爬取信息時常常受到阻礙,想著用opencv的模板匹配試試能不能實(shí)現(xiàn)模擬登陸。本來覺得網(wǎng)上資料多應(yīng)該還蠻容易,但實(shí)際上手還是搞了蠻久,在這里記錄一下整個流程,網(wǎng)站無所謂主要是要有滑動驗(yàn)證碼:

    2023年04月14日
    瀏覽(20)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包