這里以谷歌瀏覽器為例,需要安裝一下chromedriver,其他瀏覽器也有相對應的driver,chromedriver下載地址:https://googlechromelabs.github.io/chrome-for-testing/
然后是打開python環(huán)境安裝一下依賴pip install selenium
,驗證一下控制瀏覽器是否成功
# -*- coding: utf-8 -*-
from selenium import webdriver
driverPath = r'D:\chromedriver-win64\chromedriver.exe'
driver = webdriver.Chrome(executable_path=driverPath)
url = 'http://www.baidu.com'
driver.get(url)
點擊運行腳本可以看到以下頁面就成功了。
爬蟲的話需要使用到以下相關(guān)函數(shù):文章來源:http://www.zghlxwxcb.cn/news/detail-767205.html
driver.find_element_by_class_name("class") # 通過class屬性值定位
driver.find_element_by_id("id") # 通過id值定位
driver.find_element_by_name("name") # 通過屬性名稱定位
driver.find_element_by_css_selector("selector") # 通過css選擇器定位,格式是(‘標簽名[屬性名=”屬性值”]’)
driver.find_element_by_link_text("text") # 通過超鏈接文本定位
driver.find_element_by_tag_name("tag") # 通過標簽定位
driver.find_element_by_xpath("path") # 通過xpath路徑定位
還有其他的輸入操作send_keys
和點擊操作click()
等等這些基本上滿足瀏覽器的大部分操作需求文章來源地址http://www.zghlxwxcb.cn/news/detail-767205.html
到了這里,關(guān)于python使用selenium控制瀏覽器進行爬蟲的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!