在selenium的爬取過程中,一些網(wǎng)站會因?yàn)榫彺鎲栴}導(dǎo)致一直訪問同一個網(wǎng)頁。所以想要當(dāng)爬取多少條后就清楚下瀏覽器所有數(shù)據(jù)。
看了些網(wǎng)上的方法:
其中通過chrome瀏覽器訪問這個網(wǎng)址
chrome://settings/privacy
進(jìn)行操作清除數(shù)據(jù),是我認(rèn)為好操作的。
但審核元素時發(fā)現(xiàn)如下結(jié)構(gòu)。
方法:
讓selenium執(zhí)行js點(diǎn)擊的方法來實(shí)現(xiàn)
代碼如下文章來源:http://www.zghlxwxcb.cn/news/detail-505295.html
driver.execute_script('document.querySelector("body > settings-ui").shadowRoot.querySelector("#main").shadowRoot.querySelector("settings-basic-page").shadowRoot.querySelector("#basicPage > settings-section:nth-child(9) > settings-privacy-page").shadowRoot.querySelector("#clearBrowsingData").shadowRoot.querySelector("#subLabel").click()')
time.sleep(2)
driver.execute_script('document.querySelector("body > settings-ui").shadowRoot.querySelector("#main").shadowRoot.querySelector("settings-basic-page").shadowRoot.querySelector("#basicPage > settings-section:nth-child(9) > settings-privacy-page").shadowRoot.querySelector("settings-clear-browsing-data-dialog").shadowRoot.querySelector("#clearBrowsingDataConfirm").click()')
休息2秒是因?yàn)閐river.execute_script是異步的。第一條沒執(zhí)行完,會執(zhí)行下一條。會出錯,為了保證,所以暫停2秒,保證他們隔開。文章來源地址http://www.zghlxwxcb.cn/news/detail-505295.html
到了這里,關(guān)于selenium遇到自定義標(biāo)簽沒法爬的時候的解決方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!