1.?requests 模塊post 函數(shù)
1.1 post 函數(shù)的參數(shù) (簡單版)
參數(shù)1:? url??? ?網(wǎng)絡(luò)地址
參數(shù)2:? ?data? ?請求數(shù)據(jù) (一般數(shù)據(jù)是? 賬號,密碼)
參數(shù)3:? ? headers? 頭請求? (User-Agent:? 第一章講過)
1.2? post 請求中?url 參數(shù)的獲取
1.2.1 首先 打開一個 登錄界面 。(這里以淘寶的登錄界面為樣例)
1.2.2 打開控制界面 。(點擊F12 ,或者右鍵檢查)
1.2.3 點擊網(wǎng)絡(luò)。?再點擊下一行的 全部(all)
1.2.4 點擊登錄界面的 賬號輸入的地方,獲取一個 Ping 。
1.2.5 點擊網(wǎng)絡(luò)下面的鏈接,進入post? 數(shù)據(jù)界面。
1.2.6 觀看和獲取? URL 數(shù)據(jù)。
1.3? post 請求中? data參數(shù)的 名字命名 (或者說是 data字典類型數(shù)據(jù)的 key 名字)
?1. 在淘寶登錄界面輸入賬號密碼
?2. 點擊登錄界面。
?3. 打開控制界面 -> 網(wǎng)絡(luò) --> 點擊包含check 的鏈接 --> 點擊負載 -- > 觀看參數(shù)的名字
2.lxml 模塊
2.1 lxml 模塊的簡介
?lxml模塊? 是python的一個解析庫,支持HTML和XML解析,同時支持XPath解析方式。Lxml的解析速率相較BeautifulSoup更高,后者學(xué)習(xí)相較更簡單。
?功能:用于解析HTML與XML文件;進行文件讀?。籩tree和Xpath的配合使用
2.2? lxml 模塊的使用
主要是 Xpath 對于 HTML的解析
推薦文章:Python爬蟲基礎(chǔ)教程——lxml爬取入門 - 知乎 (zhihu.com)
參考文章:?lxml模塊詳解_手工&自動化測試開發(fā)小白的博客-CSDN博客
參考文章:XPath用法及常用函數(shù)_xpath 函數(shù)_SeeUa的博客-CSDN博客
2.3? 函數(shù)? Xpath的使用? (看參考文章)
參考文章:Xpath 用法總結(jié)_xpath //_free_xiaochen的博客-CSDN博客文章來源:http://www.zghlxwxcb.cn/news/detail-629560.html
參考文章:Xpath 用法總結(jié)_xpath //_free_xiaochen的博客-CSDN博客
2.4 樣例代碼? ?(幫我找找 bug? ,我的 xpath沒有找到所有的數(shù)據(jù))文章來源地址http://www.zghlxwxcb.cn/news/detail-629560.html
import requests # http 請求函數(shù)的庫
import chardet #chardet 支持檢測中文、日文、韓文等多種語言 和 字符串編碼 函數(shù)庫
from lxml import etree
headers1 = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.188"}
url = 'https://cn.bing.com/images/search?q=%E5%9B%BE%E7%89%87&form=IQFRBA&id=4929EB0212CFAC8CB6AB59DB53A9D2D99C54FF6A&first=1&disoverlay=1' #圖片的網(wǎng)站
response = requests.get(url)
#print(response)
selector =etree.HTML(response.text)
s = selector.xpath('//img/@src')
for x in s:
print(x)
到了這里,關(guān)于Python爬蟲的學(xué)習(xí)day02 requests 模塊post 函數(shù), lmxl 模塊的 etree 模塊的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!