學(xué)習(xí)Python自動(dòng)化的一個(gè)好辦法就是構(gòu)建一個(gè)價(jià)格追蹤器。由于這項(xiàng)任務(wù)生成的腳本可以立即投入使用,所以對(duì)于初學(xué)者來說尤為方便。本文將向大家介紹如何用Python采集器建立一個(gè)可立即實(shí)現(xiàn)電商價(jià)格監(jiān)控的可擴(kuò)展價(jià)格追蹤器。
價(jià)格監(jiān)控的目的
價(jià)格監(jiān)控的好處多多。對(duì)于您個(gè)人來說,通過價(jià)格監(jiān)控您可能會(huì)以最低價(jià)買到一個(gè)心儀的產(chǎn)品。
對(duì)于公司來說,價(jià)格追蹤器可以檢測(cè)競(jìng)爭(zhēng)對(duì)手的銷售價(jià)格,觀察對(duì)方何時(shí)會(huì)對(duì)相同的產(chǎn)品展開優(yōu)惠活動(dòng),或?yàn)槟漠a(chǎn)品定一個(gè)能實(shí)現(xiàn)最佳利潤(rùn)率的價(jià)格。價(jià)格監(jiān)控軟件可以幫助您恰到好處地調(diào)整價(jià)格。
抓取價(jià)格演示
# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 請(qǐng)求示例 url 默認(rèn)請(qǐng)求參數(shù)已經(jīng)做URL編碼
url = "https://注冊(cè)賬號(hào)獲取服務(wù)器地址/taobao/item_get/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=652874751412&is_promotion=1"
headers = {
"Accept-Encoding": "gzip",
"Connection": "close"
}
if __name__ == "__main__":
r = requests.get(url, headers=headers)
json_obj = r.json()
print(json_obj)
利用item_get接口可以抓取到商品詳情數(shù)據(jù),響應(yīng)參數(shù)中可以監(jiān)控到優(yōu)惠價(jià)、總價(jià)、原價(jià)等。
?
promotion_price | 優(yōu)惠價(jià) |
price | 價(jià)格 |
total_price | 總價(jià) |
suggestive_price | 建議價(jià) |
orginal_price | 原價(jià) |
?
請(qǐng)注意,本例中使用的CSS選擇器專門用于抓取目標(biāo)。如果您正在處理其他網(wǎng)站,這是您唯一要改代碼的地方。
在CSS選擇器的幫助下,我們使用BeautifulSoup來定位一個(gè)包含價(jià)格的元素。該元素存儲(chǔ)在el變量中。el標(biāo)簽的文本屬性el.text包含價(jià)格和貨幣符號(hào)。價(jià)格解析器會(huì)解析這個(gè)字符串,然后提取價(jià)格的浮點(diǎn)值。
DataFrame的對(duì)象中有一個(gè)以上的產(chǎn)品URL。我們來循環(huán)運(yùn)行所有代碼,用新的信息更DataFrame。
最簡(jiǎn)單的方法是將每一行轉(zhuǎn)換成一個(gè)字典。這樣,您可以讀取URL,調(diào)用get_price()函數(shù),并更新所需字段。文章來源:http://www.zghlxwxcb.cn/news/detail-423351.html
我們將添加兩個(gè)新的鍵值——提取的價(jià)格(price)和一個(gè)布爾值(alert),用于在發(fā)送郵件時(shí)過濾函數(shù)行。文章來源地址http://www.zghlxwxcb.cn/news/detail-423351.html
到了這里,關(guān)于Python爬取電商數(shù)據(jù):商品采集接口 商品詳情數(shù)據(jù)API 商品主圖接口的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!