python 爬蟲技術(shù),關(guān)于數(shù)據(jù)相關(guān)的拆解:
1.對頁面結(jié)構(gòu)的拆解
2.數(shù)據(jù)包的分析(是否加密了參數(shù))(Md5 aes)難易程度,價格
3.對接客戶(433,334)
# 數(shù)據(jù)庫? CSV
4.結(jié)單(發(fā)一部分?jǐn)?shù)據(jù))截圖,錄視頻
舉例如下:分析拆解過程
數(shù)據(jù)結(jié)構(gòu)分析:
如下:
寫爬蟲技術(shù)
1.確定網(wǎng)址
2.請求(難度在這個過程)
3.刷選數(shù)據(jù)
4,保存
import requests
#1.確定網(wǎng)址
Url = 'https://liak,envsc,cn/0utInterface/GetpSList,ashx?regionCode=0&psname=&SystemType=C16A8820480E678F&sgn=4a4f94d86e81fc:b99170851369&ts=1698041764795&tc=92501981
ua ={'User-Agent':Mozilla/5.0(windows NT 10.0: Win64,t/537.36(KHTMLlike Gecko)Chrome/119.0.0.0 Safari/537.36'}
# 2.請求
json _data =requests.get(url,headers=ua).json()
print(json_data)
# 3.篩選數(shù)據(jù)
for res data in json data:
g_name = res_data['ps_name']
x_zheng = res_data['region_iame']
fa_ren = res_data['corporation_name']
shuLiang = res_data['link_info']文章來源:http://www.zghlxwxcb.cn/news/detail-842786.html
# 4.保存
with open('fadianchang2.csv','a+') as file:
file.write(f'ig_name},{x_zheng},ffa_ren},{shuLiang}\n')文章來源地址http://www.zghlxwxcb.cn/news/detail-842786.html
到了這里,關(guān)于Python零基礎(chǔ)---爬蟲技術(shù)相關(guān)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!