国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

Python實現(xiàn)將pdf,docx,xls,doc,wps,zip,xlsx,ofd鏈接下載并將文件保存到本地

這篇具有很好參考價值的文章主要介紹了Python實現(xiàn)將pdf,docx,xls,doc,wps,zip,xlsx,ofd鏈接下載并將文件保存到本地。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

前言

本文是該專欄的第31篇,后面會持續(xù)分享python的各種干貨知識,值得關(guān)注。

在工作上,尤其是在處理爬蟲項目中,會遇到這樣的需求。訪問某個網(wǎng)頁或者在采集某個頁面的時候,正文部分含有docx,或pdf,或xls,或doc,或wps,或ofd,或xlsx,或zip等鏈接。需要你使用python自動將頁面上含有的這些信息鏈接下載并保存到指定文件夾。

遇到這種情況需要怎么做呢?別擔(dān)心,跟著筆者直接往下看正文的詳細(xì)解決方法。(附完整代碼)

正文

1. doc下載

在有些網(wǎng)頁的正文中,有時會有如下圖中的doc鏈接。比如爬蟲在采集正文數(shù)據(jù)的時候,像標(biāo)題,正文內(nèi)容,作者,發(fā)布時間等等信息都可以直接通過數(shù)據(jù)解析抓取并保存到本地。而下圖中的doc一般在網(wǎng)頁中,我們只需要通過鼠標(biāo)點擊就可自動下載并保存到本地目錄文件里。而通過程序代碼要怎樣讓它自動下載并保存到本地呢。實現(xiàn)方法如下:

Python實現(xiàn)將pdf,docx,xls,doc,wps,zip,xlsx,ofd鏈接下載并將文件保存到本地,Python課堂,python,docx,pdf,xls,wps,爬蟲,doc

以上圖中的doc為例,我們可以通過xpath或者正則,bs4等解析方法將其doc鏈接地址提取出來,然后使用如下文章來源地址http://www.zghlxwxcb.cn/news/detail-582045.html

到了這里,關(guān)于Python實現(xiàn)將pdf,docx,xls,doc,wps,zip,xlsx,ofd鏈接下載并將文件保存到本地的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包