目錄
1 什么是excel 爬蟲(chóng)
2 EXCEL爬蟲(chóng)
2.1 excel 爬蟲(chóng)的入口
?2.2 需要配置的信息
2.2.1 如何獲得 ua信息
2.3 獲取的信息
2.3.1 獲取信息的基本內(nèi)容
2.3.2 獲取過(guò)程
2.3.3 我們只用關(guān)注“表視圖 ” 即可
2.4 EXCEL獲得的爬蟲(chóng)數(shù)據(jù) 加載到excel里
2.5 數(shù)據(jù)到了excel表后可以加工
2.6? 如何處理已經(jīng)下載到excel里的 爬蟲(chóng)table數(shù)據(jù)呢?
2.6.1 點(diǎn)擊 “查詢(xún)和連接” 或者 “現(xiàn)有鏈接” 可以重新呼出 table0 等原始的下載數(shù)據(jù)表和鏈接(右鍵呼出屬性)
2.6.2 右鍵table對(duì)應(yīng)區(qū)域,選擇 “從表格/區(qū)域 獲取數(shù)據(jù)” 可以重新打開(kāi) power query來(lái)處理數(shù)據(jù)
2.7? 設(shè)置table表自動(dòng)更新
2.7.1 設(shè)置自動(dòng)更新
2.7.2 自動(dòng)更新作用
1 什么是excel 爬蟲(chóng)
excel也可以爬蟲(chóng),我是一本書(shū)上看到的,還有點(diǎn)意思
好處:
- 而且可以不用寫(xiě)代碼,純界面操作
- 理解起來(lái),對(duì)新手還是比較友好的
- 功能還不少
- 但是如果懂爬蟲(chóng),懂html,js等,對(duì)理解excel爬蟲(chóng)還是有好處的,比如,
2 EXCEL爬蟲(chóng)
2.1 excel 爬蟲(chóng)的入口
?2.2 需要配置的信息
- url
- 網(wǎng)頁(yè)請(qǐng)求相關(guān),比如? ua,cookies 等 headers信息
- 然后點(diǎn)擊確定即可
2.2.1 如何獲得 ua信息
- 網(wǎng)頁(yè)檢查
- 刷新網(wǎng)頁(yè)
- 網(wǎng)頁(yè)url對(duì)應(yīng)的選項(xiàng)
- networks /request headers 可以找到 UA信息?User-Agent:
2.3 獲取的信息
2.3.1 獲取信息的基本內(nèi)容
- 網(wǎng)頁(yè)url
- docment
- table
- 可能因?yàn)閑xcel 主要用來(lái)處理 表格,所以excel 爬蟲(chóng)著重突出了 table?
- 其實(shí)就是html里的 <table></table>的tag
2.3.2 獲取過(guò)程
- 快的網(wǎng)頁(yè)一瞬間就完成了
- 如果反映慢則可能看到如下過(guò)程
- 正在連接url
- 獲取數(shù)據(jù)
- 數(shù)據(jù)下載完成
?
2.3.3 我們只用關(guān)注“表視圖 ” 即可
- 表視圖
- web視圖,沒(méi)啥用
?
2.4 EXCEL獲得的爬蟲(chóng)數(shù)據(jù) 加載到excel里
- 點(diǎn)擊? 加載,存儲(chǔ)到excel, 用新的sheet 存檔當(dāng)前excel里
- 點(diǎn)擊 加載到
- 點(diǎn)擊 轉(zhuǎn)換數(shù)據(jù),會(huì)跳轉(zhuǎn)到? power query 處理數(shù)據(jù)
2.5 數(shù)據(jù)到了excel表后可以加工
- 數(shù)據(jù)到了excel表后可以加工
- 也可以使用 power query 加工(暫時(shí)不熟悉,留白)
2.6? 如何處理已經(jīng)下載到excel里的 爬蟲(chóng)table數(shù)據(jù)呢?
2.6.1 點(diǎn)擊 “查詢(xún)和連接” 或者 “現(xiàn)有鏈接” 可以重新呼出 table0 等原始的下載數(shù)據(jù)表和鏈接(右鍵呼出屬性)
2.6.2 右鍵table對(duì)應(yīng)區(qū)域,選擇 “從表格/區(qū)域 獲取數(shù)據(jù)” 可以重新打開(kāi) power query來(lái)處理數(shù)據(jù)
- 入口:右鍵table對(duì)應(yīng)區(qū)域,選擇 “從表格/區(qū)域 獲取數(shù)據(jù)” 可以重新打開(kāi) power query來(lái)處理數(shù)據(jù)
- 左上角 側(cè)邊欄 會(huì)顯示多個(gè)爬取的table0 表(默認(rèn)下載的表名)
- 右下角會(huì)顯示 爬取的時(shí)間
2.7? 設(shè)置table表自動(dòng)更新
2.7.1 設(shè)置自動(dòng)更新
-
點(diǎn)擊 “查詢(xún)和連接” 或者 “現(xiàn)有鏈接” 可以重新呼出 table0
-
然后,點(diǎn)擊右邊側(cè)邊欄的table0 右鍵呼出屬性
-
屬性窗口里的設(shè)置
2.7.2 自動(dòng)更新作用
- 可以定時(shí),循環(huán)監(jiān)控網(wǎng)頁(yè)內(nèi)容,爬取下來(lái)
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-491446.html
?文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-491446.html
到了這里,關(guān)于excel爬蟲(chóng)相關(guān)學(xué)習(xí)1:簡(jiǎn)單的excel爬蟲(chóng)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!