国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

數(shù)據(jù)分析與可視化(python大作業(yè))

這篇具有很好參考價(jià)值的文章主要介紹了數(shù)據(jù)分析與可視化(python大作業(yè))。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

目錄

涉及知識(shí)

自動(dòng)打開想要獲取到數(shù)據(jù)的頁(yè)面

繪制統(tǒng)計(jì)圖

初步設(shè)計(jì)過程

自動(dòng)化測(cè)試

所需數(shù)據(jù)包

初步過程分析

爬取數(shù)據(jù)

所需數(shù)據(jù)包

初步過程分析

數(shù)據(jù)分析與可視化(繪圖)

所需數(shù)據(jù)包

各類統(tǒng)計(jì)圖簡(jiǎn)介:

詳細(xì)設(shè)計(jì)過程

導(dǎo)入所有數(shù)據(jù)包與數(shù)據(jù)集

數(shù)據(jù)分析

數(shù)據(jù)情況預(yù)覽

數(shù)據(jù)獲取與分析?

存儲(chǔ)

涉及知識(shí)

按照實(shí)驗(yàn)完成順序:

·自動(dòng)化測(cè)試:selenium

·爬蟲:requests

·數(shù)據(jù)解析:json

·數(shù)據(jù)清洗

·數(shù)據(jù)分析:numpy,matpltlib,pandas

自動(dòng)打開想要獲取到數(shù)據(jù)的頁(yè)面

1)注意偽裝好,繞過瀏覽器識(shí)別;

(2反反爬。

繪制統(tǒng)計(jì)圖

(1)注意即將繪制的圖是否有缺失值等;

(2)注意查看數(shù)據(jù)問題。

初步設(shè)計(jì)過程

自動(dòng)化測(cè)試

所需數(shù)據(jù)包

from selenium import webdriver

from time import sleep

from selenium.webdriver import ActionChains

from selenium.webdriver.common.by import By

from selenium.webdriver.common.keys import Keys

初步過程分析

(1)確定瀏覽器版本,下載相應(yīng)驅(qū)動(dòng)。

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

(2)防止瀏覽器自動(dòng)關(guān)閉

option = webdriver.EdgeOptions()

option.add_experimental_option('excludeSwitches', ['enable-automation'])

option.add_experimental_option("detach", True)

driver = webdriver.Edge(executable_path='./edge driver', options=option)

(3)進(jìn)入12306官網(wǎng),尋找相應(yīng)標(biāo)簽,定位元素位置(id, name, class, tag, xpath, css, link等)。

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

(4)一些網(wǎng)站具有反爬機(jī)制,反爬方式多種多樣,12306中為驗(yàn)證碼滑塊,主要用到行為鏈,讓瀏覽器識(shí)別不到爬蟲。

具體操作:找到滑塊id('nc_1_n1z'),創(chuàng)建對(duì)象,判斷,執(zhí)行。

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

(5) 成功登錄后,有目的性地尋找所需標(biāo)簽,模仿鼠標(biāo)與鍵盤響應(yīng)方式。常見的一些方法如下:click(),clear(),send_keys(),perform()等。如下所示:

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

(6)此次實(shí)驗(yàn),我沒有完成最后一步,因?yàn)?2306每天只有三次取消訂單機(jī)會(huì),而且我最近測(cè)試次數(shù)比較多,害怕被拉入黑名單。

(7)完成這些之后,開始爬取當(dāng)前頁(yè)面我們想要的數(shù)據(jù)。

爬取數(shù)據(jù)

所需數(shù)據(jù)包

import requests

import pandas as pd

import json

from tqdm import tqdm

初步過程分析

(1)確定目標(biāo)網(wǎng)址:

如我要獲取12306中從太原南到侯馬西,往返,2022-11-19日的所有車票信息,網(wǎng)址如下圖所示,除此之外,仍然要做好偽裝,如下圖 3.11所示,其中User-Agent用戶代理,瀏覽器基本身份標(biāo)識(shí)),Cookie(用戶信息,常用于檢測(cè)是否登陸賬號(hào))都是用來偽裝的。

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

python數(shù)據(jù)分析與可視化,python,數(shù)據(jù)分析,matplotlib,pandas,numpy

(2)獲取網(wǎng)頁(yè)數(shù)據(jù):

獲取網(wǎng)頁(yè)數(shù)據(jù),也就是通過網(wǎng)址( URL:Uniform Resource Locator,統(tǒng)一資源 定位符),獲得網(wǎng)絡(luò)的數(shù)據(jù),充當(dāng)搜索引擎。當(dāng)輸入網(wǎng)址,我們就相當(dāng)于對(duì)網(wǎng)址服務(wù)器發(fā)送了一個(gè)請(qǐng)求,網(wǎng)站服務(wù)器收到以后,進(jìn)行處理和解析,進(jìn)而給我們一個(gè)相應(yīng)的相應(yīng)。如果網(wǎng)絡(luò)正確并且網(wǎng)址不錯(cuò),一般都可以得到網(wǎng)頁(yè)信息,否則告訴我們一個(gè)錯(cuò)誤代碼,比如404. 整個(gè)過程可以稱為請(qǐng)求和響應(yīng)。文章來源地址http://www.zghlxwxcb.cn/news/detail-529310.html

到了這里,關(guān)于數(shù)據(jù)分析與可視化(python大作業(yè))的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

  • 爬蟲+數(shù)據(jù)分析+可視化大作業(yè):基于大數(shù)據(jù)的高質(zhì)量電影分析報(bào)告

    爬蟲+數(shù)據(jù)分析+可視化大作業(yè):基于大數(shù)據(jù)的高質(zhì)量電影分析報(bào)告

    主要目的是為了學(xué)習(xí)Scrapy與Sklearn而不是寫論文,結(jié)論是瞎扯的,輕噴求求了 在我們的日常生活中,電影已經(jīng)成為了我們娛樂放松活動(dòng)所不可缺少的元素。然而,自電影誕生以來,人們每天都在生產(chǎn)著電影,卻又生產(chǎn)著質(zhì)量良莠不齊的電影。在這些幾乎是無窮無盡的電影洪流

    2024年02月03日
    瀏覽(47)
  • python數(shù)據(jù)分析及可視化(十四)數(shù)據(jù)分析可視化練習(xí)-上市公司可視化數(shù)據(jù)分析、黑色星期五案例分析

    python數(shù)據(jù)分析及可視化(十四)數(shù)據(jù)分析可視化練習(xí)-上市公司可視化數(shù)據(jù)分析、黑色星期五案例分析

    從中商情報(bào)網(wǎng)下載的數(shù)據(jù),表格中會(huì)存在很多的問題,查看數(shù)據(jù)的信息有無缺失,然后做數(shù)據(jù)的清晰,有無重復(fù)值,異常數(shù)據(jù),省份和城市的列名稱和數(shù)據(jù)是不對(duì)照的,刪除掉一些不需要的數(shù)據(jù),省份不完整的數(shù)據(jù),然后進(jìn)行數(shù)據(jù)分析以及可視化,如上市公司中的行業(yè)Top5,用

    2024年02月03日
    瀏覽(32)
  • 大數(shù)據(jù)可視化——基于Python豆瓣電影數(shù)據(jù)可視化分析

    大數(shù)據(jù)可視化——基于Python豆瓣電影數(shù)據(jù)可視化分析

    本項(xiàng)目旨在通過對(duì)豆瓣電影數(shù)據(jù)進(jìn)行綜合分析與可視化展示,構(gòu)建一個(gè)基于Python的大數(shù)據(jù)可視化系統(tǒng)。通過數(shù)據(jù)爬取收集、清洗、分析豆瓣電影數(shù)據(jù),我們提供了一個(gè)全面的電影信息平臺(tái),為用戶提供深入了解電影產(chǎn)業(yè)趨勢(shì)、影片評(píng)價(jià)與演員表現(xiàn)的工具。項(xiàng)目的關(guān)鍵步驟包括

    2024年02月04日
    瀏覽(43)
  • python畢設(shè)選題 - 大數(shù)據(jù)上海租房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    python畢設(shè)選題 - 大數(shù)據(jù)上海租房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長(zhǎng)自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長(zhǎng)分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)

    2024年02月19日
    瀏覽(30)
  • python畢設(shè)選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    python畢設(shè)選題 - 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長(zhǎng)自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長(zhǎng)分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)

    2024年01月20日
    瀏覽(30)
  • 大數(shù)據(jù)可視化——基于Python豆瓣電影數(shù)據(jù)可視化分析系統(tǒng)

    大數(shù)據(jù)可視化——基于Python豆瓣電影數(shù)據(jù)可視化分析系統(tǒng)

    本項(xiàng)目旨在通過對(duì)豆瓣電影數(shù)據(jù)進(jìn)行綜合分析與可視化展示,構(gòu)建一個(gè)基于Python的大數(shù)據(jù)可視化系統(tǒng)。通過數(shù)據(jù)爬取收集、清洗、分析豆瓣電影數(shù)據(jù),我們提供了一個(gè)全面的電影信息平臺(tái),為用戶提供深入了解電影產(chǎn)業(yè)趨勢(shì)、影片評(píng)價(jià)與演員表現(xiàn)的工具。項(xiàng)目的關(guān)鍵步驟包括

    2024年01月21日
    瀏覽(50)
  • python基于大數(shù)據(jù)的手機(jī)分析系統(tǒng)與可視化 -可視化大屏分析

    python基于大數(shù)據(jù)的手機(jī)分析系統(tǒng)與可視化 -可視化大屏分析

    前言 該系統(tǒng)采用了多種數(shù)據(jù)源,包括用戶行為數(shù)據(jù)、社交數(shù)據(jù)、市場(chǎng)趨勢(shì)數(shù)據(jù)等,通過數(shù)據(jù)挖掘、統(tǒng)計(jì)分析等手段,對(duì)這些數(shù)據(jù)進(jìn)行分析和建模。其中,用戶行為數(shù)據(jù)包括用戶使用手機(jī)的頻率、時(shí)間、地理位置、應(yīng)用使用情況等,社交網(wǎng)絡(luò)數(shù)據(jù)包括用戶在交網(wǎng)絡(luò)上的行為、好

    2024年02月03日
    瀏覽(27)
  • [數(shù)據(jù)分析與可視化] Python繪制數(shù)據(jù)地圖2-GeoPandas地圖可視化

    本文主要介紹GeoPandas結(jié)合matplotlib實(shí)現(xiàn)地圖的基礎(chǔ)可視化。GeoPandas是一個(gè)Python開源項(xiàng)目,旨在提供豐富而簡(jiǎn)單的地理空間數(shù)據(jù)處理接口。GeoPandas擴(kuò)展了Pandas的數(shù)據(jù)類型,并使用matplotlib進(jìn)行繪圖。GeoPandas官方倉(cāng)庫(kù)地址為:GeoPandas。GeoPandas的官方文檔地址為:GeoPandas-doc。關(guān)于Geo

    2023年04月09日
    瀏覽(31)
  • 大數(shù)據(jù)畢設(shè)分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    大數(shù)據(jù)畢設(shè)分享 大數(shù)據(jù)二手房數(shù)據(jù)爬取與分析可視化 -python 數(shù)據(jù)分析 可視化

    # 1 前言 ?? 這兩年開始畢業(yè)設(shè)計(jì)和畢業(yè)答辯的要求和難度不斷提升,傳統(tǒng)的畢設(shè)題目缺少創(chuàng)新和亮點(diǎn),往往達(dá)不到畢業(yè)答辯的要求,這兩年不斷有學(xué)弟學(xué)妹告訴學(xué)長(zhǎng)自己做的項(xiàng)目系統(tǒng)達(dá)不到老師的要求。 為了大家能夠順利以及最少的精力通過畢設(shè),學(xué)長(zhǎng)分享優(yōu)質(zhì)畢業(yè)設(shè)計(jì)項(xiàng)

    2024年01月23日
    瀏覽(34)
  • 【數(shù)據(jù)分析與可視化】利用Python對(duì)學(xué)生成績(jī)進(jìn)行可視化分析實(shí)戰(zhàn)(附源碼)

    【數(shù)據(jù)分析與可視化】利用Python對(duì)學(xué)生成績(jī)進(jìn)行可視化分析實(shí)戰(zhàn)(附源碼)

    需要源碼和數(shù)據(jù)集請(qǐng)點(diǎn)贊關(guān)注收藏后評(píng)論區(qū)留言私信~~~ 下面對(duì)學(xué)生成句和表現(xiàn)等數(shù)據(jù)可視化分析 1:導(dǎo)入模塊 2:獲取數(shù)據(jù) 并打印前四行 ?屬性列表對(duì)應(yīng)含義如下 Gender? 性別 Nationality? 國(guó)籍 PlaceofBirth 出生地 Stageid 學(xué)校級(jí)別 Gradeid 年級(jí) Sectionid? 班級(jí) Topic 科目 semester 學(xué)期 ra

    2024年02月03日
    瀏覽(26)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包