零、學(xué)習(xí)目標(biāo)
-
理解數(shù)據(jù)分析背景:學(xué)生將能夠闡述大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)分析的影響,以及數(shù)據(jù)分析在商業(yè)決策、科研發(fā)現(xiàn)、產(chǎn)品優(yōu)化等方面的重要作用。
-
掌握數(shù)據(jù)分析基本概念與分類:學(xué)生應(yīng)能清晰定義數(shù)據(jù)分析的概念,并能區(qū)分描述性數(shù)據(jù)分析(用于總結(jié)和解釋數(shù)據(jù)集的特征)、探索性數(shù)據(jù)分析(用于發(fā)現(xiàn)數(shù)據(jù)中的新信息和關(guān)系)和驗(yàn)證性數(shù)據(jù)分析(用于檢驗(yàn)假設(shè)或模型的有效性)的不同應(yīng)用場(chǎng)景。
-
了解數(shù)據(jù)分析流程:學(xué)習(xí)并掌握從數(shù)據(jù)收集、清洗、探索、建模到結(jié)果解讀和報(bào)告的整個(gè)數(shù)據(jù)分析工作流程。
-
安裝與管理Python環(huán)境:熟練操作Anaconda集成開發(fā)環(huán)境,包括如何下載、安裝和配置Anaconda,以及使用
conda
命令行工具來查看、安裝、升級(jí)Python包。 -
模塊導(dǎo)入與編程實(shí)踐:學(xué)會(huì)在Python中簡(jiǎn)單導(dǎo)入擴(kuò)展模塊及遵循社區(qū)命名慣例導(dǎo)入特定函數(shù),避免不良編碼習(xí)慣,如過度使用“星號(hào)”導(dǎo)入。
-
掌握Spyder集成開發(fā)環(huán)境的使用:能夠啟動(dòng)Spyder IDE,進(jìn)行IPython交互式編程,并在該環(huán)境中編寫、調(diào)試Python程序。
-
運(yùn)用Jupyter Notebook:學(xué)會(huì)啟動(dòng)和操作Jupyter Notebook,創(chuàng)建新的筆記本文檔,并在其中編寫可讀性強(qiáng)、包含代碼、文本和圖像的混合型文檔;通過實(shí)例演示,在Jupyter Notebook中繪制基礎(chǔ)數(shù)學(xué)函數(shù)(如正弦函數(shù)和邏輯函數(shù))的圖形。
-
實(shí)戰(zhàn)操作能力提升:通過對(duì)具體案例的學(xué)習(xí)和實(shí)踐,比如繪制不同類型的函數(shù)圖像,培養(yǎng)學(xué)生運(yùn)用Python進(jìn)行實(shí)際數(shù)據(jù)分析任務(wù)的能力。
一、本次課程概述
-
在當(dāng)今大數(shù)據(jù)時(shí)代,數(shù)據(jù)已成為驅(qū)動(dòng)各行業(yè)發(fā)展的關(guān)鍵要素。隨著信息技術(shù)的飛速進(jìn)步和數(shù)字化轉(zhuǎn)型的浪潮,海量數(shù)據(jù)的收集與分析成為企業(yè)決策、科研探索、政策制定等領(lǐng)域不可或缺的一部分。數(shù)據(jù)分析作為處理復(fù)雜信息的核心技術(shù)手段,通過系統(tǒng)的收集、清洗、整理及解釋數(shù)據(jù),揭示出隱藏在數(shù)據(jù)背后的模式、趨勢(shì)和關(guān)聯(lián)性。它不僅包括描述性分析來總結(jié)現(xiàn)狀,探索性分析以發(fā)現(xiàn)新問題,還包括驗(yàn)證性分析以檢驗(yàn)假設(shè)。
-
本次課程旨在為初學(xué)者搭建一套完整且實(shí)用的數(shù)據(jù)分析學(xué)習(xí)路徑。首先從安裝強(qiáng)大的數(shù)據(jù)分析工具Anaconda開始,介紹其下載、安裝過程以及如何管理Python包,確保數(shù)據(jù)分析環(huán)境的有效配置。進(jìn)而詳述使用內(nèi)置的Spyder集成開發(fā)環(huán)境進(jìn)行代碼編寫與交互式操作,以及利用Jupyter Notebook進(jìn)行靈活的項(xiàng)目管理和可視化展示。
-
我們將通過實(shí)際操作案例,如繪制正弦函數(shù)和邏輯函數(shù)圖像等,逐步引導(dǎo)讀者掌握數(shù)據(jù)分析的基本流程和技術(shù)細(xì)節(jié),使讀者能夠在理論學(xué)習(xí)與實(shí)踐應(yīng)用之間架起橋梁,從而更好地適應(yīng)大數(shù)據(jù)時(shí)代的挑戰(zhàn)與機(jī)遇。
二、數(shù)據(jù)分析的背景
(一)進(jìn)入大數(shù)據(jù)時(shí)代
- 隨著計(jì)算機(jī)技術(shù)的日益普及與深入應(yīng)用,社會(huì)生活的各個(gè)層面幾乎無一例外地被其全面滲透,由此產(chǎn)生的網(wǎng)絡(luò)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)態(tài)勢(shì),海量信息猶如滔滔江水般源源不斷。這一現(xiàn)象有力推動(dòng)我們跨入了一個(gè)前所未有的大數(shù)據(jù)時(shí)代,在這個(gè)時(shí)代中,數(shù)據(jù)不再僅僅是單一、孤立的存在,而是成為了一種具有強(qiáng)大洞察力和決策指導(dǎo)價(jià)值的關(guān)鍵資源。面對(duì)這股席卷而來的數(shù)據(jù)洪流,如何有效收集、存儲(chǔ)、處理并挖掘其中蘊(yùn)含的信息寶藏,已然成為當(dāng)今社會(huì)亟待解決的重要課題,亦是各行各業(yè)實(shí)現(xiàn)智能化升級(jí)與轉(zhuǎn)型的核心驅(qū)動(dòng)力。
(二)數(shù)據(jù)分析的作用
- 數(shù)據(jù)分析是一種深度挖掘數(shù)據(jù)內(nèi)在價(jià)值的科學(xué)方法,它能從浩如煙海的數(shù)據(jù)中提煉出有價(jià)值的信息和洞察。通過運(yùn)用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等先進(jìn)技術(shù)手段,數(shù)據(jù)分析不僅能夠揭示歷史數(shù)據(jù)中的模式與關(guān)聯(lián),還能基于這些發(fā)現(xiàn)幫助企業(yè)或個(gè)人精準(zhǔn)預(yù)測(cè)未來的市場(chǎng)趨勢(shì)、消費(fèi)者行為以及潛在風(fēng)險(xiǎn)。這種能力使得決策者能夠在瞬息萬變的時(shí)代背景下做出更明智、更具前瞻性的戰(zhàn)略抉擇,從而提升組織效率、優(yōu)化業(yè)務(wù)流程,并最終驅(qū)動(dòng)增長(zhǎng)與創(chuàng)新。在各行各業(yè)中,無論是在產(chǎn)品開發(fā)、市場(chǎng)營(yíng)銷、運(yùn)營(yíng)管理,還是在公共服務(wù)、政策研究等領(lǐng)域,數(shù)據(jù)分析都已成為推動(dòng)數(shù)字化轉(zhuǎn)型、實(shí)現(xiàn)智能決策的核心工具之一。
- 結(jié)論:不管你從事什么行業(yè),掌握了數(shù)據(jù)分析能力,往往在其崗位上更有競(jìng)爭(zhēng)力。
三、什么是數(shù)據(jù)分析
(一)數(shù)據(jù)分析的概念
- 數(shù)據(jù)分析是一種運(yùn)用統(tǒng)計(jì)學(xué)原理、機(jī)器學(xué)習(xí)算法及數(shù)據(jù)挖掘技術(shù),對(duì)大規(guī)模、多維度收集而來的復(fù)雜數(shù)據(jù)進(jìn)行深度處理和解讀的過程。在這個(gè)過程中,分析師通過清洗、整合、轉(zhuǎn)化原始數(shù)據(jù),并采用各種統(tǒng)計(jì)分析模型以及可視化手段,從看似紛繁無序的數(shù)據(jù)海洋中抽絲剝繭,發(fā)掘出有價(jià)值的信息和知識(shí)。其核心目標(biāo)在于揭示隱藏在海量數(shù)據(jù)背后的內(nèi)在規(guī)律、趨勢(shì)關(guān)聯(lián)和模式特征,從而為企業(yè)決策、市場(chǎng)預(yù)測(cè)、產(chǎn)品優(yōu)化、風(fēng)險(xiǎn)控制等領(lǐng)域提供科學(xué)依據(jù)和戰(zhàn)略指導(dǎo)。簡(jiǎn)而言之,數(shù)據(jù)分析不僅是提煉信息的藝術(shù),更是洞察未來、驅(qū)動(dòng)決策的智慧工具。
(二)數(shù)據(jù)分析的分類
- 在統(tǒng)計(jì)學(xué)領(lǐng)域中,數(shù)據(jù)分析可以劃分為三類。
1、描述性數(shù)據(jù)分析
- 描述性數(shù)據(jù)分析(Descriptive Data Analysis, DDA)是一種統(tǒng)計(jì)方法,它專注于從一組數(shù)據(jù)集中提取并總結(jié)關(guān)鍵的特征和模式。通過對(duì)數(shù)據(jù)進(jìn)行細(xì)致研究,描述性分析能夠揭示數(shù)據(jù)集的內(nèi)在結(jié)構(gòu),包括中心趨勢(shì)(如平均數(shù)、中位數(shù))、分散程度(如方差、標(biāo)準(zhǔn)差)以及頻數(shù)分布等核心信息,從而清晰勾勒出數(shù)據(jù)的整體面貌以及各變量之間的基本關(guān)系。通過這種方式,分析師可以直觀理解數(shù)據(jù)集的主要特點(diǎn),為后續(xù)的深入探索和決策制定提供基礎(chǔ)性的洞察。
2、探索性數(shù)據(jù)分析
- 探索性數(shù)據(jù)分析(Exploratory Data Analysis, EDA)是一種通過靈活運(yùn)用統(tǒng)計(jì)圖形和數(shù)值方法,對(duì)原始數(shù)據(jù)進(jìn)行深度探究的過程。其核心目標(biāo)在于揭示隱藏在海量復(fù)雜數(shù)據(jù)背后的潛在結(jié)構(gòu)、趨勢(shì)和關(guān)聯(lián),從而為后續(xù)建模與研究提供方向和假設(shè)。在EDA階段,分析師不僅會(huì)直觀展示數(shù)據(jù)分布特征,還會(huì)針對(duì)異常值檢測(cè)、變量相關(guān)性分析等方面進(jìn)行細(xì)致探索,旨在從多角度挖掘數(shù)據(jù)的內(nèi)在規(guī)律,并基于這些發(fā)現(xiàn)初步構(gòu)建分析模型或提出研究假設(shè),為進(jìn)一步的數(shù)據(jù)挖掘和驗(yàn)證性分析奠定基礎(chǔ)。
3、驗(yàn)證性數(shù)據(jù)分析
- 驗(yàn)證性數(shù)據(jù)分析(Confirmatory Data Analysis, CDA)是一種嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)分析方法,旨在通過嚴(yán)密的實(shí)驗(yàn)設(shè)計(jì)和數(shù)學(xué)模型檢驗(yàn)事先設(shè)定的科研假設(shè)是否成立。在進(jìn)行此類分析時(shí),研究者需確保數(shù)據(jù)滿足必要的條件,如樣本量充足、誤差分布合理且獨(dú)立同分布等,從而保證驗(yàn)證性分析結(jié)果的可靠性與有效性。這一過程涉及到對(duì)假設(shè)檢驗(yàn)、模型擬合度及潛在偏差的深入探究,目的是為了科學(xué)地證實(shí)或否定預(yù)先提出的理論觀點(diǎn)或預(yù)測(cè)模型,在學(xué)術(shù)研究、政策制定乃至商業(yè)決策中發(fā)揮著至關(guān)重要的作用。
(三)數(shù)據(jù)分析的流程
- 數(shù)據(jù)分析的流程始于明確目標(biāo)與設(shè)計(jì)研究思路,這一階段需清晰界定分析目的、確定關(guān)鍵指標(biāo)及預(yù)期結(jié)果。隨后進(jìn)入數(shù)據(jù)收集階段,通過多種渠道獲取所需原始數(shù)據(jù),并確保數(shù)據(jù)來源可靠且全面。緊接著是至關(guān)重要的數(shù)據(jù)處理環(huán)節(jié),涉及數(shù)據(jù)清洗、整合、轉(zhuǎn)換和缺失值填充等操作,以提高數(shù)據(jù)質(zhì)量并適應(yīng)后續(xù)分析需求。完成數(shù)據(jù)預(yù)處理后,便進(jìn)行核心的數(shù)據(jù)分析工作,利用統(tǒng)計(jì)學(xué)方法、機(jī)器學(xué)習(xí)算法揭示數(shù)據(jù)內(nèi)在關(guān)聯(lián)與規(guī)律。最后,在嚴(yán)謹(jǐn)分析的基礎(chǔ)上,采用可視化工具將復(fù)雜的數(shù)據(jù)信息以圖表等形式直觀展現(xiàn)出來,便于決策者快速理解洞察結(jié)論,從而有效驅(qū)動(dòng)決策制定與行動(dòng)落地。
四、安裝Anaconda集成開發(fā)環(huán)境
- Anaconda是一款預(yù)打包了超過400個(gè)科學(xué)計(jì)算與數(shù)據(jù)分析相關(guān)庫(kù)的集成環(huán)境,其中包含了如NumPy、Pandas、SciPy、Matplotlib和IPython等核心工具包。在安裝Anaconda時(shí),這些功能強(qiáng)大的軟件包會(huì)自動(dòng)一并部署到位,極大地簡(jiǎn)化了用戶配置環(huán)境的過程,為科研人員和數(shù)據(jù)分析師提供了開箱即用的數(shù)據(jù)科學(xué)解決方案。
(一)下載Anaconda
- Anaconda官網(wǎng):https://www.anaconda.com/download/
- 單擊“Download”按鈕,將安裝包下載到本地
(二)安裝Anaconda
- 雙擊安裝程序圖標(biāo),進(jìn)入安裝向?qū)?br>
- 同意許可證協(xié)議
- 選擇安裝類型
- 修改安裝位置,比如安裝到
D:\anaconda3
- 設(shè)置高級(jí)安裝選項(xiàng)
- 單擊【Install】按鈕,進(jìn)行安裝,耐心等待,直到完成
- 單擊【Finish】按鈕,完成Anaconda的安裝過程
(三)啟動(dòng)Anaconda命令行
- 啟動(dòng)Anaconda Prompt
- 默認(rèn)的是基礎(chǔ)環(huán)境
- 啟動(dòng)python,進(jìn)行交互式操作
- 啟動(dòng)ipython,進(jìn)行交互式操作
五、管理Python包
- 在Python中,管理第三方包對(duì)于數(shù)據(jù)分析和開發(fā)至關(guān)重要。使用Anaconda環(huán)境,用戶可以便捷地查看、安裝和升級(jí)Python包。通過執(zhí)行命令
conda list
可查看已安裝的所有包及其版本信息;安裝新包如Flask時(shí),只需輸入conda install flask
;若需更新現(xiàn)有包,則用conda upgrade flask
命令進(jìn)行升級(jí)。導(dǎo)入Python擴(kuò)展模塊是程序設(shè)計(jì)的基礎(chǔ)環(huán)節(jié)。簡(jiǎn)單導(dǎo)入模塊時(shí),直接使用import 模塊名
語句,隨后調(diào)用模塊中的函數(shù)或類需以其模塊名為前綴。例如,若導(dǎo)入了numpy
模塊,則引用其中的arange
函數(shù)應(yīng)寫作numpy.arange
。值得注意的是,在實(shí)際編程規(guī)范中,雖然可以使用from numpy import *
導(dǎo)入整個(gè)NumPy庫(kù)以簡(jiǎn)化代碼書寫,但這種做法易引發(fā)命名沖突且不利于代碼閱讀,因此在專業(yè)軟件開發(fā)中通常不推薦采用。
(一)基本語法
1、查看安裝包
- 執(zhí)行命令:
conda list
2、安裝Python包
- 執(zhí)行命令:
conda install flask
3、升級(jí)Python包
- conda upgrade flask
(二)導(dǎo)入Python擴(kuò)展模塊
1、簡(jiǎn)單導(dǎo)入擴(kuò)展模塊
-
import
模塊名
-
使用這些模塊里的函數(shù),必須以模塊名作為前綴
2、導(dǎo)入擴(kuò)展模塊的慣例
- Python社區(qū)為常用模塊采用了大量命名慣例
- 當(dāng)你看到
np.arange
時(shí),那是引用NumPy里的arange
函數(shù)。 - 注意:從一個(gè)像
NumPy
一樣的大包里導(dǎo)入一切函數(shù)(from numpy import *
)在Python軟件開發(fā)里被認(rèn)為是一種壞的做法。
六、Spyder集成開發(fā)環(huán)境
(一)Spyder概述
- Spyder是Anaconda軟件套裝中內(nèi)置的一款專業(yè)級(jí)集成開發(fā)環(huán)境,專為數(shù)據(jù)科學(xué)和科學(xué)計(jì)算設(shè)計(jì)。用戶無需額外安裝,在已安裝Anaconda的環(huán)境中,只需在Anaconda Prompt命令行界面輸入并執(zhí)行
Spyder
命令,即可快速啟動(dòng)這一功能強(qiáng)大的IDE。它集成了代碼編寫、調(diào)試、文件瀏覽、變量查看等多種實(shí)用工具,并且與Anaconda中的科學(xué)計(jì)算庫(kù)如NumPy、Pandas等無縫銜接,極大地提升了數(shù)據(jù)科學(xué)家和研究人員的工作效率。
(二)啟動(dòng)Spyder
- 在Anaconda Prompt命令行窗口里執(zhí)行
Spyder
命令 - 通過View | Panes菜單設(shè)置,只顯示
Editor
、IPython Console
和Plots
(三)IPython交互式操作
- 一維數(shù)組降序排列
- 使用pandas讀取csv文件
- 使用matplotlib繪制函數(shù)圖像
- 再次執(zhí)行
plt.plot(x, y)
,會(huì)在命令下方顯示函數(shù)圖像
(四)編寫Python程序
- 新建一個(gè)Python程序
- 編寫程序,計(jì)算1 + 2 + 3 + …… + 100的值
- 保存程序(
D:\python_work\day01\sum.py
) - 運(yùn)行程序,查看結(jié)果
七、使用Jupyter筆記本
(一)Jupyter筆記本概述
- Jupyter Notebook是一個(gè)基于網(wǎng)頁的交互式計(jì)算環(huán)境,它允許用戶創(chuàng)建和分享包含實(shí)時(shí)代碼、方程式、可視化圖表以及文本注釋的文檔。該平臺(tái)支持多種編程語言,尤其適合數(shù)據(jù)分析、機(jī)器學(xué)習(xí)及數(shù)據(jù)科學(xué)項(xiàng)目。在Jupyter Notebook中,用戶可以編寫可執(zhí)行代碼單元格,并立即查看結(jié)果,同時(shí)提供易于閱讀和迭代修改的工作流。此外,Notebook還支持Markdown格式文本,便于生成結(jié)構(gòu)化報(bào)告和教程,是科研教育、團(tuán)隊(duì)協(xié)作與成果展示的理想工具。通過其豐富的插件生態(tài)系統(tǒng),用戶能夠進(jìn)一步定制工作環(huán)境以滿足特定需求。
(二)啟動(dòng)Jupyter筆記本
- 通過Windows開始菜單啟動(dòng)Jupyter筆記本
(三)新建Jupyter筆記
- 新建
Python 3 (ipykernel)
(四)演示如何繪制圖像
1、繪制正弦函數(shù)的圖像
- 繪制
y
=
s
i
n
x
y=\mathrm{sin}x
y=sinx的圖像
2、繪制邏輯函數(shù)的圖像
-
邏輯函數(shù) ? ( x ) = 1 1 + e ? x \displaystyle\phi(x)=\frac{1}{1+ e^{-x}} ?(x)=1+e?x1?在數(shù)學(xué)和計(jì)算機(jī)科學(xué)中非常著名,通常被稱為sigmoid函數(shù)或Logistic函數(shù)。該函數(shù)輸出值域?yàn)?0,1),形狀類似于S形曲線,常用于模型概率估計(jì)、神經(jīng)網(wǎng)絡(luò)激活函數(shù)等領(lǐng)域。當(dāng)輸入x趨于負(fù)無窮時(shí),函數(shù)輸出接近0;而當(dāng)x趨于正無窮時(shí),輸出接近1。在機(jī)器學(xué)習(xí)中,它能夠?qū)⑦B續(xù)的實(shí)數(shù)映射到(0,1)區(qū)間,模擬二元事件的概率。
-
繪制邏輯函數(shù) ? ( x ) = 1 1 + e ? x \displaystyle\phi(x)=\frac{1}{1+ e^{-x}} ?(x)=1+e?x1?的圖像
八、課后習(xí)題
(一)單選題
-
下列哪一項(xiàng)不是數(shù)據(jù)分析的類型?
A. 描述性數(shù)據(jù)分析
B. 預(yù)測(cè)性數(shù)據(jù)分析
C. 探索性數(shù)據(jù)分析
D. 統(tǒng)計(jì)性數(shù)據(jù)分析 -
在大數(shù)據(jù)時(shí)代背景下,以下哪項(xiàng)描述了數(shù)據(jù)分析的作用?
A. 僅用于商業(yè)決策支持
B. 幫助企業(yè)提高運(yùn)營(yíng)效率,發(fā)現(xiàn)市場(chǎng)趨勢(shì)和用戶行為模式
C. 只在科學(xué)研究領(lǐng)域有用
D. 只適用于歷史數(shù)據(jù)回顧,對(duì)未來預(yù)測(cè)無幫助 -
下列哪個(gè)命令行工具與Anaconda環(huán)境管理相關(guān)?
A. pip
B. npm
C. conda
D. gem -
使用Spyder集成開發(fā)環(huán)境時(shí),下列哪種方式不是啟動(dòng)它的正確途徑?
A. 通過Anaconda Navigator
B. 直接在終端中輸入spyder
C. 從Windows開始菜單打開
D. 使用命令npm start
-
在Python中,查看已安裝包通常使用的命令是( )
A.python install
B.pip freeze
C.conda update
D.import packages
-
在Jupyter Notebook中新建筆記的快捷方式是( )
A. 單擊“文件”>“新建”>“Notebook”
B. 使用命令jupyter notebook new
C. 在命令行輸入jupyter notebook --generate
D. 執(zhí)行ipython notebook --create
-
下列哪項(xiàng)是探索性數(shù)據(jù)分析(EDA)的目標(biāo)之一?
A. 確定因果關(guān)系
B. 創(chuàng)建精確的預(yù)測(cè)模型
C. 發(fā)現(xiàn)數(shù)據(jù)集中的異常值和潛在結(jié)構(gòu)
D. 完成假設(shè)檢驗(yàn)并得出結(jié)論 -
若要在Python中導(dǎo)入一個(gè)模塊,如numpy,正確的方式是:
A. load numpy
B. use numpy
C. require numpy
D. import numpy -
對(duì)于驗(yàn)證性數(shù)據(jù)分析(VDA),其主要目的是( )
A. 檢驗(yàn)理論模型是否與實(shí)際數(shù)據(jù)相吻合
B. 創(chuàng)建一個(gè)新的統(tǒng)計(jì)模型
C. 計(jì)算變量間的相關(guān)系數(shù)
D. 分析數(shù)據(jù)集中各變量的分布特征 -
Anaconda的主要優(yōu)點(diǎn)之一是( )
A. 提供輕量級(jí)的Python解釋器
B. 只支持單一版本的Python環(huán)境
C. 集成了大量科學(xué)計(jì)算庫(kù),并方便管理多個(gè)Python環(huán)境
D. 不包含任何數(shù)據(jù)可視化庫(kù)
(二)判斷題
- 數(shù)據(jù)分析僅在大數(shù)據(jù)時(shí)代才變得重要。
- 描述性數(shù)據(jù)分析主要用于總結(jié)和呈現(xiàn)數(shù)據(jù)集的基本特征,如平均值、中位數(shù)和頻率分布等。
- 在Anaconda環(huán)境中,可以使用
conda install
命令安裝Python包。 - 使用
import *
導(dǎo)入整個(gè)Python模塊是推薦的做法,因?yàn)樗梢允勾a更簡(jiǎn)潔。 - Spyder IDE中的IPython交互式操作窗口支持實(shí)時(shí)運(yùn)行和測(cè)試代碼片段。
- Jupyter Notebook可以直接輸出圖像,并嵌入到文檔中,方便進(jìn)行可視化展示。
- 驗(yàn)證性數(shù)據(jù)分析的主要目的是發(fā)現(xiàn)數(shù)據(jù)集中的新規(guī)律或關(guān)系。
- Anaconda集成開發(fā)環(huán)境是一個(gè)單一的Python解釋器,不支持多個(gè)版本Python并存。
- 在Spyder中,用戶可以利用內(nèi)置的變量瀏覽器直接查看和修改變量的值。
- 通過Jupyter Notebook創(chuàng)建的數(shù)據(jù)分析報(bào)告可以直接導(dǎo)出為HTML、PDF等多種格式文件。
(三)簡(jiǎn)答題
-
描述數(shù)據(jù)分析流程中的關(guān)鍵步驟,并舉例說明每個(gè)步驟的具體內(nèi)容。
-
大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)分析的需求和挑戰(zhàn)產(chǎn)生了哪些變化?
-
如何使用Anaconda命令行進(jìn)行Python包的安裝、升級(jí)和查看操作?請(qǐng)分別給出相應(yīng)的命令示例。
-
Spyder IDE相比文本編輯器或其它IDE,在進(jìn)行數(shù)據(jù)分析時(shí)有哪些獨(dú)特的優(yōu)勢(shì)?文章來源:http://www.zghlxwxcb.cn/news/detail-790403.html
-
Jupyter Notebook在數(shù)據(jù)科學(xué)項(xiàng)目中起到什么作用?列舉至少兩個(gè)它在協(xié)作、教學(xué)或研究方面的重要特性。文章來源地址http://www.zghlxwxcb.cn/news/detail-790403.html
到了這里,關(guān)于數(shù)據(jù)分析講課筆記01:數(shù)據(jù)分析概述的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!