?
??數(shù)據(jù)可視化的基本流程
- Parameter refinement:參數(shù)優(yōu)化
??數(shù)據(jù)屬性
-
Nominal(標(biāo)稱)
-
Ordinal(序數(shù))
-
Quantitative(數(shù)量)
??基本可視化圖表類型
??數(shù)據(jù)分析三規(guī)則
- 顯示在原始數(shù)據(jù)中不明顯的方面,使您能夠清楚地思考可能隱藏在數(shù)據(jù)中的模式和關(guān)系。
- 顯示數(shù)據(jù)中的重要特征和模式。您還可能看到一些您沒(méi)有想到的東西:異常的(可能是錯(cuò)誤的)數(shù)據(jù)值或意外的模式。
- 制作一張圖片——告訴別人你的數(shù)據(jù)的最好方法是用一張精心選擇的圖片。
??條形圖(Bar Chart)
-
條形圖:顯示每個(gè)類別的計(jì)數(shù)或相對(duì)頻率
??餅圖(Pie Chart)
-
餅圖:顯示每個(gè)類別中整體的比例
??衡量易變性 (measure variability)
??range
- range = largest - smallest
??The median
- a measure of center
??Quartiles
- Measuring spread by examining the middle
- Step 1: find the median of all the data (the median divides the data in half)
- Step 2a: find the median of the lower half; this median is Q1;
- Step 2b: find the median of the upper half; this median is Q3.
- when n is odd include the overall median in both halves;
-
when n is even do not include the overall median in either half.
??Interquartile Range
- Measures spread of middle 50% of the data
??盒須圖(Boxplot)
?
- construct box:末端位于Q1和Q3;在框中標(biāo)記中間的位置(通常用一條線或“+”)
- 圍欄通過(guò)移動(dòng)距離1.5(IQR)來(lái)確定:
- 上圍欄比上四分位數(shù)多1.5*IQR
- 下圍欄比下四分位數(shù)低1.5*IQR
- 注意:圍欄只有助于構(gòu)建箱線圖,它們不會(huì)出現(xiàn)在最后的箱線圖顯示中。
- whiskers:從盒子的左右兩端畫(huà)線到極值。
-
outliers:極端值
??直方圖(Histograms)
- 直方圖顯示了三種一般類型的信息:
- 它提供了數(shù)據(jù)的近似中心位置的可視化指示。
- 我們可以了解數(shù)據(jù)中傳播或變化的程度。
- 我們可以觀察到其分布的形狀。
??莖葉顯示(Stem and Leaf Displays)
文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-728958.html
-
優(yōu)點(diǎn):
- each measurement displayed(顯示全面)
- ascending order in each stem row(葉子升序排列)
- relatively simple (data set not too large)(針對(duì)數(shù)據(jù)集不大的情況相對(duì)簡(jiǎn)單)
- 缺點(diǎn):display becomes unwieldy for large data sets(大數(shù)據(jù)集不適用)
??小結(jié)
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-728958.html
到了這里,關(guān)于可視化 | (一)數(shù)據(jù)基礎(chǔ)及基本數(shù)據(jù)可視化方法的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!