聲明:本文知識參考內容來自網(wǎng)絡,如有侵權請聯(lián)系刪除。本文還參照了B站up主莊7的課程內容【公開課】數(shù)據(jù)分析與SAS【15課】
目錄
實驗原理
描述性統(tǒng)計量
1.反映數(shù)據(jù)集中趨勢的特征量
2.反映數(shù)據(jù)離散程度的特征量
3.反映數(shù)據(jù)分布形狀的特征量
數(shù)據(jù)的圖形描述
直方圖
箱線圖
莖葉圖
實例分析
【means過程簡介】
?MEANS過程的語句格式
語句說明
?【univariate過程簡介】
proc univariate過程格式
?語句說明
實驗步驟
步驟一
步驟二
步驟三
總結
實驗原理
對數(shù)據(jù)集的描述性分析分為圖形描述和描述性統(tǒng)計量。
描述性統(tǒng)計量
1.反映數(shù)據(jù)集中趨勢的特征量
反映數(shù)據(jù)集中趨勢的特征量有均值、眾數(shù)、中位數(shù)和分位數(shù)
(1)均值:,它描述數(shù)據(jù)取的平均位置,但會受極端數(shù)值的影響;
(2)眾數(shù):數(shù)據(jù)中出現(xiàn)頻數(shù)最多的值,它不受極端值的影響;
(3)分位數(shù):設,,,是容量為n的樣本觀測值,樣本p分位數(shù)(0<p<1)記為,它具有以下性質:
- 至少有np個觀測值不小于或等于
- 至少有n(1-p)個觀念值大于或等于? ? ? ?????????
2.反映數(shù)據(jù)離散程度的特征量
反映數(shù)據(jù)離散程度有方差、標準差、極差、變異系數(shù)和標準誤差
(1)方差:?;
(2)標準差:;
(3)極差:或;
(4)四分位極差:;
(5)變異系數(shù):;
(6)標準誤差:;
3.反映數(shù)據(jù)分布形狀的特征量
(1)偏度:? , 它是描述數(shù)據(jù)分布的偏斜程度的特征量, 當 ?時, 分布為右偏;當 ?時, 分布關于其均值對稱, 不一定是絕對的對稱分布;
當時,分布為左偏。
(2)峰度:,它刻畫分布的峰峭性。峰度的取值范圍為
,完全服從正態(tài)分布的數(shù)據(jù)的峰度值為 3,峰度值越大,概率分布越高尖,峰度值越小,越矮胖。一個分布的峰度:當時,則標準化后的分布狀態(tài)與標準正態(tài)分布相當;當時,則標準化后的分布狀態(tài)比標準正態(tài)分布更尖峭(高峰度)。
數(shù)據(jù)的圖形描述
直方圖
箱線圖
箱線圖是用來表示一組或多組連續(xù)型數(shù)據(jù)分布的中心位置和散布范圍的圖形,因形似箱子故取名為箱線圖。
箱子的中間一條線,是數(shù)據(jù)的中位數(shù),代表了樣本數(shù)據(jù)的平均水平。
?箱子的上下限,分別是數(shù)據(jù)的上四分位數(shù)和下四分位數(shù)。這意味著箱子包含了50%的數(shù)據(jù)。
箱子的高度在一定程度上反映了數(shù)據(jù)的波動程度。
在箱子的上方和下方,各有一條線。代表最大最小值,有時候會有一些點“冒出去”,可以理解成"異常值"
原文鏈接:(2條消息) 箱線圖(boxplot)_SixdayNots的博客-CSDN博客
莖葉圖
實例分析
例1:在做小麥育種時,調查了雜交后代的若干性狀,選取其中一部分數(shù)據(jù)見實驗一的表中,在表中例舉了4個變量,即:株高、穗長、穗粒數(shù)和成熟早晚。分別用hop、loe、nog和fas代表上述四個變量,以成熟的早(e)、中(m)、晚(l)分類,分別計算株高與穗長的平均數(shù)、標準差和標準誤差以及穗粒數(shù)的范圍赫爾變異
例2:現(xiàn)有68個抽樣數(shù)據(jù)?6.5 5.1 6.1 3.9 3.5 7.7 2.1 1.9 9.6 7.9 7.6 7.8 4.6 6.1 6.4 2.8 7.6 2.5?4.6 8.1 4.8 6.9 5.1 2.0 6.4 6.0 4.5 8.0 8.0 8.6 6.4 4.9 6.4 6.8 4.7 3.4 7.7 1.2 2.8 0.5 2.6 3.2 6.5 7.6 3.5 5.7 5.4 2.3 7.4 2.7 4.2 6.4 6.9 7.2 6.7 6.5 4.0 7.3 1.1 4.9 2.5 2.9 1.9 3.6 1.4 2.5?4.4 2.5要求計算此單變量數(shù)據(jù)的描述統(tǒng)計量,并分析此抽樣數(shù)據(jù)的統(tǒng)計特征
【means過程簡介】
?MEANS過程的語句格式
?文章來源地址http://www.zghlxwxcb.cn/news/detail-428342.html
語句說明
?
?
?【univariate過程簡介】
proc univariate過程格式
?
?語句說明
?
?
?
?
實驗步驟
例1實驗步驟
步驟一
建立一個外部數(shù)據(jù)文件xiaomai.dat,并且保存在“D:\SAS\sasdata\shiyan\xiaomai.dat”中
步驟二
用proc means過程計算描述統(tǒng)計量
options linesize=76;
data xiaomai;
infile'D:\SAS\sasdata\shiyan\xiaomai.dat' ;
input hop loe nog fas $;
run;
proc means maxdec=2 fw=8 max min mean std stderr;
var hop loe;
class fas;
proc means data=xiaomai range cv;
var nog;
class fas;
run;
?程序的運行結果如下:
?
?
例2實驗步驟
步驟三
用proc univariate過程計算描述統(tǒng)計量,并分析此抽樣數(shù)據(jù)的統(tǒng)計特征
代碼:
data aa03; /*創(chuàng)建臨時數(shù)據(jù)集aa03*/
input x @@;
cards;
6.5 5.1 6.1 3.9 3.5 7.7 2.1 1.9 9.6 7.9 7.6 7.8 4.6 6.1 6.4
2.8 7.6 2.5?4.6 8.1 4.8 6.9 5.1 2.0 6.4 6.0 4.5 8.0 8.0 8.6
6.4 4.9 6.4 6.8 4.7 3.4 7.7 1.2 2.8 0.5 2.6 3.2 6.5 7.6 3.5
5.7 5.4 2.3 7.4 2.7 4.2 6.4 6.9 7.2 6.7 6.5 4.0 7.3 1.1 4.9
2.5 2.9 1.9 3.6 1.4 2.5?4.4 2.5
;
run;
proc univariate data = aa03 plot normal; /*調用univariate過程計算統(tǒng)計量,選項plot要求繪制莖葉圖、箱線圖和正態(tài)分布圖,選項normal要求對抽樣數(shù)據(jù)進行正態(tài)性檢驗*/
var x;
run;
運行結果:?
?
?
?
文章來源:http://www.zghlxwxcb.cn/news/detail-428342.html
?
總結
- 掌握proc means過程和proc univariate過程計算基本統(tǒng)計量
- 檢驗變量是否服從正態(tài)分布
- 掌握建立外部數(shù)據(jù)文件并將外部數(shù)據(jù)文件轉化為SAS數(shù)據(jù)集的方法
到了這里,關于【SAS應用統(tǒng)計分析】數(shù)據(jù)的描述性統(tǒng)計分析的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!