參考文獻:何曉群.《多元統(tǒng)計分析》中國人民大學出版社第五版(82-105)
數(shù)據(jù)獲取:關(guān)注公眾號:321紅綠燈
回復:4.6
公眾號中還有更多的理論知識、個人筆記整理和資源放送,歡迎閱讀哦~
實驗?zāi)康模?/h3>
通過判別分析,對數(shù)據(jù)中的變量的各類特征值判別確定其類型屬性。
實驗內(nèi)容:
為研究某地區(qū)人口死亡狀況,已按某種方法將15個一直樣品分為3類,指標及原始數(shù)據(jù)如下,試建立判別函數(shù)并判定另外4個待判樣品屬于哪類。(書本P104.6)
x1:0歲組死亡概率
x2:1歲組死亡概率
x3:10歲組死亡概率
x4:55歲組死亡概率
x5:80歲組死亡概率
x6:平均預期壽命
一、樣本的描述性統(tǒng)計分析
通過樣本的描述統(tǒng)計可以直觀得到共19個樣本,計算各個變量樣本的最大值、最小值、均值、標準偏差和方差。觀察樣本的原始狀態(tài)。
二、判別分析
1.判別分析做法
分組變量范圍需要調(diào)整為最小值1,最大值3,在定義范圍處調(diào)整
使用步進法這里我猜是使用逐步判別法的意思(?)
判別結(jié)果分析:
缺失或超出范圍組代碼4個數(shù)據(jù),即為未分組的4個數(shù)據(jù)。
輸出組別統(tǒng)計,再次對各個組別中的變量進行平均值和標準差的計算。對各組變量進行了描述性統(tǒng)計分析。對統(tǒng)計數(shù)據(jù)的各個屬性進行平均值和標準差的計算,得到同一組別之間的樣本離散程度。同時反映樣本量中的有效樣本量和變量缺失的情況,這里可以直觀看到?jīng)]有變量缺失的情況存在。
匯聚組內(nèi)矩陣表中是各個變量之間的協(xié)方差值,表示了變量之間的相關(guān)程度,協(xié)方差越大,相關(guān)程度越大。由圖中可以看到,x1與x5的相關(guān)性是最大的,其次是x1和x2,第三是x1和x4的相關(guān)性。即代表了,x1與其他各變量都具有較強的正相關(guān)性,而x6與其他各個變量都有較強的負相關(guān)性。對比各個變量的實際含義,這是符合實際意義的。
組平均值同等檢驗是檢驗6組變量中的均值是否相等的假設(shè)檢驗,P值與經(jīng)典統(tǒng)計中假設(shè)檢驗的結(jié)果原理類似,因此,在0.05的顯著性水平下,只有x5的均值和其他有顯著性差異,其他變量的均值互相之間并沒有顯著性差異。
由于樣本量的分布問題,反映各組協(xié)方差矩陣是否相等的BOX’M檢驗無法進行。
典則判別函數(shù)的輸出,反映了特征值、方差百分比和累計百分比以及典型相關(guān)性。第一判別函數(shù)解釋了99.3%的方差,第二判別函數(shù)僅僅解釋了0.7%的方差,兩個判別函數(shù)解釋了全部的方差。
威爾克lambda表對比了兩個判別函數(shù)的顯著性,得到判別函數(shù)1在0.05的顯著水平上是顯著的,判別函數(shù)2則不顯著。因此后面只對判別函數(shù)1展開分析。
標準化典則判別函數(shù)系數(shù)表給出了兩個判別函數(shù)表達式的各項系數(shù),因此我們可以得到兩個標準化判別函數(shù)的方程:
(這里弄了半天都轉(zhuǎn)不成可以插進來csdn的格式,所以就只能截圖了、、我再研究研究哎)
這是未標準化的方程系數(shù),因此得到的方程應(yīng)為未標準化的判別函數(shù)表達式和標準化的同理。
結(jié)構(gòu)矩陣,即為判別載荷,標準化系數(shù)即為判別權(quán)重,由判別權(quán)重和判別載荷可以得到哪些解釋變量對判別函數(shù)的影響程度較大。在判別函數(shù)1中,貢獻度較大的變量是x1、x5和x4。
組質(zhì)心處函數(shù)表體現(xiàn)了三個組別的組中心點坐標,判別函數(shù)y=1時的重心為(-3.238,0.895),y=2時的重心是(10.576,-0.205),y=3時的重心是(-7.337,-0.690)。
對分類統(tǒng)計結(jié)果進行分析
分類處理摘要概括了分類過程,說明了19個樣本數(shù)據(jù)都參與了此次分類。
各組的先驗概率可以在分類操作時進行自定義,在分類的選擇上前文定義的是所有概率相同,因此每個先驗概率是相同的。
分類函數(shù)系數(shù)表的系數(shù)是費歇判別函數(shù)的系數(shù)
y=1時,費歇判別函數(shù)表達式為:文章來源:http://www.zghlxwxcb.cn/news/detail-440755.html
y=2、3時同理
通過典則判別函數(shù)生成的圖形,可以看到未分類個案通過判別后,被分為1,2,3三個組別中。
通過分類結(jié)果更是清晰可見,未分類個案中一個被分類為第一組,一個被分類為第二組,兩個被分類為第三組。分類準確率為100%。文章來源地址http://www.zghlxwxcb.cn/news/detail-440755.html
到了這里,關(guān)于【多元統(tǒng)計分析】判別分析——SPSS上機實驗的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!