一、卡方檢驗(yàn)基本說(shuō)明
有時(shí),在研究中某個(gè)隨機(jī)變量是否服從某種特定的分布是需要進(jìn)行檢驗(yàn)的。可以根據(jù)以往的經(jīng)驗(yàn)或者實(shí)際的觀測(cè)數(shù)據(jù)分布情況,推測(cè)總體可能服從某種分布函數(shù)F(x)??ǚ綑z驗(yàn)就是這樣一種用來(lái)檢驗(yàn)給定的概率值下數(shù)據(jù)來(lái)自同一總體的無(wú)效假設(shè)方法。通常的卡方檢驗(yàn)可以用來(lái)研究分析定類數(shù)據(jù)與定類數(shù)據(jù)之間的關(guān)系情況。
在卡方檢驗(yàn)中,通常檢驗(yàn)的統(tǒng)計(jì)量?χ2?如下:
χ2=∑(A?E)2E=∑i=1k(Ai?Ei)2Ei=∑i=1k(Ai?npi)2npi(i=1,2,3,…,k)
其中A代表某個(gè)類別的觀察頻數(shù),E代表基于H0計(jì)算出的期望頻數(shù),Ai為i水平的觀察頻數(shù),Ei為i水平的期望頻數(shù),n為總頻數(shù),pi為i水平的期望頻率。當(dāng)n比較大時(shí),χ2統(tǒng)計(jì)量近似服從k-1個(gè)自由度的卡方分布。從公式來(lái)講一般卡方值相對(duì)越大越好。
二、卡方檢驗(yàn)類別
卡方檢驗(yàn)?zāi)壳?strong>SPSSAU提供的方法可以分為5類,其中包括卡方檢驗(yàn)、卡方擬合優(yōu)度、配對(duì)卡方、分層卡方以及趨勢(shì)卡方。其中pearson卡方使用的相對(duì)較多。
1、卡方檢驗(yàn)
卡方檢驗(yàn)SPSSAU可以通過(guò)【通用方法】交叉(卡方)進(jìn)行,也可以通過(guò)【醫(yī)學(xué)實(shí)驗(yàn)研究】卡方檢驗(yàn)進(jìn)行。二者的區(qū)別是【醫(yī)學(xué)實(shí)驗(yàn)研究】卡方檢驗(yàn)輸出更多指標(biāo)?!就ㄓ梅椒ā拷徊妫ǚ剑┫鄬?duì)使用更多。
2、卡方擬合優(yōu)度檢驗(yàn)
卡方擬合優(yōu)度檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,其用于研究實(shí)際比例情況,是否與預(yù)期比例表現(xiàn)一致,它只針對(duì)于類別數(shù)據(jù)。比如總共收集100份數(shù)據(jù),其中男性為48個(gè),女性為52個(gè);在收集數(shù)據(jù)之前預(yù)期男女比例應(yīng)該是4:6 (40%為男性,60%為女性),那么預(yù)期的比例是否與實(shí)際的比例有著明顯的差異性。
3、配對(duì)卡方
如果是配對(duì)數(shù)據(jù),并且對(duì)比的數(shù)據(jù)為定類數(shù)據(jù),因而需要使用配對(duì)卡方檢驗(yàn),從數(shù)學(xué)角度也能將稱呼分為 McNemar檢驗(yàn)或者Bowker檢驗(yàn),二者的區(qū)別如下:
3、分層卡方
在實(shí)際研究中,只研究?jī)蓚€(gè)分類變量往往具有局限性,因?yàn)榛祀s因素總是存在,如果不研究混雜因素,結(jié)論可能存在偏差。為了解決此問(wèn)題我們引出了分層卡方檢驗(yàn)也稱CMH檢驗(yàn)。比如是否吸煙(X)與是否生病(Y)的關(guān)系時(shí),將性別納入考慮范疇(即混雜因素,分層項(xiàng)Factor)。
4、趨勢(shì)卡方
醫(yī)學(xué)研究中,有序定類數(shù)據(jù)的關(guān)系研究 Cochran-Armitage,用于k*2(或2*k)的結(jié)構(gòu) k為有序定類數(shù)據(jù),2指兩個(gè)類別。
三、SPSSAU卡方檢驗(yàn)
由于卡方檢驗(yàn)類別過(guò)多,所以這里針對(duì)常用的卡方檢驗(yàn)進(jìn)行說(shuō)明。案例簡(jiǎn)單背景:研究不同學(xué)歷對(duì)是否購(gòu)買某品牌筆記本電腦是否存在差異。
1、整理數(shù)據(jù)格式
在做數(shù)據(jù)分析前,首先要將數(shù)據(jù)整理成正確的數(shù)據(jù)格式,滿足SPSSAU卡方檢驗(yàn)的數(shù)據(jù)格式一共有兩種,一種是常規(guī)格式,另一種是加權(quán)格式。
常規(guī)格式:
卡方檢驗(yàn),x、y都為定類數(shù)據(jù),上圖為常規(guī)格式,一行代表一個(gè)樣本,一列代表一個(gè)屬性,將全部的原始數(shù)據(jù)信息列出即可。
加權(quán)格式:
加權(quán)數(shù)據(jù)格式基本只針對(duì)全部是定類數(shù)據(jù)的研究時(shí)使用,SPSSAU支持常規(guī)格式和加權(quán)格式兩種數(shù)據(jù)。常規(guī)格式提供所有的原始數(shù)據(jù)信息,而加權(quán)格式只提供匯總數(shù)據(jù)信息。
2、操作
將整理好的數(shù)據(jù)格式,上傳到SPSSAU系統(tǒng)內(nèi),將分析項(xiàng)拖拽到對(duì)應(yīng)分析框中即可。操作如下:
3.卡方檢驗(yàn)結(jié)果分析
一般流程如下:
從上表分析可知,p值約為0.029小于0.05,所以研究學(xué)歷對(duì)于是否購(gòu)買筆記本電腦有顯著性差異,其中調(diào)查者中共有32個(gè)人,本科以下的人最多共有12個(gè),本科以上的人最少共有9個(gè),但是總體差異不大,對(duì)于本科以下的人其中有10個(gè)人,不買該品牌筆記本電腦占比為83.33%,有2個(gè)人購(gòu)買該品牌筆記本電腦占比為16.67%,差異比較明顯,不買該品牌筆記本的人較多,對(duì)于本科和本科以上學(xué)歷的人購(gòu)買該筆記本的人比不買該筆記本人的占比大,由此可見,學(xué)歷對(duì)于是否購(gòu)買該品牌筆記本有差異性。
接下來(lái)我們利用柱狀圖來(lái)分析:
從柱狀圖也可以看出本科以下學(xué)歷的人更多不買該品牌電腦,本科和本科以上學(xué)歷的人更多買該品牌電腦,所以學(xué)歷對(duì)于是否購(gòu)買該品牌筆記本有差異性。同時(shí)也發(fā)現(xiàn)本科學(xué)歷和本科以上學(xué)歷對(duì)于是否購(gòu)買該品牌筆記本差異性不明顯。
來(lái)源于:SPSSAU https://zhuanlan.zhihu.com/p/499008852
由于本案例數(shù)據(jù)為3*2格式,且1 <=E<5格子的比例大于20%(此處為33.33%),因而最終選擇使用yates校正卡方值。
補(bǔ)充說(shuō)明:Pearson卡方和yates校正卡方完全相同是正常現(xiàn)象,多數(shù)情況下二者完全相等。
4. 事后多重比較
因?yàn)樵P椭衟值小于0.05具有顯著差異性,所以如果有需要可以進(jìn)一步對(duì)分析項(xiàng)進(jìn)行事后多重比較。
由上表可知,第一次事后多重比較是本科以下學(xué)歷和本科學(xué)歷進(jìn)行比較。發(fā)現(xiàn)卡方值為5.316,p值小于0.05具有顯著差異性,其中卡方值計(jì)算如下:
χ2=[(2?9?12/23)29?12/23+(7?9?11/2329?11/23+(10?14?12/23)214?12/23+(4?11?14/23)211?14/23]=5.316
第二次事后多重比較是本科以下學(xué)歷和本科以上學(xué)歷進(jìn)行比較。發(fā)現(xiàn)p值小于0.05具有顯著差異性,同理,第三次比較是本科與本科以上進(jìn)行比較,p值大于0.05,不具有顯著性差異。分析結(jié)束。
5、其它應(yīng)用
其中單選和多選題分析或者多選題和多選題交叉分析可以使用Pearso卡方,如果想要檢驗(yàn)各現(xiàn)象百分比是否均勻可以使用卡方擬合優(yōu)度檢驗(yàn)。
參考資料:
多選題分析匯總
6、疑難解惑
如果數(shù)據(jù)是定量數(shù)據(jù)怎么進(jìn)行卡方檢驗(yàn)?
定類數(shù)據(jù)是否能夠轉(zhuǎn)化為定量數(shù)據(jù)一般看兩個(gè)方面,一種是自身不能轉(zhuǎn)變?yōu)槎惖?,一種是將定量數(shù)據(jù)轉(zhuǎn)為定類。還有一種是既可以看成定量數(shù)據(jù)又可以看成定類數(shù)據(jù)。具體如下:
更多干貨請(qǐng)登錄SPSSAU官網(wǎng)進(jìn)行查看。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-428113.html
SPSSAUhttps://www.spssau.com/?100001217文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-428113.html
到了這里,關(guān)于畢業(yè)論文使用的卡方檢驗(yàn)該如何分析?的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!