?本文借鑒了數(shù)學(xué)建模清風(fēng)老師的課件與思路,可以點(diǎn)擊查看鏈接查看清風(fēng)老師視頻講解:5.1 對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)以及皮爾遜相關(guān)系數(shù)的計(jì)算方法_嗶哩嗶哩_bilibili
注:直接先看 ( 三、兩個(gè)相關(guān)系數(shù)系數(shù)的比較 ) 部分!??!
目錄
?編輯
一、數(shù)據(jù)的描述性統(tǒng)計(jì)分析?
二、皮爾遜相關(guān)系數(shù)
2.1注意事項(xiàng)
2.2 SPSS繪制散點(diǎn)圖
2.3 MATLAB計(jì)算皮爾遜相關(guān)系數(shù)
2.3.1?MATLAB計(jì)算皮爾遜相關(guān)系數(shù)
2.3.2 相關(guān)系數(shù)矩陣的美化
2.4 對(duì)皮爾遜相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)(p值判斷法)
2.4.1 假設(shè)檢驗(yàn)
2.4.2 MATLAB和SPSS計(jì)算p值
①M(fèi)ATLAB計(jì)算p值
②spss計(jì)算p值
2.5 正態(tài)分布檢驗(yàn)
2.5.1 JB檢驗(yàn)(大樣本n > 30)
2.5.2 Shapiro-wilk檢驗(yàn)(小樣本 3 ≤ n ≤ 50)
2.5.3 QQ圖
二、斯皮爾曼相關(guān)系數(shù)
2.1 斯皮爾曼相關(guān)系數(shù)
2.2 斯皮爾曼相關(guān)系數(shù)的計(jì)算
2.3 兩種相關(guān)系數(shù)結(jié)果的對(duì)比
2.4 對(duì)斯皮爾曼相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)(p值判斷法)
①matlab計(jì)算P值
②SPSS計(jì)算p值
三、兩個(gè)相關(guān)系數(shù)系數(shù)的比較
一、數(shù)據(jù)的描述性統(tǒng)計(jì)分析?
clear;clc
%% 統(tǒng)計(jì)描述
MIN = min(Test); % 每一列的最小值
MAX = max(Test); % 每一列的最大值
MEAN = mean(Test); % 每一列的均值
MEDIAN = median(Test); %每一列的中位數(shù)
SKEWNESS = skewness(Test); %每一列的偏度
KURTOSIS = kurtosis(Test); %每一列的峰度
STD = std(Test); % 每一列的標(biāo)準(zhǔn)差
RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] %將這些統(tǒng)計(jì)量放到一個(gè)矩陣中表示
二、皮爾遜相關(guān)系數(shù)
2.1注意事項(xiàng)
簡(jiǎn)單來說,就是在進(jìn)行皮爾遜相關(guān)系數(shù)之前需要繪制這兩個(gè)變量的散點(diǎn)圖查看是否為線性關(guān)系,若是就用皮爾遜,若不是就用斯皮爾曼。
上圖為一般情況下相關(guān)系數(shù)的解釋,實(shí)際可根據(jù)題目背景解釋即可,只要言之有理即可。
2.2 SPSS繪制散點(diǎn)圖
以這個(gè)數(shù)據(jù)為例:
?這里使用Spss比較方便: 導(dǎo)入數(shù)據(jù) - 圖形 - 舊對(duì)話框 - 散點(diǎn)圖/點(diǎn)圖 - 矩陣散點(diǎn)圖 - 將指標(biāo)拖入矩陣變量(M)- 確定
?這里用高版本的繪制(我用的27)感覺好看一點(diǎn),如下:
注意:在得到變量之間為線性關(guān)系的時(shí)候才能繼續(xù)下面的計(jì)算步驟。
2.3 MATLAB計(jì)算皮爾遜相關(guān)系數(shù)
2.3.1?MATLAB計(jì)算皮爾遜相關(guān)系數(shù)
R = corrcoef(Test) % correlation coefficient
得到的R即為相關(guān)系數(shù)矩陣,其中1為自己和自己的相關(guān)性,自然為1,0.0665為第一列和第二列的相關(guān)系數(shù),-0.2177為第一列和第三列的相關(guān)系數(shù),0.0954為第一列和第三列的相關(guān)系數(shù),其他的以此類推。
2.3.2 相關(guān)系數(shù)矩陣的美化
關(guān)于這里的美化,具體操作看該系列第一個(gè)視頻38分鐘左右處。
2.4 對(duì)皮爾遜相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)(p值判斷法)
2.4.1 假設(shè)檢驗(yàn)
?
簡(jiǎn)單來說,就是當(dāng)算出來的p值<0.01,<.05,<0.10的情況下,即在90%,95%,99%的置信水平上,拒絕原假設(shè)r = 0,因此r是顯著的不為0的。(實(shí)際做的時(shí)候,就把假設(shè)和備擇假設(shè)寫上,然后算出p值,接著就把這段話寫下來)
2.4.2 MATLAB和SPSS計(jì)算p值
①M(fèi)ATLAB計(jì)算p值
%% 計(jì)算各列之間的相關(guān)系數(shù)以及p值
[R,P] = corrcoef(Test)
% 在EXCEL表格中給數(shù)據(jù)右上角標(biāo)上顯著性符號(hào)吧
P < 0.01 % 標(biāo)記3顆星的位置
(P < 0.05) .* (P > 0.01) % 標(biāo)記2顆星的位置
(P < 0.1) .* (P > 0.05) % % 標(biāo)記1顆星的位置
?但是MATLAB計(jì)算出來的p值放在Excle里,不好標(biāo)記*,所以可以采用Spss。
②spss計(jì)算p值
SPSS里 分析 - 相關(guān) - 雙變量- 把變量托到右邊 - 確定 。結(jié)果如下圖,和matlab的結(jié)果一樣:
2.5 正態(tài)分布檢驗(yàn)
2.5.1 JB檢驗(yàn)(大樣本n > 30)
% 用循環(huán)檢驗(yàn)所有列的數(shù)據(jù)
n_c = size(Test,2); % number of column 數(shù)據(jù)的列數(shù)
H = zeros(1,6); % 初始化節(jié)省時(shí)間和消耗
P = zeros(1,6);
for i = 1:n_c
[h,p] = jbtest(Test(:,i),0.05);
H(i)=h;
P(i)=p;
end
disp(H)
disp(P)
代碼里的6是因?yàn)檫@里的數(shù)據(jù)變量有6個(gè),0.05代表現(xiàn)在是95%的置信水平,實(shí)際中可根據(jù)需要自行調(diào)整。輸出的H為1就是在95%的置信水平下拒絕原假設(shè),即不服從正態(tài)分布,0則是不拒絕原假設(shè),即服從正態(tài)分布;P則是p值。
2.5.2 Shapiro-wilk檢驗(yàn)(小樣本 3 ≤ n ≤ 50)
結(jié)果如下:
只需要看最后一列即可,都小于0.01,說明在99%的置信水平下,拒絕原假設(shè),即不服從正態(tài)分布。?
2.5.3 QQ圖
要求樣本量非常大,不太推薦用QQ圖,用前面兩個(gè)檢驗(yàn)即可。
MATLAB畫QQ圖的命令:
% Q-Q圖
qqplot(Test(:,1))
二、斯皮爾曼相關(guān)系數(shù)
2.1 斯皮爾曼相關(guān)系數(shù)
第一種定義:
第二種定義:
2.2 斯皮爾曼相關(guān)系數(shù)的計(jì)算
第一種為只有兩個(gè)變量時(shí)使用,第二種為有多個(gè)變量時(shí)使用。
2.3 兩種相關(guān)系數(shù)結(jié)果的對(duì)比
2.4 對(duì)斯皮爾曼相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)(p值判斷法)
小樣本情況下:
大樣本情況下:
①matlab計(jì)算P值
②SPSS計(jì)算p值
SPSS里 分析 - 相關(guān) - 雙變量- 把變量托到右邊 - 勾選上斯皮爾曼 - 確定 。
結(jié)果如下,和MATLAB結(jié)果一樣的:
三、兩個(gè)相關(guān)系數(shù)系數(shù)的比較
總結(jié)下來就是:
用相關(guān)系數(shù)前,先對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì),然后畫散點(diǎn)圖看數(shù)據(jù)是否是線性的,接著對(duì)數(shù)據(jù)做正態(tài)性檢驗(yàn),滿足正態(tài)性檢驗(yàn)后再計(jì)算皮爾遜相關(guān)系數(shù)并看是不是顯著的。(進(jìn)行假設(shè)檢驗(yàn)的前提是通過正態(tài)分布檢驗(yàn))文章來源:http://www.zghlxwxcb.cn/news/detail-812121.html
如果沒有通過檢驗(yàn)則用斯皮爾曼相關(guān)系數(shù)。文章來源地址http://www.zghlxwxcb.cn/news/detail-812121.html
到了這里,關(guān)于相關(guān)系數(shù)(皮爾遜相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù))的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!