目錄
兩樣本和多樣本的Brown-Mood中位數(shù)檢驗
例3.1我國兩個地區(qū)一些(分別為17個和15個)城鎮(zhèn)職工的工資(元):
Wilcoxon(Mann-Whitney)秩和檢驗及有關置信區(qū)間
例3.1我國兩個地區(qū)一些(分別為17個和15個)城鎮(zhèn)職工的工資(元):
Kruskal-Wallis秩和檢驗
例4.1在一項健康實驗中,三人組有三種生活方式,他們的減肥效果如下表:
-
兩樣本和多樣本的Brown-Mood中位數(shù)檢驗
定義:零假設:H0:Mx=My,備擇假設:H1:Mx<My.
如果H0成立,兩樣本混合中位數(shù)Mxy可以均勻的分開X和Y兩個樣本,檢驗關注A的數(shù)值,A的意義是樣本X混合中位數(shù)右側(cè)的個數(shù),如果A很大,則表示樣本X的中位數(shù)明顯大于樣本Y的;如果A很小,則表示樣本Y的中位數(shù)明顯大于樣本X的。
例3.1我國兩個地區(qū)一些(分別為17個和15個)城鎮(zhèn)職工的工資(元):
地區(qū)1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244
地區(qū)2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079
人們想要知道這兩個地區(qū)平均城鎮(zhèn)職工工資的中位數(shù)是否一樣.
答:由題里的數(shù)據(jù)可制作下圖:
箱線圖從左到右依次代表地區(qū)1,地區(qū)2和混合樣本的數(shù)據(jù)
令地區(qū)1的樣本數(shù)據(jù)中位數(shù)為Mx,地區(qū)2的為My,混合樣本數(shù)據(jù)的中位數(shù)為Mxy.
零假設:H0:Mx=My,備擇假設:H1:Mx<My.
如果H0成立,則混合樣本的中位數(shù)Mxy在地區(qū)1、地區(qū)2的兩個樣本中,大于或小于Mxy應該大體一樣。
由數(shù)據(jù)算得Mxy=11301,用兩樣本數(shù)據(jù)和Mxy比較后得到下表1:
地區(qū)1(X) |
地區(qū)二(Y) |
總和 |
|
大于Mxy的數(shù)目 |
a=6 |
b=10 |
t=16 |
小于Mxy的數(shù)目 |
m-a=11 |
n-b=5 |
N-t=16 |
總和 |
m=17 |
n=15 |
N=32 |
令A表示列表中a的取值,在m,n和t固定時,A的分布在H0下的超幾何分布(m<k)為:
P(A=k)=mknt-km+nt
Brown-Mood中位數(shù)檢驗的基本內(nèi)容(表2):
零假設:H0 |
備擇假設:H1 |
檢驗統(tǒng)計量 |
P值 |
H0:Mx=My |
H1:Mx<My |
A |
P(X≥a) |
H0:Mx=My |
H1:Mx>My |
A |
P(X≤a) |
H0:Mx=My |
H1:Mx≠My |
A |
2min(P(X≥a),P(X≤a)) |
由表1數(shù)據(jù)可知,p值為P(X≤a)=P(X≤6)=0.07780674(由r算得),根據(jù)這個p值,按照顯著性水平0.05,無法拒絕原假設。也就是兩個地區(qū)平均城鎮(zhèn)職工工資的中位數(shù)是一樣的。
以此類推,可以求出下表3:
P(X≥6) |
0.9221933 |
P(X≤6) |
0.07780674 |
2min(P(X≥6),P(X≤6)) |
0.1556135 |
在零假設下,在大樣本時,可以從超幾何分布的均值和標準差的表達式來得到正態(tài)近似統(tǒng)計量為:
Z=A±0.5-mt/Nmnt(N-t)/N3~N(0,1)
對于雙邊備則檢驗(H1:Mx≠My),在大樣本情況下,可以用檢驗統(tǒng)計量
K=2a-m2(m+n)mn
它近似服從自由度為1的卡方分布,當K=3.137255,p值為0.0765225.
由于0.0765225>0.05所以我們有沒有充分理由拒絕H0,即不能說A組學生比B組學生算得更快。
R代碼:文章來源地址http://www.zghlxwxcb.cn/news/detail-424638.html
x=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244)
y=c(10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)
z=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244,10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)
boxplot(x,y,z)
median(z, na.rm = FALSE)
a=6
b=10
m=17
n=15
phyper(a,m,n,a+b)
1-phyper(a,m,n,a+b)
1-phyper(a-1,m,n,(m+n)-(a+b))
2*phyper(a,m,n,a+b)
pnorm((a+0.5-m*(a+b)/(m+n))/sqrt(m*n*(a+b)*(m+n-(a+b))/(m+n)^3))
-
Wilcoxon(Mann-Whitney)秩和檢驗及有關置信區(qū)間
定義:Wilcoxon(Mann-Whitney)秩和檢驗是Brown-Mood中位數(shù)檢驗的升級版,假設兩個總體分布有類似的形狀,不假定對稱。
X1,X2,…,Xm~F(X-μ1);Y1,Y2,…,Yn~(Y-μ2)
零假設:H0:μ1=μ2,備擇假設:H1:μ1≠μ2
例3.1我國兩個地區(qū)一些(分別為17個和15個)城鎮(zhèn)職工的工資(元):
地區(qū)1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244
地區(qū)2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079
人們想要知道這兩個地區(qū)平均城鎮(zhèn)職工工資的中位數(shù)是否一樣.
答:令地區(qū)1的樣本數(shù)據(jù)中位數(shù)為Mx,地區(qū)2的為My,混合樣本數(shù)據(jù)的中位數(shù)為Mxy.
零假設:H0:Mx=My,備擇假設:H1:Mx<My.
下面是兩個地區(qū)混合樣本的秩:
X |
6864 |
7304 |
7477 |
7779 |
7895 |
8348 |
8461 |
9553 |
9919 |
秩 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
X |
10073 |
10270 |
11581 |
13472 |
13600 |
13962 |
15019 |
17244 |
|
秩 |
10 |
11 |
18 |
24 |
25 |
27 |
30 |
32 |
|
Y |
10276 |
10533 |
10633 |
10837 |
11209 |
11393 |
11864 |
12040 |
12642 |
秩 |
12 |
13 |
14 |
15 |
16 |
17 |
19 |
20 |
21 |
Y |
12675 |
13199 |
13683 |
14049 |
14061 |
16079 |
|||
秩 |
22 |
23 |
26 |
28 |
29 |
31 |
可以得出Wy=306,Wx=222,Wxy=186,Wyx=69.
對于備則檢驗H1:Mx<My,得到p值為0.0135。因此,對于高于0.015的置信區(qū)間水平都可以拒絕零假設。
對于雙邊備擇假設H1:Mx≠My,得到p值為0.0270,是上面單邊檢驗的兩倍;若用連續(xù)修正的正態(tài)近似,得到p值為0.0285,;若不加連續(xù)改正量,得到p值為0.0272.
對于備擇假設H1:Mx<My,若用連續(xù)修正的正態(tài)近似,得到p值為0.0143,;若不加連續(xù)改正量,得到p值為0.0136.
由于以上計算的所有p值,均小于0.05,所以我們有充分的理由拒絕原假設,即地區(qū)1的中位數(shù)比地區(qū)2小。
Mx-My的點估計和區(qū)間估計:
由上述代碼運行結(jié)果知,Mx-My的點估計為-2479.
由上述代碼運行結(jié)果知,Mx-My的(1-α)置信區(qū)間為(-3916,-263)。
R代碼:
x=c(6864,7304,7477,7779,7895,8348,8461,9553,9919,10073,10270,11581,13472,13600,13962,15019,17244)
y=c(10276,10533,10633,10837,11209,11393,11864,12040,12642,12675,13199,13683,14049,14061,16079)
m=length(x);n=length(y);m;n;
Wxy=sum(outer(y,x,"-")>0);Wxy
Wyx=sum(outer(x,y,"-")>0);Wyx
pwilcox(69,m,n)
wilcox.test(x,y)
wilcox.test(x,y,exact=F)
wilcox.test(x,y,exact=F,cor=F)
wilcox.test(x,y,exact=F,alt="less")
wilcox.test(x,y,exact=F,alt="less",cor=F)
median(outer(x,y,"-"))
D=sort(as.vector(outer(x,y,"-")))
qwilcox(0.025,m,n)
D[76]
D[m*n+1-76]
-
Kruskal-Wallis秩和檢驗
定義:Kruskal-Wallis秩和檢驗根據(jù)所有數(shù)據(jù)從小到大排序,算出每個數(shù)據(jù)的秩。其中Ri為每組的秩和,ni為每組的樣本個數(shù)。當每組樣本中的觀察數(shù)目有5個或5個以上,則樣本統(tǒng)計量 KWC 的分布與自由度為k-1的卡方分布非常接近。因此,KW統(tǒng)計量可利用卡方分布進行檢驗。
KW=組間平方和/全體樣本的秩方差
如果樣本中存在結(jié)值(數(shù)據(jù)相同秩值的個數(shù)),則校正系數(shù)C=1-Σ(τi^3-τi
)/n^3-n,其中τi
等于第j個結(jié)值的個數(shù),調(diào)整后的KWc=KW/C.
Kruskal-Wallis統(tǒng)計量:
H=12N(N-1)i=1kni(Ri-R)2=12N(N-1)i=1kRi2ni-3(N+1)
例4.1在一項健康實驗中,三人組有三種生活方式,他們的減肥效果如下表:
生活方式 |
1 |
2 |
3 |
一個月后減少的重量(單位500g) |
3.7 |
7.3 |
9.0 |
3.7 |
5.2 |
4.9 |
|
3.0 |
5.3 |
7.1 |
|
3.9 |
5.7 |
8.3 |
|
2.7 |
6.5 |
||
ni= |
5 |
5 |
4 |
人們想知道從這個數(shù)據(jù)能否得出他們的減肥效果(位置參數(shù))是一樣的。
答:假定k個樣本有相似的連續(xù)正態(tài)分布,而且所有的觀測值在樣本內(nèi)和樣本之間是獨立的,我們假定k個獨立樣本有連續(xù)的分布函數(shù)F1,…, Fk
.我們設
零假設H0:F1(X)=…=Fk
(X)=F(X);備擇假設H1:Fi
(X)=F(X-θi
),i=1,…,k
這里F是某連續(xù)分布函數(shù),而且這些位置參數(shù)θi并不全部相同。
假定有k個樣本,各樣本的樣本量為ni,i=1,…,k.那么,觀測值可以寫成下面的線性模型:xij=μ+θi
+εij
,j=1,…, ni
及 i=1,…,k,誤差是獨立同分布的.
我們要檢驗的是H0: θ1
=θ2
=…=θk
等價于Ha
:H0
的諸等式中至少有一個不成立。
由題中數(shù)據(jù)所畫箱線圖如下:
由上述代碼運行結(jié)果知p=0.00895<0.05,故我們有充分理由拒絕H0,即他們的減肥效果,即位置參數(shù)是不一樣的。文章來源:http://www.zghlxwxcb.cn/news/detail-424638.html
R代碼:
a=c(3.7,3.7,3.0,3.9,2.7)
b=c(7.3,5.2,5.3,5.7,6.5)
c=c(9.0,4.9,7.1,8.3)
boxplot(a,b,c)
m1=length(a)
m2=length(b)
m3=length(c)
m<-m1+m2+m3
library(fBasics)
d=c(a,b,c)
e=c(1,1,1,1,1,2,2,2,2,2,3,3,3,3)
kruskal.test(d,e)
到了這里,關于非參數(shù)統(tǒng)計:兩樣本和多樣本的Brown-Mood中位數(shù)檢驗;Wilcoxon(Mann-Whitney)秩和檢驗及有關置信區(qū)間;Kruskal-Wallis秩和檢驗的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!