前言
本篇將繼續(xù)上篇文章進(jìn)行介紹。
總體均值的檢驗(yàn)
總體均值的檢驗(yàn)(一個(gè)總體均值的檢驗(yàn))
小樣本的檢驗(yàn)
假定條件
小樣本(n<30)
總體服從正太分布
檢驗(yàn)統(tǒng)計(jì)量的選擇與總體方差是否已知有關(guān)已知樣本,均值經(jīng)標(biāo)準(zhǔn)化后服從標(biāo)準(zhǔn)正態(tài)分布:
單樣本t檢驗(yàn)的效應(yīng)量通常使用 Cohen的d統(tǒng)計(jì)量來(lái)度量,計(jì)算公式為:
該效應(yīng)量表示樣本均值與假設(shè)的總體均值的差異是多少個(gè)標(biāo)準(zhǔn)差。根據(jù) Cohen(1988)提出的標(biāo)準(zhǔn),單樣本t檢驗(yàn)的小、中、大效應(yīng)量對(duì)應(yīng)的d值分別為0.20,0.50,0.80。即當(dāng)d<0.20時(shí),效應(yīng)量非常小,幾乎為0;當(dāng)0.20≤d<0.50時(shí),為小的效應(yīng)量;當(dāng)0.50≤d<0.80時(shí),為中的效應(yīng)量;當(dāng)d≥0.80時(shí),為大的效應(yīng)量。0.20表示樣本均值與假設(shè)的總體均值相差0.2個(gè)標(biāo)準(zhǔn)差,0.50表示相差0.5個(gè)標(biāo)準(zhǔn)差,0.80表示相差0.8個(gè)標(biāo)準(zhǔn)差。(Cohen提供的標(biāo)準(zhǔn)只是近似結(jié)果)
例題:
數(shù)據(jù): example6_4.RData)一種建筑用磚的厚度要求為5cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的?,F(xiàn)對(duì)一家生產(chǎn)企業(yè)提供的20塊樣本進(jìn)行檢測(cè),結(jié)果如表6-2所示:
假定磚的厚度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該企業(yè)生產(chǎn)的磚的厚度是否符合要求。
t.test(x,y=NULL,mu=0,)函數(shù)可以實(shí)現(xiàn)t檢驗(yàn)。當(dāng)不指定y時(shí)為單樣本檢驗(yàn),mu為檢驗(yàn)的均值,默認(rèn)為0。
結(jié)論:在該項(xiàng)檢驗(yàn)中, =4.8,t=-5.6273,df=19,=1.998e-05,由于P<0.05,拒絕H0,有證據(jù)顯示該企業(yè)生產(chǎn)的磚的厚度不符合要求。
檢驗(yàn)結(jié)果表明,該企業(yè)生產(chǎn)的磚的厚度與5cm有顯著差異,但要想知道差異的程度,則需要計(jì)算效應(yīng)量。有
結(jié)果表示:樣本磚的平均厚度與標(biāo)準(zhǔn)厚度相差1.258306個(gè)標(biāo)準(zhǔn)差。根據(jù)Cohen準(zhǔn)則,該檢驗(yàn)結(jié)果屬于大的效應(yīng)量。計(jì)算效應(yīng)量的R代碼和結(jié)果如下所示
計(jì)算效應(yīng)量
load("C:/example/ch6/example6_4.RData")
library(lsr)
cohensD(example6_4$厚度,mu=5)
兩個(gè)總體均值之差的檢驗(yàn)
根據(jù)獲得樣本的方式不同,兩個(gè)總體均值的檢驗(yàn)分為獨(dú)立樣本和配對(duì)樣本兩種情形,而且也有大樣本與小樣本之分。檢驗(yàn)的統(tǒng)計(jì)量是以兩個(gè)樣本均值之差(
)的抽樣分布為基礎(chǔ)構(gòu)造出來(lái)的。對(duì)于大樣本和小樣本兩種情形,由于兩個(gè)樣本均值之差經(jīng)標(biāo)準(zhǔn)化后的分布不同,檢驗(yàn)統(tǒng)計(jì)量也有差異。
獨(dú)立大樣本的檢驗(yàn)
例題:
(數(shù)據(jù): example6_5. RData)為分析男女學(xué)生上網(wǎng)時(shí)間是否有差異,從男女學(xué)生中各隨機(jī)抽取36人,得到每天的上網(wǎng)時(shí)間數(shù)據(jù)如下表所示。在顯著性水平0.05下,檢驗(yàn)?zāi)信畬W(xué)生上網(wǎng)的平均時(shí)間是否有顯著差異
設(shè)μ1=男生上網(wǎng)的平均時(shí)間;μ2=女生上網(wǎng)的平均時(shí)間。由于關(guān)心上網(wǎng)的平均時(shí)間是否有顯著差異,所以提出的假設(shè)為:
H0:μ1-μ2=0; H1:μ1-μ2≠0
檢驗(yàn)的R代碼和結(jié)果如下所示:
load("C:/example/ch6/example6_5.RData")
library(BSDA)
z.test(example6_5$男生上網(wǎng)時(shí)間,example6_5$女生上網(wǎng)時(shí)間,sigma.x=sd(example6_5$男生上網(wǎng)時(shí)間),sigma.y=sd(example6_5$女生上網(wǎng)時(shí)間),alternative="two.sided")
結(jié)論:在該項(xiàng)檢驗(yàn)中, =3.058333,
=2.830556,z=1.1188,P=0.2632由于P>0.05,不拒絕H0,沒(méi)有證據(jù)顯示男女學(xué)生上網(wǎng)的平均時(shí)間有顯著差異。
獨(dú)立小樣本的檢驗(yàn)
這時(shí),兩個(gè)樣本均值之差經(jīng)標(biāo)準(zhǔn)化后服從自由度為(n1+n2-2)的t分布,因而采用的檢驗(yàn)統(tǒng)計(jì)量為:
例題:
(數(shù)據(jù): example6_6. RData)為比較兩家企業(yè)生產(chǎn)的燈泡平均使用壽命是否有顯著差異,質(zhì)檢人員對(duì)兩家供貨商提供的各20個(gè)樣品進(jìn)行檢測(cè),得到的使用壽命數(shù)據(jù)如下表所示。檢驗(yàn)兩家企業(yè)燈泡的平均使用壽命是否有顯著差異( =0.05):
(1) 假設(shè)兩個(gè)總體方差相等
(2) 將設(shè)兩個(gè)總體方差不相等
t.test(x,y=null, alternative=c(“two. sided”,“l(fā)ess”,“greater”),mu=0,paired=FALSE
var. equal=FALSE,conf.level=0.95,)函數(shù)中,var. equal=true和var. equal=FALSE分別對(duì)應(yīng)兩總體方差相等和不相等的假設(shè),默認(rèn)var. equal=FALSE.默認(rèn) paired=FALSE,為獨(dú)立樣本檢驗(yàn), paired=TRUE為配對(duì)樣本檢驗(yàn)。
解:設(shè)μ1為甲企業(yè)燈泡的平均使用壽命,μ2為乙企業(yè)燈泡的平均使用壽命。依題意提出如下假設(shè):
H0:μ1-μ2=0; H1:μ1-μ2≠0
檢驗(yàn)的R代碼和結(jié)果如下所示
(1) 假設(shè)兩個(gè)總體方差相等
假設(shè)方差相等
load("C:/example/ch6/example6_6.RData")
t.test(example6_6$甲企業(yè),example6_6$乙企業(yè),var.equal=TRUE)
(2) 將設(shè)兩個(gè)總體方差不相等
t.test(example6_6$甲企業(yè),example6_6$乙企業(yè),var.equal=FALSE)
結(jié)論在該項(xiàng)檢驗(yàn)中, =8487.5,
=8166.0,假設(shè)總體方差相等時(shí)t=3.4943,df=38,P=0.00122:假設(shè)總體方差不等時(shí),t=3.4943,=33.683,P=0.001353。兩種假設(shè)條件下檢驗(yàn)的P值均小于0.05,所以拒絕H0,表明兩家企業(yè)生產(chǎn)的燈泡平均使用壽命有顯著差異。
檢驗(yàn)結(jié)果顯示兩家企業(yè)生產(chǎn)的燈泡平均使用壽命差異顯著,但要想知道差異的程度則需要計(jì)算效應(yīng)量。獨(dú)立樣本t檢驗(yàn)的效應(yīng)量的估計(jì)通常由 Cohen的d統(tǒng)計(jì)量給出,計(jì)算公式為
該效應(yīng)量表示總體1的均值( )與總體2的均值( )相差多少個(gè)標(biāo)準(zhǔn)差。根據(jù) Cohen(1988)提出的標(biāo)準(zhǔn),獨(dú)立樣本檢驗(yàn)的小、中、大效應(yīng)量對(duì)應(yīng)的d值分別為0.20, 0.50, 0.80。
計(jì)算效應(yīng)量的R代碼和結(jié)果如下所示:
計(jì)算效應(yīng)量
library(lsr)
cohensD(example6_6$甲企業(yè),example6_6$乙企業(yè))
結(jié)果顯示,d=1.104985,表示甲企業(yè)和乙企業(yè)的燈泡平均使用壽命相差1.104985個(gè)標(biāo)準(zhǔn)差。根據(jù) Cohen準(zhǔn)則,該檢驗(yàn)結(jié)果屬于大的效應(yīng)量。
配對(duì)樣本的檢驗(yàn)
例題:
(數(shù)據(jù): example6_7. Rdata)某飲料公司研制出一款新產(chǎn)品,為比較消費(fèi)者對(duì)新舊產(chǎn)品口感的滿意程度,隨機(jī)抽選一組消費(fèi)者共10人,讓每個(gè)消費(fèi)者先品嘗一款飲料,再品嘗另一款飲料,兩款飲料的品嘗順序是隨機(jī)的,而后每個(gè)消費(fèi)者要對(duì)兩款飲料分別進(jìn)行評(píng)分(0~10分),評(píng)分結(jié)果如下表所示。取顯著性水平 =0.05,檢驗(yàn)消費(fèi)者對(duì)兩款飲料的評(píng)分是否有顯著差異。
解:設(shè) u1 =消費(fèi)者對(duì)舊款飲料的平均評(píng)分, u2=消費(fèi)者對(duì)新款飲料的平均評(píng)分,依題意建立的原假設(shè)與備擇假設(shè)為:
檢驗(yàn)的R代碼和結(jié)果如下所示:
load("C:/example/ch6/example6_7.RData")
t.test(example6_7$舊款飲料,example6_7$新款飲料,paired=TRUE)
結(jié)論:在該項(xiàng)檢驗(yàn)中, =-1.3,t=-2.7508,df=9,P=0.02245,由于P<0.05,拒絕H0,消費(fèi)者對(duì)新舊飲料的評(píng)分有顯著差異。
拒絕原假設(shè)后,可計(jì)算效應(yīng)量來(lái)進(jìn)一步分析配對(duì)樣本差值的均值與假設(shè)的總體差值的均值之間的差異程度。配對(duì)樣本t檢驗(yàn)的效應(yīng)量的估計(jì)由 Cohen的d統(tǒng)計(jì)量給出。計(jì)算公式為:
根據(jù) Cohen提出的標(biāo)準(zhǔn),配對(duì)樣本檢驗(yàn)的小、中、大效應(yīng)量對(duì)應(yīng)的d值分別為 0.20,0.50,0.80
計(jì)算效應(yīng)量的R代碼和結(jié)果如下所示
library(lsr)
cohensD(example6_7$舊款飲料,example6_7$新款飲料,method="paired")
總體比例的檢驗(yàn)
總體比例的檢驗(yàn)程序與總體均值的檢驗(yàn)類似,本小節(jié)只介紹大樣本情形下一個(gè)總體比例的檢驗(yàn)方法和兩個(gè)總體比例之差的檢驗(yàn)方法。
一個(gè)總體比例的檢驗(yàn)
例題:
一家電視臺(tái)的影視頻道制作人認(rèn)為,某電視連續(xù)劇如果在黃金時(shí)段播出,收視率將會(huì)達(dá)到25%以上。經(jīng)過(guò)一周的試播放后,該制作人隨機(jī)抽取了由2000人組成的一個(gè)樣本,發(fā)現(xiàn)有450個(gè)觀眾觀看了該電視連續(xù)劇。取顯著性水平a=0.05,檢驗(yàn)收視率是否達(dá)到制作人的預(yù)期。
解:制作人想支持的觀點(diǎn)是收視率達(dá)到25%以上,因此提出的假設(shè)為
H0: π ≤25%; H1: π>25%
檢驗(yàn)的R代碼和結(jié)果如下所示:
n<-2000
p<-450/2000
pi0<-0.25
z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
p_value<-1-pnorm(z)
data.frame(z,p_value)
在該項(xiàng)檢驗(yàn)中,z=-2.581989,P=0.9950884,由于P>0.05,不拒絕H0,沒(méi)有證據(jù)表明收視率達(dá)到了制作人的預(yù)期。
例題:
一所大學(xué)準(zhǔn)備采取一項(xiàng)新的上網(wǎng)收費(fèi)措施,為了解男女學(xué)生對(duì)這一措施的看法是否有差異,分別抽取200名男生和200名女生進(jìn)行調(diào)查。其中的一個(gè)問(wèn)題是:“你是否贊成采取新的上網(wǎng)收費(fèi)的措施?”其中男生表示贊成的比例為27%,女生表示贊成的比例為35%。調(diào)查者認(rèn)為,男生中表示贊成的比例顯著低于女生。取顯著性水平 =0.05,樣本提供的證據(jù)是否支持調(diào)查者的看法?
解:設(shè)π1=男生中表示贊成的比例,π2=女生中表示贊成的比例。依題意提出如下假設(shè)解:
H0: π1-π2 ≥0; H1: π1-π2<0
檢驗(yàn)的R代碼和結(jié)果如下所示:
n1<-200;n2<-200
p1<-0.27;p2<-0.35
p<-(p1*n1+p2*n2)/(n1+n2)
z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
p_value<-pnorm(z)
data.frame(z,p_value)
結(jié)論:在該項(xiàng)檢驗(yàn)中,z=-1.729755,P=0.04183703由于P<0.05,拒絕H0。樣本提供的證據(jù)支持調(diào)査者的看法,即男生中表示贊成的比例顯著低于女生。
例題:
有兩種方法生產(chǎn)同一種產(chǎn)品,方法1的生產(chǎn)成本較高而次品率較低,方法2的生產(chǎn)成本較低而次品率則較高。管理人員在選擇生產(chǎn)方法時(shí)決定對(duì)兩種方法的次品率進(jìn)行比較。如果方法1比方法2的次品率低8%以上,則采用方法1,否則就采用方法2。管理人員從采用方法1生產(chǎn)的產(chǎn)品中隨機(jī)抽取300個(gè),發(fā)現(xiàn)有33個(gè)次品;從采用方法2生產(chǎn)的產(chǎn)品中也隨機(jī)抽取300個(gè),發(fā)現(xiàn)有84個(gè)次品。用顯著性水平a=0.01進(jìn)行檢驗(yàn),管理人員應(yīng)決定采用哪種方法進(jìn)行生產(chǎn)?
解:設(shè)π1=方法1的次品率,π2=方法2的次品率。因?yàn)槭且獧z驗(yàn)“方法1的次品率是否比方法2低8%”(不是檢驗(yàn)二者的差值是否等于0),所以選擇下式作為檢驗(yàn)統(tǒng)計(jì)量
H0: π1-π2 ≥8%; H1: π1-π2< 8%
檢驗(yàn)的R代碼和結(jié)果如下所示:
n1<-300;n2<-300
p1<-33/300;p2<-84/300
d0<-0.08
z<-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
p_value<-pnorm(z)
data.frame(z,p_value)
結(jié)論:在該項(xiàng)檢驗(yàn)中,z=-7.91229,P=1.26348e-15由于P<0.01,拒絕H0。表示方法1的次品率顯著地低于方法2達(dá)8%以上,所以應(yīng)采用方法1進(jìn)行生產(chǎn)。
練習(xí)
1、(數(shù)據(jù):exercise6_1.RData)一種機(jī)床加工的零件尺寸絕對(duì)平均誤差為1.35mm。生產(chǎn)廠家準(zhǔn)備采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從新機(jī)床生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。50個(gè)零件尺寸的絕對(duì)誤差數(shù)據(jù)(單位:mm)如下:
(1)檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低(=0.01)
解:假定零件尺寸的絕對(duì)誤差服從正態(tài)分布
這里關(guān)心的是零件尺寸的絕對(duì)誤差的均值是否顯著低于過(guò)去的誤差均值,也就是μ是否小于1.35mm,因此提出如下假設(shè):文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-811502.html
load("C:/exercise/ch6/exercise6_1.RData")
library(BSDA)
z.test(exercise6_1$零件誤差,mu=1.35,sigma.x=sd(exercise6_1$零件誤差),alternative="less",conf.level=0.99)
結(jié)論:在該檢驗(yàn)中,z=-2.6061,P=0.004579,由于P<0.01,拒絕H0,新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比顯著降低文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-811502.html
到了這里,關(guān)于統(tǒng)計(jì)學(xué)-R語(yǔ)言-7.2的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!