前言
本片是對以上三個介紹的篇章的題進行介紹。
總體均值的區(qū)間估計
1、利用下面的信息,構(gòu)建總體均值μ的置信區(qū)間:
總體均值的區(qū)間估計(大樣本的估計)
利用下面的信息,構(gòu)建總體均值μ的置信區(qū)間:
(1)總體不服從正態(tài)分布,已知 ,n=35, =8900,s=510,置信水平為95%
q<-qnorm(0.975)
LCI<-8900-q*(500/sqrt(35))
UCI<-8900+q*(500/sqrt(35))
data.frame(LCI,UCI)
(2)總體不服從正態(tài)分布, 未知,n=35,
=8900,s=510,置信水平為90%
q<-qnorm(0.95)
LCI<-8900-q*(510/sqrt(35))
UCI<-8900+q*(510/sqrt(35))
data.frame(LCI,UCI)
(3)總體不服從正態(tài)分布, 未知,n=100,
=8900,s=510,置信水平為95%
q<-qnorm(0.975)
LCI<-8900-q*(510/sqrt(100))
UCI<-8900+q*(510/sqrt(100))
data.frame(LCI,UCI)
2、下面是10家企業(yè)2015年上半年繳稅額數(shù)據(jù)(單位:元),根據(jù)這個樣本對這類企業(yè)繳稅額的總體均值??做出區(qū)間估計,置信度取95%
該總體方差未知,小樣本情形
假定該總體有正態(tài)分布。在R中采用下面的語句求出置信區(qū)間:
tax=c(283192,232600,51000,191927,16281,449066,673669,315000,293515,331624)
t.test(tax,con=.95)$conf #R語言內(nèi)置函數(shù)t.test,t.test(x,conf.level=0.95)用于求95%置信區(qū)間#$conf用于獲取置信度
[1] 149005.9 418568.9
attr(,"conf.level")#attr(x,which):得到或設(shè)置x的屬性
[1] 0.95
3、一家人才測評機構(gòu)對隨機抽取的10名小企業(yè)的經(jīng)理人用兩種方法進行自信心測試,得到的自信心測試分?jǐn)?shù)如下:
構(gòu)建兩種方法平均自信心得分之差的95%的置信區(qū)間。
load("C:/example/ch5/exercise5_7.RData")
t.test(exercise5_7$方法1,exercise5_7$方法2,paired=TRUE)$conf.int
總體比例的區(qū)間估計
1、從兩個總體中各抽取一個n1=n2=250的獨立隨機樣本,來自總體1的樣本比例為p1=40%,來自總體2的樣本比例為p2=30%
(1)求 的90%的置信區(qū)間
n1=250;n2=250
p1=0.4;p2=0.3
q1<-qnorm(0.95)
LCI<-p1-p2-q1*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
UCI<-p1-p2+q1*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(UCI,LCI)
(2)求 的95%的置信區(qū)間
n1=250;n2=250
p1=0.4;p2=0.3
q2<-qnorm(0.975)
UCI<-p1-p2-q2*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
LCI<-p1-p2+q2*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(LCI,UCI)
總體方差的區(qū)間估計
顧客到銀行辦理業(yè)務(wù)時住需要等待一些時間,而等待時間的長短與許多因素有關(guān),比如銀標(biāo)的業(yè)務(wù)員辦理業(yè)務(wù)的速度、顧客等待排隊的方式等等。為此,某銀行準(zhǔn)備采取兩種排隊方式進行試驗,第一種排隊方式是所有顧客都進入一個等待隊伍,第二種排隊方式是顧客在三個業(yè)務(wù)ロ處列隊三排等待為比較哪種排隊方式使顧客等待的時間更短,銀行各隨機抽取10名顧客,他們在辦理業(yè)務(wù)時所等待的時間(單位:分鐘)如下
(1)構(gòu)建第二種排隊方式等待時間方差的95%的置信區(qū)間
library(TeachingDemos)
sigma.test(exercise5_5$方式2,conf.level=0.95)$conf.int
樣本量的確定
確定合適的樣本量需要綜合考慮以下三因素:
(1)希望達到的置信度。置信度越高,要求樣本量越大
(2)研究者可以承受的誤差范圍。最大可容許誤差 (maximum allowable error)越小,要求樣本量越大;反之,樣本量越小
(3)所研究總體的標(biāo)準(zhǔn)差。如果總體的離散程度較高, 要求樣本量較大;如果總體比較集中或一致,則要求的 樣本量較小。然而,在通常的情況下我們并不知道總體標(biāo)準(zhǔn)差,因此必須對其進行估計。
1、青原博士對畢業(yè)生起薪進行調(diào)查。假設(shè)最大可容許誤差E為100元,90%置信度所對應(yīng)的z值為1.64485,即z0.05=1.64485,總體標(biāo)準(zhǔn)差的估計為2000元。需要多少樣本量?
最大容許誤差、總體標(biāo)準(zhǔn)差的估計以及z值都已知,將數(shù)據(jù)代入估計總體均值所需樣本量的公式,可得樣本量
z=qnorm(0.05,low=F)#計算z值
z
[1]1.64485
s=2000 #總體標(biāo)準(zhǔn)差
E=100#要求的最大可容許誤差
n=(z*s/E)^2#計算所需樣本量
n
[1] 1082.217
樣本量計算的結(jié)果通常并不是整數(shù)。當(dāng)出現(xiàn)這種情況時,取不小于該數(shù)的最小整數(shù)
對于此例,結(jié)果為1082.217,取樣本量為1083。也這就是說樣本量至少為1083個。
如果提高置信度到95%,在95%的置信度下對應(yīng)的z值為
1.95996
z1=qnorm(0.025,low=F)#計算z值
n1=(z1*s/E)^2#計算所需樣本量
n1
[1] 1536.584
此時的樣本量取1537
置信度提高,則樣本量應(yīng)相應(yīng)增大
具體來看,當(dāng)置信度由95%提高到99%時,樣本量增加280
這會大大增加調(diào)查的時間和成本,因此置信度的選擇應(yīng)該慎重
關(guān)于比例估計問題樣本量的確定,與上面的過程基本 一致,也有三個因素需要確定:
(1)希望達到的置信度
(2)研究者可以承受的誤差大小
(3)總體比例的估計
總體比例的樣本量由下面的公式確定:
2、在延遲退休支持比例的調(diào)查中,假設(shè)最大可容許誤差E為0 . 1 , 90 % 的置信度所對應(yīng)的z值為1 . 64485 , 即 z0.05=1.64485,那么需要調(diào)查的樣本量是多少?
z=qnorm(0.05,low=F)#計算z值
hat.p=0.5 #總體比例p的估計
E=0.1#要求的最大可容許誤差
n=hat.p*(1-hat.p)*(z/E)^2#計算所需樣本量
n
[1] 96.03647
解出n=96.03647。取大于它的最小整數(shù), 得到n=97。文章來源:http://www.zghlxwxcb.cn/news/detail-807707.html
總結(jié)
以上就是本節(jié)的練習(xí)題介紹。文章來源地址http://www.zghlxwxcb.cn/news/detail-807707.html
到了這里,關(guān)于統(tǒng)計學(xué)-R語言-6.4的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!