單總體參數(shù)的假設(shè)檢驗(yàn)
單總體均值的檢驗(yàn)
DescrStatsW.ztest_mean()
statsmodels.stats.weightstats.DescrStatsW.ztest_mean(value=0,?alternative='two-sided') | |
參數(shù) |
說明 |
value |
假設(shè)的均值 |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘larger’,?‘smaller’ |
weightstats.ztest()
statsmodels.stats.weightstats.ztest(x1,?x2=None,?value=0,?alternative='two-sided') | |
參數(shù) |
說明 |
x1,?x2 |
獨(dú)立樣本數(shù)據(jù),x2可為None,用于單總體檢驗(yàn) |
value |
假設(shè)值 |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘larger’,?‘smaller’ |
例1: 國家要求含水量不超過4%,能否認(rèn)為該生產(chǎn)廠商該批次的餅干符合要求?(顯著水平取0.05)
????????????????
單側(cè)檢驗(yàn)
?
返回值均為一個(gè)元組,第一個(gè)元素是計(jì)算出的統(tǒng)計(jì)量,第二個(gè)元素是p值
p=0.67 遠(yuǎn)大于 0.05,因此沒有理由拒絕原假設(shè),即沒有理由認(rèn)為該廠商生產(chǎn)的該批次餅干是不合格的。
DescrStatsW.ttest_mean()
statsmodels.stats.weightstats.DescrStatsW.ttest_mean(value=0,?alternative='two-sided') | |
參數(shù) |
說明 |
value |
假設(shè)的均值 |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘larger’,?‘smaller’ |
ttest_1samp()?
scipy.stats.ttest_1samp(a,?popmean) | |
參數(shù) |
說明 |
a |
樣本數(shù)據(jù) |
popmean |
假設(shè)均值 |
例2:?某移動(dòng)通信公司對其用戶進(jìn)行滿意度評估,公司認(rèn)為用戶滿意度應(yīng)該超過82分,為此公司進(jìn)行了小規(guī)模的調(diào)查,得到25各用戶評價(jià)滿意度得分。試在顯著性水平0.05條件下,對該公司的用戶滿意度進(jìn)行評估。
????????????????
單側(cè)檢驗(yàn)
p值遠(yuǎn)大于0.05,?沒有充分理由拒絕原假設(shè),即沒有理由認(rèn)為該公司的用戶總體評價(jià)會大于82分。
注意:re是雙側(cè)檢驗(yàn)的p值,如果備擇假設(shè)取“<”符號:當(dāng)t>=0時(shí),進(jìn)行判定得單側(cè)p值=1-Pvalue/2; t<0時(shí),p=Pvalue/2; 取“>”符號:當(dāng)t>=0時(shí),p=Pvalue/2; t<0時(shí),p=1-Pvalue/2
單總體比例的假設(shè)檢驗(yàn)
binom_test() 二項(xiàng)分布檢驗(yàn)
scipy.stats.binom_test(x,?n=None,?p=0.5,?alternative=’two-sided’) | |
參數(shù) |
說明 |
x |
‘成功’的樣本數(shù)量 |
n |
樣本總數(shù)量 |
p |
假設(shè)的比例值 |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘greater’,?‘less’? |
proportions_ztest()?正態(tài)分布檢驗(yàn)
statsmodels.stats.proportion.proportions_ztest(count,?nobs,?value=None,?alternative='two-sided') | |
參數(shù) |
說明 |
count |
‘成功’的樣本數(shù)量 |
nobs |
樣本總數(shù)量 |
value |
假設(shè)的比例值 |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘larger’,?‘smaller’? |
*smaller: prop < value;?larger: prop > value
例3: 一批產(chǎn)品中隨機(jī)抽取100個(gè),95個(gè)合格,5個(gè)不合格,根據(jù)相關(guān)規(guī)定,該種產(chǎn)品合格率應(yīng)當(dāng)大于97%,那么在顯著性水平a=0.05下,能否認(rèn)為該批次產(chǎn)品不合格??
????????????????
?p值明顯大于0.05,故不能拒絕原假設(shè),可以認(rèn)為該批次產(chǎn)品合格
兩總體參數(shù)的假設(shè)檢驗(yàn)
兩個(gè)獨(dú)立樣本均值之差的假設(shè)檢驗(yàn)
ttest_ind() t檢驗(yàn)
?-?scipy.stats庫
scipy.stats.ttest_ind(a,?b,?axis=0,?equal_var=True) | |
參數(shù) |
說明 |
a,?b |
兩組樣本數(shù)據(jù),應(yīng)具有相同的形狀(shape) |
axis |
多維數(shù)組的數(shù)據(jù)讀取方向 |
equal_var |
是否要求方差齊性 |
- statsmodels模塊?
statsmodels.stats.weightstats.ttest_ind(x1,?x2,?alternative='two-sided',?usevar='pooled',?value=0) | |
參數(shù) |
說明 |
x1,?x2 |
兩組樣本數(shù)據(jù),應(yīng)具有相同的形狀(shape) |
alternative |
備擇假設(shè)的形式,可選值:‘two-sided’,?‘larger’,?‘smaller’? |
usevar |
是否要求方差齊性:?pooled?–?要求,unequal?–?不要求 |
value |
指定原假設(shè)取等號時(shí)的檢驗(yàn)值 |
例4:?為了檢驗(yàn)兩種新生產(chǎn)工藝對電池續(xù)航能力是否有明顯的影響,隨機(jī)抽取了兩種新工藝生產(chǎn)的同批次電池,在同一型號筆記本電腦上的放電時(shí)間(小時(shí))。設(shè)顯著性a=0.01,檢驗(yàn)這兩種工藝對電池續(xù)航時(shí)間影響是否有顯著差異。?
battery.csv?
按照工藝分類,提取為兩個(gè)DataFrame
?
?68為自由度:70-2
?大樣本也可以采用z檢驗(yàn)
獨(dú)立樣本比例之差的假設(shè)檢驗(yàn)
兩個(gè)總體比例是否有差異或檢驗(yàn)其差異的具體數(shù)值; 通常用Z統(tǒng)計(jì)量進(jìn)行檢驗(yàn)
proportions_ztest()?正態(tài)分布檢驗(yàn)
與單總體檢驗(yàn)幾乎相同,If this is array_like,注意nobs和count長度相同
關(guān)于 value:In the case of a two-sample test, the null hypothesis is that prop[0] - prop[1] = value, where prop is the proportion in the two samples. If not provided value = 0 and the null is prop[0] = prop[1]. 即,雙總體檢驗(yàn)時(shí),value是兩個(gè)比例之差,若沒有給出value則默認(rèn)為0。
在兩個(gè)樣本檢驗(yàn)中,smaller意味著備擇假設(shè)成立,而larger意味著 ,即:
smaller | ????????? |
larger | ? |
例5:?某出版集團(tuán)為了對旗下兩本時(shí)尚雜志進(jìn)行精確的市場定位,分別對兩本雜志讀者的性別進(jìn)行了隨機(jī)的抽樣調(diào)查,試在顯著性水平g=0.01條件下分析兩本雜志讀者性別的差異性。
假設(shè)經(jīng)過經(jīng)驗(yàn)判斷,訂閱了雜志1的女性占比為0.4,訂閱了雜志2的女性占比為0.7,檢驗(yàn)二者的差異是否超過了0.3。
????????????????
統(tǒng)計(jì)性別為Female的讀者對兩本雜志的選擇情況?
統(tǒng)計(jì)所有讀者對兩本雜志的選擇情況?
?
p值遠(yuǎn)大于0.05,?沒有充分理由拒絕原假設(shè),二者的差異沒有超過0.3,故兩本雜志讀者的性別沒有顯著差異
成對樣本的假設(shè)檢驗(yàn)
兩個(gè)樣本不互相獨(dú)立,但是組成成對樣本的不同個(gè)體之間的觀測值是相對獨(dú)立的,因此,可以先把兩個(gè)樣本中配對的觀測值逐個(gè)相減,形成一個(gè)由獨(dú)立觀測值組成的樣本,然后用單樣本檢驗(yàn)方法取進(jìn)行統(tǒng)計(jì)推斷
ttest_rel()
scipy.stats.ttest_rel(a,?b,?axis=0) | |
參數(shù) |
說明 |
a,?b |
兩組樣本數(shù)據(jù),應(yīng)具有相同的形狀(shape) |
axis |
多維數(shù)組的數(shù)據(jù)讀取方向 |
例6:?為考察某市市民生活的幸福程度,連續(xù)多年對固定樣本進(jìn)行調(diào)查。隨著社會經(jīng)濟(jì)的快速發(fā)展,幸福度是否會得到提升呢?(設(shè)顯著性水平a=0.05) 隨機(jī)抽取了2015,2016兩年中200個(gè)樣本進(jìn)行分析。
假設(shè)幸福度沒有得到提升
????????????????
p遠(yuǎn)大于0.05,無法拒絕原假設(shè),不能認(rèn)為市民的幸福度得到顯著提升。
或者:假設(shè)幸福度得到了提升,,
說明樣本均值中看,第二年比第一年的幸福度高,但p值遠(yuǎn)遠(yuǎn)大于0.05,不能拒絕原假設(shè),故可以認(rèn)為幸福度得到了提升。這樣與第一種假設(shè)得出的結(jié)論完全相反,這是因?yàn)樵僭O(shè)只能被證偽,而不能被證實(shí)!想證實(shí)的結(jié)論應(yīng)該設(shè)置為備擇假設(shè)而不是原假設(shè)!故給出一些原假設(shè)與備擇假設(shè)選取時(shí)盡量遵循的規(guī)則:
雙側(cè)檢驗(yàn)
問: 有無顯著變化
驗(yàn)證: 沒有顯著變化
原假設(shè): 有顯著變化,等號放在原假設(shè)
單側(cè)檢驗(yàn)
問:有無顯著提高
驗(yàn)證:有顯著提高
原假設(shè):沒有顯著提高,等號放在原假設(shè)文章來源:http://www.zghlxwxcb.cn/news/detail-408135.html
文章來源地址http://www.zghlxwxcb.cn/news/detail-408135.html
到了這里,關(guān)于python統(tǒng)計(jì)(二)假設(shè)檢驗(yàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!