****顯著性水平:
一個(gè)概率值,原假設(shè)為真時(shí),拒絕原假設(shè)的概率,表示為 alpha 常用取值為0.01, 0.05, 0.10
****什么是P值?
p值是當(dāng)原假設(shè)為真時(shí)樣本觀察結(jié)果及更極端結(jié)果出現(xiàn)的概率。
如果P值很小,說明這種情況發(fā)生的概率很小,如果這種情況還出現(xiàn)了,那么就有理由拒絕原假設(shè)。P值越小,拒絕原假設(shè)的理由就越充分。
根據(jù)選取的檢驗(yàn)統(tǒng)計(jì)量計(jì)算P值,通過P值確定是否拒絕該原假設(shè)。
****P值
是指在零假設(shè)成立的情況下,觀察到的檢驗(yàn)統(tǒng)計(jì)量至少如同觀察到的那樣極端的概率。它用于假設(shè)檢驗(yàn),以確定觀察到的數(shù)據(jù)是否具有統(tǒng)計(jì)學(xué)顯著性。
****P值是具有零假設(shè)為真的情況下觀察到的效應(yīng)發(fā)生的概率。
****檢驗(yàn)中常說的小概率:
在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率
在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)
小概率由我們事先確定;
****假設(shè)檢驗(yàn)的基本思想是統(tǒng)計(jì)學(xué)的 小概率反證法 思想:對(duì)于一個(gè)小概率事件而言,其互斥事件發(fā)生的概率明顯遠(yuǎn)遠(yuǎn)大于這一小概率事件,可以認(rèn)為小概率事件在一次試驗(yàn)中不應(yīng)當(dāng)發(fā)生。因此,可以首先假定需要考察的假設(shè)是成立的,然后基于此假設(shè)計(jì)算從總體中抽樣得到樣本的概率,如果概率極小,則表明這是一個(gè)小概率事件,在一次試驗(yàn)中不會(huì)發(fā)生,進(jìn)而推翻原假設(shè)。
****假設(shè)檢驗(yàn)的具體步驟為:1.提出零假設(shè)和備擇假設(shè);2.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,并找出在零假設(shè)成立的情況下,檢驗(yàn)統(tǒng)計(jì)量服從的分布;3.確定顯著性水平、拒絕域以及臨界值;4.計(jì)算檢驗(yàn)統(tǒng)計(jì)量和p值;5.決策。
****檢驗(yàn)統(tǒng)計(jì)量 是根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的樣本統(tǒng)計(jì)量,是對(duì)零假設(shè)和備擇假設(shè)作出決策的基礎(chǔ)。
什么是t檢驗(yàn)
t檢驗(yàn)(Student’s T Test)比較兩個(gè)平均值(均值),然后告訴你它們彼此是否有差異。并且,t檢驗(yàn)還會(huì)告訴你這個(gè)差異有沒有意義,換句話說,它讓你知道這些差異是否可能是偶然發(fā)生的。
什么是t分?jǐn)?shù)
t分?jǐn)?shù)是兩個(gè)組之間的差值與組內(nèi)差的比值。t分?jǐn)?shù)越大,組間的差異越大。t分?jǐn)?shù)越小,組間的相似度就越大。t分?jǐn)?shù)為3代表這些組是彼此之間的三倍。當(dāng)你運(yùn)行t-score時(shí),t值越大,結(jié)果越可能重復(fù)。
t分?jǐn)?shù)越大,這些組差異越大。
如果t分?jǐn)?shù)越小,這些組越相似的。
什么是T值和P值
“足夠大”多大?每個(gè)t值都有伴隨著一個(gè)p值。p值是你的樣本數(shù)據(jù)的結(jié)果偶然發(fā)生的概率。P值為0%至100%。它們通常寫為小數(shù)。例如,5%的p值為0.05。低p值好;低假定值是好的;他們指出你的數(shù)據(jù)不是偶然發(fā)生的。例如,p值為0.1意味著實(shí)驗(yàn)結(jié)果只有1%的可能是碰巧發(fā)生的。多數(shù)情況下,p值為0.05(5%)表示數(shù)據(jù)有效。
t檢驗(yàn)有哪些類型
t檢驗(yàn)有三種主要類型:
1.獨(dú)立樣本t檢驗(yàn):比較兩組平均值的方法。
2.配對(duì)樣本t檢驗(yàn):比較同一組中不同時(shí)間(例如,相隔一年)平均值的方法。
3.單一樣本t檢驗(yàn):檢驗(yàn)單個(gè)組的平均值對(duì)照一個(gè)已知的平均值。
三、假設(shè)檢驗(yàn)
統(tǒng)計(jì)假設(shè)檢驗(yàn)(Hypothesis Test):事先對(duì)總體的參數(shù)或者分布做一個(gè)假設(shè)(剛才的例子我們就假設(shè) p=0.5 的二項(xiàng)式分布),然后基于已有的樣本數(shù)據(jù)去判斷這個(gè)假設(shè)是否合理。即樣本和總體假設(shè)之間的不同是純屬機(jī)會(huì)變異(因?yàn)殡S機(jī)性誤差導(dǎo)致的不同),還是兩者確實(shí)不同。常用的假設(shè)檢驗(yàn)方法有 t- 檢驗(yàn)法、x2 檢驗(yàn)法(卡方檢驗(yàn))、F- 檢驗(yàn)法等
基本思想:
1、從樣本推斷整體
2、通過反證法推斷假設(shè)是否成立(假設(shè)整體滿足分布,出現(xiàn)這個(gè)樣本分布的概率大不大,如果概率非常小,那么假設(shè)不成立)
3、小概率事件在一次實(shí)驗(yàn)中基本不會(huì)發(fā)生(低于50%就不會(huì)發(fā)生,那么50%是我們選擇的值,如果比較嚴(yán)格的話,可以把這個(gè)值降到1%)
4、不輕易拒絕原假設(shè)
5、通過顯著性水平定義小概率事件不可能發(fā)生的概率
6、全稱命題只能被否定而不能被證明(通過當(dāng)前的樣本我希望做一個(gè)假設(shè),用分布的情況來推翻這個(gè)假設(shè)不成立,但是很難證明它成立)
一、假設(shè)檢驗(yàn)
統(tǒng)計(jì)假設(shè)檢驗(yàn):事先對(duì)總體的參數(shù)或者分布做一個(gè)假設(shè),然后基于已有的樣本數(shù)據(jù)去判斷這個(gè)假設(shè)是否合理。即樣本和總體假設(shè)之間的不同是純屬機(jī)會(huì)變異(因?yàn)殡S機(jī)性誤差導(dǎo)致的不同),還是兩者確實(shí)不同。常用的假設(shè)檢驗(yàn)方法有 t- 檢驗(yàn)法,x2 檢驗(yàn)法(卡方檢驗(yàn))、F- 檢驗(yàn)法等。
基本思想:
1、從樣本推斷整體
2、通過反證法推斷假設(shè)是否成立
3、小概率事件在一次實(shí)驗(yàn)中基本不會(huì)發(fā)生
4、不輕易拒絕原假設(shè)
5、通過顯著性水平定義小概率事件不可能發(fā)生的概率
6、全稱命題只能被定義而不能被證明(所謂全稱命題是指一切全部等等不太容易一個(gè)一個(gè)驗(yàn)證的,沒有辦法證實(shí),只要找到一個(gè)部分,就能證明這個(gè)命題錯(cuò)誤;但是要證明這個(gè)命題是正確,就很費(fèi)勁了)
三、原理
1、原假設(shè)怎樣設(shè)定;(相等,不相等,差異性)
2、提高,增加,降低如何選擇;
3、原假設(shè)是希望收集數(shù)據(jù)推翻的,如果假設(shè)成立(當(dāng)前的事情發(fā)生的概率大小,當(dāng)然我們希望當(dāng)前假設(shè)將原假設(shè)推翻)。如果證據(jù)無法推翻原假設(shè),那就既證明原假設(shè)成立,也不能證明原假設(shè)不成立。
因?yàn)樵僭O(shè)備被拒絕,如果出錯(cuò)的話,只能犯棄真錯(cuò)誤,而犯棄真錯(cuò)誤的概率已經(jīng)被規(guī)定的顯著性水平所控制了。這樣對(duì)統(tǒng)計(jì)者來說更容易控制,將錯(cuò)誤影響降到最小。
顯著性水平
顯著性水平是指當(dāng)原假設(shè)實(shí)際上正確時(shí),檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的概率,簡(jiǎn)單理解就是犯棄真錯(cuò)誤的概率。這個(gè)值是我們做假設(shè)檢驗(yàn)之前統(tǒng)計(jì)者根據(jù)業(yè)務(wù)情況定好的。
顯著性水平α越小,犯第I類錯(cuò)誤的概率自然越小,一般取值:0.01、0.05、0.1等。
當(dāng)給定了檢驗(yàn)的顯著水平a=0.05時(shí),進(jìn)行雙側(cè)檢驗(yàn)的Z值為1.96。
當(dāng)給定了檢驗(yàn)的顯著水平a=0.01時(shí),進(jìn)行雙側(cè)檢驗(yàn)的Z值為2.58。
當(dāng)給定了檢驗(yàn)的顯著水平a=0.05時(shí),進(jìn)行單側(cè)檢驗(yàn)的Z值為1.645。
當(dāng)給定了檢驗(yàn)的顯著水平a=0.01時(shí),進(jìn)行單側(cè)檢驗(yàn)的Z值為2.33。
檢驗(yàn)統(tǒng)計(jì)量:據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量,稱為檢驗(yàn)統(tǒng)計(jì)量。
拒絕域: 拒絕域是由顯著性水平圍成的區(qū)域。
拒絕域的功能主要用來判斷假設(shè)檢驗(yàn)是否拒絕原假設(shè)的。如果樣本觀測(cè)計(jì)算出來的檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值落在拒絕域內(nèi),就拒絕原假設(shè),否則不拒絕原假設(shè)。給定顯著性水平α后,查表就可以得到具體臨界值,將檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較,判斷是否拒絕原假設(shè)。
假設(shè)檢驗(yàn)步驟
提出原假設(shè)與備擇假設(shè);
從所研究總體中出抽取一個(gè)隨機(jī)樣本;
構(gòu)造檢驗(yàn)統(tǒng)計(jì)量;
根據(jù)顯著性水平確定拒絕域臨界值;
計(jì)算檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較。
兩種假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)根據(jù)業(yè)務(wù)數(shù)據(jù)分為兩種:一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)和兩個(gè)總體參數(shù)的假設(shè)檢驗(yàn)。
一個(gè)總體參數(shù)的假設(shè)檢驗(yàn),即只有一個(gè)總體的假設(shè)檢驗(yàn)。
一、T 檢驗(yàn):
根據(jù)研究設(shè)計(jì),t 檢驗(yàn)有三種形式:
1.單個(gè)樣本的檢驗(yàn):
用來比較一組數(shù)據(jù)的平均值和一個(gè)數(shù)值有無差異。例如,你選取了 5 個(gè)人,測(cè)定了他們的身高,要看這五個(gè)人的身高平均值是否高于、低于還是等于 1.70 m, 就需要用這個(gè)檢驗(yàn)方法。
2.配對(duì)樣本均數(shù) t 檢驗(yàn)(非獨(dú)立兩樣本均數(shù) t 檢驗(yàn))
用來看一組樣本在處理前后的平均值有無差異。比如,你選取了 5 個(gè)人,分別在飯前和飯后測(cè)量了他們的體重,想檢測(cè)吃飯對(duì)他們的體重有無影響,就需要用這個(gè) t 檢驗(yàn)。
3.兩個(gè)獨(dú)立樣本均數(shù) t 檢驗(yàn)
用來看兩組數(shù)據(jù)的平均值有無差異。比如,你選取了 5 男 5 女,想看男女之間身高有無差異,這樣,男的一組,女的一組,這兩個(gè)組之間的身高平均值的大小比較可用這種方法。
二、單個(gè)樣本 t 檢驗(yàn)
又稱單樣本均數(shù) t 檢驗(yàn)( one sample test ),適用于樣本均數(shù)與已知總體均數(shù) μ0 的比較,目的是檢驗(yàn)樣本均數(shù)所代表的總體均數(shù)是 μ 否與已知總體均數(shù) μ0 有差別。
已知總體均數(shù) μ0 一般為標(biāo)準(zhǔn)值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標(biāo)值。
應(yīng)用條件??傮w標(biāo)準(zhǔn) a 未知的小樣
本資料,且服從正態(tài)分布
雙邊檢驗(yàn)
最常見,應(yīng)用于只是簡(jiǎn)單探究“是否存在差異”的研究問題。
單邊檢驗(yàn)
適用于探究“是否顯著高于”或者“顯著低于”的研究問題。
T檢驗(yàn)和F檢驗(yàn)的關(guān)系
t檢驗(yàn)過程,是對(duì)兩樣本均數(shù)(mean)差別的顯著性進(jìn)行檢驗(yàn)。惟t檢驗(yàn)須知道兩個(gè)總體的方差(Variances)是否相等;t檢驗(yàn)值的計(jì)算會(huì)因方差是否相等而有所不同。也就是說,t檢驗(yàn)須視乎方差齊性(Equality of Variances)結(jié)果。所以,SPSS在進(jìn)行t-test for Equality of Means的同時(shí),也要做Levene's Test for Equality of Variances 。
T檢驗(yàn)是用來比較兩個(gè)均值之間是否有顯著差異的一種檢驗(yàn)方法。
T檢驗(yàn)是比較兩個(gè)均值差異的,不同種類T檢驗(yàn)的差別其實(shí)在于均值的計(jì)算差異。
1.單樣本T檢驗(yàn)stats.ttest_1samp(data,u)
單樣本T檢驗(yàn)是用來檢驗(yàn)一組樣本的均值A(chǔ)與一個(gè)已知的均值B之間是否有差異。均值A(chǔ)是通過一組樣本算出來的,均值B是已知的一個(gè)具體的值。
以往通過大規(guī)模調(diào)查已知某地新生兒出生體重為 3.30 kg .從該地難產(chǎn)兒中隨機(jī)抽收35 名新生兒,平均出生體重為 3.42 kg ,標(biāo)準(zhǔn)差為 0.40 kg ,問該地難產(chǎn)兒出生體重是否與一般新生兒體重不同?
建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)
H0: μ=μ0
H1: μ≠ μ0
α=0.05
●計(jì)算檢驗(yàn)統(tǒng)計(jì)量
強(qiáng)調(diào)自由度,自由度表示在樣本中,可以自由變化的個(gè)數(shù)。
現(xiàn)樣本中已取 35 個(gè),已知均值,假設(shè)前 34 個(gè)人都已定下并可隨機(jī)取,第 35 個(gè)就不可以隨機(jī)選,為保證均值不變,第 35 個(gè)人一定是固定值的。
本例自由度 v=n-1=35-1=34,查表得得 t0.05/2=2.032。因?yàn)?t< t0.05/2. 故 P>0.05. 按 α=0.05 水準(zhǔn),不拒絕 H0, 差別無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為該地難產(chǎn)兒與一般新生兒平均出生體重不同。
2.雙樣本T檢驗(yàn)stats.ttest_ind(data1,data2)
雙樣本T檢驗(yàn)是用來檢驗(yàn)兩組樣本的均值之間是否有差異。兩個(gè)均值都是根據(jù)樣本算出來的。
3.配對(duì)樣本T檢驗(yàn)stats.ttest_rel(data1,data2)
配對(duì)樣本T檢驗(yàn)與雙樣本T檢驗(yàn)有點(diǎn)類似,也是用來檢驗(yàn)兩組樣本的均值差異,只不過普通雙樣本T檢驗(yàn)中的樣本是亂序的,而配對(duì)樣本T檢驗(yàn)中的樣本是一一對(duì)應(yīng)的。總而言之,就是具有相同屬性的數(shù)據(jù)之間進(jìn)行相比,而不是混合總體進(jìn)行相比。
---------
四、配對(duì)樣本均數(shù)t檢驗(yàn):
簡(jiǎn)稱配對(duì) t 檢驗(yàn)( paired t test ),又稱非獨(dú)立兩樣本均數(shù) t 檢驗(yàn),適用于配對(duì)設(shè)計(jì)計(jì)量資料均數(shù)的比較。
配對(duì)設(shè)計(jì)( paired design )是將受試對(duì)象按某些特征相近的原則配成對(duì)子,每對(duì)中的兩個(gè)個(gè)體隨機(jī)地給予兩種處理
配對(duì)樣本均數(shù) t 檢驗(yàn)原理:關(guān)注的是差異值。
配對(duì)設(shè)計(jì)的資料具有對(duì)子內(nèi)數(shù)據(jù)一 一 對(duì)應(yīng)的特征,研究者應(yīng)關(guān)心是對(duì)子的效應(yīng)差值而不是各自的效應(yīng)值。
進(jìn)行配對(duì) t 檢驗(yàn)時(shí),首選應(yīng)計(jì)算各對(duì)數(shù)據(jù)間的差值 d,將 d 作為變量計(jì)算均數(shù)。
配對(duì)樣本 t 檢驗(yàn)的基本原理是假設(shè)兩種處理的效應(yīng)相同,理論上差值 d 的總體均數(shù) μd 為 0, 現(xiàn)有的不等于 0 差值樣本均數(shù)可以來自 μd= 0 的總體,也可以來 ud≠0 的總體。
可將該檢驗(yàn)理解為差值樣本均數(shù)與已知總體均數(shù) pd (μd = 0) 比較的單樣本檢驗(yàn),其檢驗(yàn)統(tǒng)計(jì)量為:
P(AB)與P(A∩B)有什么區(qū)別
如果有兩個(gè)圓,有一部分相交。那P(AB)就是A與B的總數(shù)減相交部分的值,而P(A∩B)求的就是相交部分的值。
P(AB)表示P(A∩B)AB同時(shí)發(fā)生的概率
P(A∪B)表示AB至少有一個(gè)發(fā)生的概率
1.基于偏度和峰度的假設(shè)檢驗(yàn)
基于偏度-峰度的檢驗(yàn)是利用了正態(tài)分布偏度(3階矩)和峰度(4階矩)都為0的特點(diǎn)。
如果樣本數(shù)據(jù)能滿足偏度和峰度均為0的假設(shè),則可以認(rèn)為總體服從正態(tài)分布。
由于該檢驗(yàn)是基于偏度檢驗(yàn)和峰度檢驗(yàn)的,樣本數(shù)量需要8個(gè)以上。
以下normaltest函數(shù)就使用該原理進(jìn)行正態(tài)分布檢驗(yàn)。
scipy.stats.normaltest(X)
該函數(shù)輸出兩個(gè)結(jié)果,第一個(gè)為檢驗(yàn)統(tǒng)計(jì)量,第二個(gè)為p值。如果p值大于0.05(常用顯著水平)即可認(rèn)定總體服從正態(tài)分布。
使用偏度和峰度擬合優(yōu)度檢驗(yàn)的還有Jarque–Bera檢驗(yàn)法。
S為偏度,K為峰度,n為樣本數(shù)或自由度
同樣,Jarque–Bera檢驗(yàn)樣本數(shù)量也需要8個(gè)以上。其使用方法如下:
scipy.stats.self_JBtest(X)
該函數(shù)輸出兩個(gè)結(jié)果,第一個(gè)為檢驗(yàn)統(tǒng)計(jì)量,第二個(gè)為p值。如果p值大于0.05(常用顯著水平)即可認(rèn)定總體服從正態(tài)分布。
K-S檢驗(yàn)原理
KS檢驗(yàn)與其他方法不同是KS檢驗(yàn)不需要知道數(shù)據(jù)的分布情況,是一種非參數(shù)檢驗(yàn)方法,理論上可以檢驗(yàn)任何一種分布情況(不限于正態(tài)分布檢驗(yàn))。當(dāng)然付出的代價(jià)就是靈敏度沒有專門針對(duì)某種分布的檢驗(yàn)方法高(比如上面的normaltest)。另外,由于大多數(shù)KS檢驗(yàn)軟件在實(shí)現(xiàn)是都用大樣本近似公式,因此KS算法更適合大樣本(300以上)檢驗(yàn)。
以下方法就是使用KS檢驗(yàn)進(jìn)行正態(tài)分布檢驗(yàn):
kstest(X,"norm")
f檢驗(yàn)
T檢驗(yàn)和F檢驗(yàn)的由來:為了確定從樣本中的統(tǒng)計(jì)結(jié)果推論到總體時(shí)所犯錯(cuò)的概率。
F檢驗(yàn)又叫做聯(lián)合假設(shè)檢驗(yàn),也稱方差比率檢驗(yàn)、方差齊性檢驗(yàn)。是由英國統(tǒng)計(jì)學(xué)家Fisher提出。
通過比較兩組數(shù)據(jù)的方差,以確定他們的精密度是否有顯著性差異。
?t檢驗(yàn)
T檢驗(yàn),也稱student t檢驗(yàn),主要用戶樣本含量較小,總體標(biāo)準(zhǔn)差未知的正態(tài)分布。
t檢驗(yàn)是用t分布理論來推論差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。
t檢驗(yàn)分為單總體檢驗(yàn)和雙總體檢驗(yàn)。
單總體t檢驗(yàn)是檢驗(yàn)一個(gè)樣本平均數(shù)與一個(gè)已知的總體平均數(shù)的差異是否顯著。
當(dāng)總體分布是正態(tài)分布,如總體標(biāo)準(zhǔn)差未知且樣本容量小于30,那么樣本平均數(shù)與總體平均數(shù)的離差統(tǒng)計(jì)量呈t分布。文章來源:http://www.zghlxwxcb.cn/news/detail-453024.html
卡方檢驗(yàn)
卡方檢驗(yàn)就是統(tǒng)計(jì)樣本的實(shí)際觀測(cè)值與理論推斷值之間的偏離程度,實(shí)際觀測(cè)值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個(gè)值完全相等時(shí),卡方值就為0,表明理論值完全符合。文章來源地址http://www.zghlxwxcb.cn/news/detail-453024.html
到了這里,關(guān)于假設(shè)檢驗(yàn)/T檢驗(yàn)/F檢驗(yàn)/Z檢驗(yàn)/卡方檢驗(yàn)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!