參考書目:《行為科學(xué)統(tǒng)計精要》(第八版)——弗雷德里克·J·格雷維特
數(shù)據(jù)及其樣本的分布
描述一組數(shù)據(jù)分布
?文章來源:http://www.zghlxwxcb.cn/news/detail-722633.html
描述一組樣本數(shù)據(jù)的分布
描述樣本數(shù)據(jù)的均值和整體數(shù)據(jù)一樣,但是樣本標(biāo)準(zhǔn)差的公式除以了n-1,這里引入自由度的概念
自由度:如果均值確定,那么n個數(shù)據(jù)組成的樣本中,只有n-1個數(shù)據(jù)的取值是自由的,最后一個數(shù)據(jù)等于n*均值減去其余n-1個值的和
Z分位數(shù)?
Z分位數(shù)描述的是一個數(shù)據(jù)在整組數(shù)據(jù)中的位置:即:當(dāng)前值x距離總體均值有多少個標(biāo)準(zhǔn)差的距離
?
Z分位數(shù)因?yàn)槭敲枋龇植嘉恢玫?,所以我們通常在去量綱單位(標(biāo)準(zhǔn)化為0-1的分布)的處理中經(jīng)常用到,因?yàn)椴还軘?shù)據(jù)單位是時分秒,十萬百萬千萬,在觀測某個數(shù)值在整體分布中的位置,衡量標(biāo)準(zhǔn)都是一樣的,不受單位影響。
?
Z分位數(shù)可以幫助判斷一個樣本是不是異常值,也就是根據(jù)一個數(shù)據(jù)在整組數(shù)據(jù)中的Z分位數(shù)值,對應(yīng)找到這個數(shù)據(jù)在整組數(shù)據(jù)中出現(xiàn)的概率,具體數(shù)值參考標(biāo)準(zhǔn)正態(tài)分布表,如下圖
?也就是說,如果Z分位數(shù)大于1.96,那么數(shù)據(jù)出現(xiàn)的概率小于1-97.5%=2.5%,對應(yīng)的因?yàn)槭菢?biāo)準(zhǔn)正態(tài)分布,所以Z分位數(shù)小于1.96,對應(yīng)數(shù)據(jù)出現(xiàn)的概率也是同樣小于2.5%
總體和樣本
如果Z分位數(shù)衡量的是,一個數(shù)值在整體數(shù)值中出現(xiàn)的概率大小。換句話說Z分位數(shù)可以表示,這個數(shù)值是能代表整體的,還是說是個異常值
那么,按照這個思路,我們?nèi)绾魏饬吭谝粋€整體中隨機(jī)挑選N個數(shù)值組成的樣本是否能代表整體
我們直觀感受,影響這個結(jié)論的因素有三點(diǎn):
1、樣本均值和總體均值是否相近(M-μ),越相近說明越能代表總體
2、總體分布方差,總體數(shù)據(jù)的離散度越小選中的樣本越有代表性,極端情況總體數(shù)據(jù)都是一樣的值,那么無論怎么選,樣本分布都和總體分布一致
3、樣本量大?。╪),樣本量越大越能體現(xiàn)整體,極端情況樣本量最大等于整體數(shù)據(jù)量
將以上三個因素結(jié)合Z分位數(shù)的計算思路,我們引出樣本Z分位數(shù)
?
如果Z分位數(shù)過大或者過小,那么說明不大可能從總體中抽中這樣的樣本。文章來源地址http://www.zghlxwxcb.cn/news/detail-722633.html
到了這里,關(guān)于概率論:樣本與總體分布,Z分?jǐn)?shù)與概率的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!