方差和標(biāo)準(zhǔn)差:
一個(gè)隨機(jī)變量,的值的變化程度可以用方差計(jì)算:
?;其中?是期望。
另外一種等價(jià)表達(dá)式:
? ? ?其中為均值,N為總體例數(shù)
我們舉個(gè)例子:
服從均一分布,取值為0.1,0.2,0.3,0.4,0.5 ,每種值的概率是20%,可算出期望是0.3,那么方差就是:
標(biāo)準(zhǔn)差是方差的平方根,隨機(jī)變量的標(biāo)準(zhǔn)差是
此處為了方便,計(jì)算方差和標(biāo)準(zhǔn)差時(shí),分母是N,計(jì)算的是總體方差和總體標(biāo)準(zhǔn)差。(在實(shí)際應(yīng)用中,因?yàn)闃颖臼浅闃訕颖?,?jì)算方差和標(biāo)準(zhǔn)差時(shí),分母應(yīng)是N-1,也就是說(shuō)計(jì)算的是樣本方差和樣本標(biāo)準(zhǔn)差。)
協(xié)方差:
協(xié)方差可以用來(lái)衡量?jī)蓚€(gè)變量的線性相關(guān)性,并且可以化簡(jiǎn)到容易計(jì)算的形式(化簡(jiǎn)過(guò)程有問(wèn)題可以找下證明或者舉個(gè)例子親自算一下):
我們舉第一個(gè)例子:?
服從均一分布,取值為0.1,0.2,0.3,0.4,0.5 ,每種值的概率是20%,可算出期望是0.3,標(biāo)準(zhǔn)差是;
服從均一分布,取值為10000,20000,30000,40000,50000 ,每種值的概率是20%,可算出期望是30000,標(biāo)準(zhǔn)差是;
假設(shè)?和??線性相關(guān),此時(shí)?,那么取0.1取10000的概率為0.2,取0.1取20000、30000、40000、50000的概率都為0,以此類推。
和的協(xié)方差就是:
我們?cè)倥e第二個(gè)例子:
把上個(gè)例子中的隨機(jī)變量改變,隨機(jī)變量不改變。
服從均一分布,取值為1,2,3,4,5?,每種值的概率是20%,可算出期望是3,標(biāo)準(zhǔn)差是;
假設(shè)?和??線性相關(guān),此時(shí)?,那么取0.1取1的概率為0.2,取0.1取2、3、4、5的概率都為0,以此類推。
和的協(xié)方差就是:
兩個(gè)例子對(duì)比一下,兩個(gè)例子中的兩個(gè)隨機(jī)變量都是線性相關(guān)的,求出來(lái)的協(xié)方差都大于0,但是兩個(gè)協(xié)方差的數(shù)值有較大差異,相差了10000倍。
皮爾遜相關(guān)系數(shù):
皮爾遜相關(guān)系數(shù)是兩個(gè)隨機(jī)變量?和?的協(xié)方差與標(biāo)準(zhǔn)差之商:
我們可以計(jì)算上述兩個(gè)例子里的皮爾遜相關(guān)系數(shù):
第一個(gè)例子:
第二個(gè)例子:
皮爾遜相關(guān)系數(shù)都為1。
協(xié)方差、皮爾遜相關(guān)系數(shù)與線性相關(guān)
完全線性相關(guān)、線性相關(guān)、線性獨(dú)立、完全獨(dú)立:
如果變量可以用表示成?,那么兩個(gè)隨機(jī)變量完全線性相關(guān),否則不是完全線性相關(guān)。不是完全線性相關(guān)的兩個(gè)變量有可能線性相關(guān),有可能線性獨(dú)立。如果兩個(gè)變量有一定的線性關(guān)系,那么兩個(gè)變量線性相關(guān);如果和沒(méi)有任何關(guān)系(完全獨(dú)立)或者左右對(duì)稱的線性關(guān)系可以抵消掉,那么兩個(gè)變量線性獨(dú)立。我們舉一些例子。
完全線性相關(guān)的例子:
如果,點(diǎn)集如散點(diǎn)圖所示,那么概率矩陣和計(jì)算協(xié)方差如下,協(xié)方差為4大于0(綠色部分值的加和),皮爾遜系數(shù)為1:
? ? ? ? ? ? ? ?? ? ??
線性相關(guān)的例子:
如果,點(diǎn)集如散點(diǎn)圖所示,那么概率矩陣和計(jì)算協(xié)方差如下,協(xié)方差為12大于0,皮爾遜系數(shù)為0.98:
? ? ? ? ? ? ? ? ? ?
線性獨(dú)立的例子:
仍然是,取不同的數(shù)值再算一下,點(diǎn)集如散點(diǎn)圖所示,協(xié)方差為0,皮爾遜系數(shù)為0,此時(shí)左右對(duì)稱的線性關(guān)系可以抵消掉:
? ? ? ? ? ? ? ? ?
線性獨(dú)立的另外一個(gè)例子,點(diǎn)集如散點(diǎn)圖所示,此時(shí)和??完全獨(dú)立,協(xié)方差為0,皮爾遜系數(shù)為0:
? ? ? ? ? ? ? ? ??
通過(guò)上述例子可以看出,當(dāng)兩變量線性獨(dú)立時(shí),協(xié)方差一定等于0;當(dāng)協(xié)方差等于0時(shí),兩變量也一定線性獨(dú)立,但是并不代表兩變量完全獨(dú)立(完全獨(dú)立的例子)。
下圖是皮爾遜相關(guān)系數(shù)的一個(gè)圖示便于理解:
?總結(jié)
如果兩個(gè)變量的變化趨勢(shì)一致,也就是說(shuō)如果其中一個(gè)大于自身的期望值,另外一個(gè)也大于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是正值。如果兩個(gè)變量的變化趨勢(shì)相反,即其中一個(gè)大于自身的期望值,另外一個(gè)卻小于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是負(fù)值。
協(xié)方差和皮爾遜相關(guān)系數(shù)都可以衡量?jī)蓚€(gè)隨機(jī)變量的線性相關(guān)性(注意只是線性相關(guān)性),協(xié)方差受隨機(jī)變量數(shù)值大小的影響,而皮爾遜相關(guān)系數(shù)不受隨機(jī)變量數(shù)值大小的影響。所以兩隨機(jī)變量的協(xié)方差越大并不代表這兩個(gè)變量越線性相關(guān),而兩隨機(jī)變量的皮爾遜相關(guān)系數(shù)絕對(duì)值越大這兩個(gè)變量越線性相關(guān)。文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-493866.html
協(xié)方差的范圍是;協(xié)方差<0時(shí),線性負(fù)相關(guān);協(xié)方差>0時(shí),線性正相關(guān);協(xié)方差=0時(shí),線性獨(dú)立。皮爾遜相關(guān)系數(shù)的范圍是;當(dāng)為-1時(shí),完全線性負(fù)相關(guān);當(dāng)為1時(shí),完全線性正相關(guān);當(dāng)>-1且<0時(shí),線性負(fù)相關(guān),絕對(duì)值越大越線性負(fù)相關(guān);當(dāng)>0且<1時(shí),線性正相關(guān),絕對(duì)值越大越線性正相關(guān);當(dāng)=0時(shí),線性獨(dú)立。文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-493866.html
到了這里,關(guān)于概率論:方差、標(biāo)準(zhǔn)差、協(xié)方差、皮爾遜相關(guān)系數(shù)、線性相關(guān)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!