相關(guān)系數(shù)
相關(guān)系數(shù)含義
個人理解為:如果當X增加時,Y趨向于減少,斯皮爾曼,皮爾遜相關(guān)系數(shù)則為負。斯皮爾曼,皮爾遜相關(guān)系數(shù)為零表明當X增加時Y沒有任何趨向性。當X和Y越來越接近完全的單調(diào)相關(guān)時,斯皮爾曼相關(guān)系數(shù)會在絕對值上增加。
如
但是,對于相關(guān)系數(shù)來說,相關(guān)系數(shù)的大小與其所呈關(guān)系不是充要關(guān)系,如
計算相關(guān)系數(shù)前的操作
1.計算相關(guān)系數(shù)前,要對數(shù)據(jù)進行描述性統(tǒng)計,事實上,不但是對相關(guān)系數(shù),對于絕大部分數(shù)學建模,在對數(shù)據(jù)進行操作前,都應對數(shù)據(jù)進行一定的描述性統(tǒng)計
描述性統(tǒng)計步驟:可以利用SPSS,stata,excel,matlab等軟件對數(shù)據(jù)進行描述性統(tǒng)計,個人比較推薦用spss,因為spss也算是數(shù)學建模比較常用的工具,而且對于初學者來說其操作難度明顯低于matlab,但SPSS的問題就在于無法編程,靈活性較差
2.在進行相關(guān)性分析時,一定要先畫矩陣散點圖,確定存在線性關(guān)系再求相關(guān)系數(shù)
圖片來源:清風數(shù)學建模
斯皮爾曼相關(guān)系數(shù)與皮爾遜相關(guān)系數(shù)
先說什么時候適合斯皮爾曼什么時候適合皮爾遜
皮爾遜相關(guān)系數(shù)求法
R = corrcoef(Test) % Test是待求矩陣
效果圖
可以使用excel進行潤色,生成色階矩陣
皮爾遜系數(shù)進行假設(shè)檢驗
個人認為相關(guān)檢驗是相關(guān)性分析中比較重要的一步,而且所涉及的假設(shè)檢驗,顯著性,p值的概念,也是后續(xù)進行一系列數(shù)學建模的基礎(chǔ),其實在相關(guān)系數(shù)這一章,進行假設(shè)檢驗的關(guān)鍵在于原假設(shè)和與之對立的假設(shè)到底是什么
其實規(guī)律就是p值若小于1-置信水平,則拒絕原假設(shè),反之無法拒絕原假設(shè)
進行假設(shè)檢驗的條件
斯皮爾曼相關(guān)系數(shù)
語法;
% 直接給出相關(guān)系數(shù)和p值
[R,P]=corr(Test, 'type' , 'Spearman')
斯皮爾曼相關(guān)系數(shù)的假設(shè)檢驗
多元線性回歸分析
數(shù)據(jù)分類
1.橫截面數(shù)據(jù):某一時間點不同對象的數(shù)據(jù),如2018各省份GDP
2.時間序列數(shù)據(jù):不同時間點,同一對象,如全國歷年各地GDP
3.面板數(shù)據(jù):以上兩種結(jié)合,如2018-2020各省份GDP
線性回歸注意事項
1.線性回歸中“線性”兩字仍是對參數(shù)來說的,而不是自變量
2.回歸系數(shù)是需要解釋的,如****解釋時,應說:“在控制…不變的條件下”
3.注意內(nèi)生性問題,具體解釋就是最后得出的結(jié)果中擾動項是否與自變量有關(guān),若有關(guān),則有內(nèi)生性問題,內(nèi)生性問題最容易理解的影響就是會使參數(shù)估計不準
3.有關(guān)虛擬變量的問題
如有31個省份的變量,則虛擬變量的個數(shù)為30個,編號為1,2,3,4
…
4.論文盡量不要使用截圖,容易被判為作弊
5.解釋性回歸一定要解釋變量的含義,此時若對數(shù)據(jù)進行歸一化則不好解釋
回歸語句
標準化回歸教程
異方差問題
這個我也沒有理解透徹,只能照搬大佬的了
看大佬原文
異方差檢驗語句
文章來源:http://www.zghlxwxcb.cn/news/detail-479505.html
異方差解決辦法
文章來源地址http://www.zghlxwxcb.cn/news/detail-479505.html
到了這里,關(guān)于數(shù)學建?!净谇屣L】:相關(guān)系數(shù)法與多元線性回歸的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!