国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

【數(shù)學(xué)建模】青少年犯罪問題 | 逐步回歸分析法stepwise函數(shù) | 殘差分析rcoplot

這篇具有很好參考價(jià)值的文章主要介紹了【數(shù)學(xué)建?!壳嗌倌攴缸飭栴} | 逐步回歸分析法stepwise函數(shù) | 殘差分析rcoplot。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方,請(qǐng)大家不吝賜教,您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

提示:文章寫完后,目錄可以自動(dòng)生成,如何生成可參考右邊的幫助文檔


一、逐步回歸分析法

1.1.逐步回歸分析定義,最優(yōu)回歸方程

逐步回歸分析(stepwise regression analysis),選擇自變量以建立最優(yōu)回歸方程的回歸分析方法。最優(yōu)回歸方程,指在回歸方程中,包含所有對(duì)因變量有顯著影響的自變量,而不包含對(duì)因變量影響不顯著的自變量。過程是:按自變量對(duì)因變量影響效應(yīng),由大到小逐個(gè)把有顯著影響的自變量引入回歸方程,而那些對(duì)因變量影響不顯著的變量則可能被忽略。另外,已被引入回歸方程的變量在引入新變量后,其重要性可能會(huì)發(fā)生變化,當(dāng)效應(yīng)不顯著時(shí),則需要從回歸方程中將此變量剔除。引入一個(gè)變量或從回歸方程中剔除一個(gè)變量都稱為逐步回歸的一步。每一步都要進(jìn)行F檢驗(yàn),以保證在引入新變量前回歸方程中只含有對(duì)因變量影響顯著的變量,而不顯著的變量已被剔除。直到回歸方程中所有變量都不能剔除而又沒有新變量可以引入時(shí)為止,逐步回歸過程結(jié)束。實(shí)際應(yīng)用時(shí),需要注重逐步回歸分析跟自己研究假設(shè)之間的關(guān)聯(lián)。由于運(yùn)算過程比較復(fù)雜,可通過統(tǒng)計(jì)軟件中的回歸分析模塊進(jìn)行(從百度抄的的定義

簡(jiǎn)單的說,就是探究自變量對(duì)因變量的影響,有些自變量對(duì)因變量影響大,有些影響小。

1.2.stepwise函數(shù)介紹

stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
stepwise(X,y)屬于比較常用的調(diào)用格式,其中X是自變量數(shù)據(jù),是一個(gè)矩陣。y是因變量,是一個(gè)列向量。inmodel表示矩陣列數(shù)的指標(biāo),缺省時(shí)設(shè)定為全部自變量;

二、例題:青少年犯罪問題

2.1.題目簡(jiǎn)述

stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析

2.2.問題一建模與求解

2.2.1 只存在兩個(gè)因素時(shí)

首先拿到一組數(shù)據(jù),我們首先畫出他們的x-y圖像,看看可能存在的關(guān)系。
代碼如下(示例):

clc;
clear;
%自變量1:低收入家庭百分比
x1=[16.5 20.5 26.3 16.5 19.2 16.5 20.2 21.3 17.2 14.3 ... 
    18.1 23.1 19.1 24.7 18.6 24.9 17.9 22.4 20.2 16.9]; 
%自變量2:失業(yè)率
x2=[6.2 6.4 9.3 5.3 7.3 5.9 6.4 7.6 4.9 6.4 ...
    6.0 7.4 5.8 8.6 6.5 8.3 6.7 8.6 8.4 6.7]; 
%自變量3:總?cè)丝跀?shù)
x3=[587 643 635 692 1248 643 1964 1531 713 749 ...
    7895 762 2793 741 625 854 716 921 595 3353];
%因變量:犯罪率
y=[11.2 13.4 40.7 5.3 24.8 12.7 20.9 35.7 8.7 9.6 ...
   14.5 26.9 15.7 36.2 18.1 28.9 14.9 25.8 21.7 25.7]; 
figure(1),plot(x1,y,'o'); 
xlabel('低收入家庭百分比'); ylabel('犯罪率');
figure(2),plot(x2,y,'o'); 
xlabel('失業(yè)率'); ylabel('犯罪率');
figure(3),plot(x3,y,'o'); 
xlabel('總?cè)丝跀?shù)(千人)'); ylabel('犯罪率');

最后生成的結(jié)果如下:
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
可以模糊看出,自變量1和自變量2和因變量存在一定“線性”關(guān)系,自變量3看不出來。
接下來進(jìn)行逐步回歸分析,這里考慮簡(jiǎn)單一點(diǎn),只考慮 x1,x2,x3三個(gè)自變量存在的可能性,不考慮x1x2,x1x3,x2x3,x1^2等:(我只是想偷懶)

X=[x1',x2',x3']; %使用stepwise函數(shù)時(shí),將自變量數(shù)據(jù)轉(zhuǎn)置后組成矩陣
stepwise(X,y)

得到結(jié)果如下:
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
操作這張圖就能得到很多有效信息。可以點(diǎn)擊“全部步驟”做完所有分析,也可以點(diǎn)擊“下一步”一步步來。
圖中最重要的信息是:Coeff(回歸系數(shù)),截距,RMSE
RMSE越小,說明這個(gè)方法下模型越合理
下面看下操作就懂了。

當(dāng)x1,x2成為自變量時(shí)(點(diǎn)擊x1,x2那兩條,藍(lán)色即是被選中)
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
此時(shí)回歸方程為y=-34.0725+1.22393x1+4.39894x2

當(dāng)x2,x3成為自變量時(shí)(點(diǎn)擊x2,x3那兩條)
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
此時(shí)回歸方程為y=-31.5996+7.35187x2+0.000826627x3

當(dāng)x1,x3成為自變量時(shí)(點(diǎn)擊x1,x3那兩條)
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
此時(shí)回歸方程為y=-31.2152+2.59552x1+0.000419806x3

通過以上結(jié)果可以看到,x1,x2是自變量的時(shí)候,RMSE最小,為最優(yōu)。
其中模型歷史記錄可以看到歷次操作后的RMSE值:
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析

2.2.2 存在三個(gè)因素時(shí)

緊接著剛剛的逐步回歸分析,如果我們把三個(gè)自變量都選中:
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
可以看出,x3的回歸系數(shù)很小,幾乎為0,沒啥用(此時(shí)工具箱也讓我們移除x3),這時(shí)候我們考慮一下x1x2,x1x3,x2x3,x1^2等存在的可能性

X1=[x1',x2',x3',(x1.*x2)',(x2.*x3)',(x1.*x3)',x1'.^2,x2'.^2,x3'.^2]; 
stepwise(X1,y)

最后得到RMSE最小時(shí)(x1,x3,x2x3):
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
此時(shí)回歸方程為y=-13.7725+1.47538x1±0.0314395x3+0.00530496x2x3

2.3.問題二建模與求解

既然題目中說到了改進(jìn),比如剔除異常點(diǎn),那我們就只剔除異常點(diǎn)吧(偷懶…)
檢測(cè)回歸的異常點(diǎn),這不就是rcoplot函數(shù)的工作嘛。

2.3.1 rcoplot函數(shù)

rcoplot(r,rint)函數(shù)可以畫出回歸分析后的殘差圖,能辨別異常點(diǎn)(殘差過大的點(diǎn),紅色的)。r是殘差。一般和regress()一起使用。

2.3.2 解題

在數(shù)據(jù)代碼后加上下面幾句:

X2=[ones(20,1),x1',x2']; %回歸的因子 1,x1,x2
[b,bint,r,rint,s]=regress(y',X2); %回歸分析
rcoplot(r,rint)  %殘差分析

結(jié)果如下:
stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
很明顯第8組數(shù)據(jù)和18組數(shù)據(jù)出問題,應(yīng)該剔除。

我們?cè)倏聪氯齻€(gè)因素時(shí)的情況:

X2=[ones(20,1),x1',x3',(x2.*x3)'];
[b,bint,r,rint,s]=regress(y',X2);
rcoplot(r,rint)

stepwise逐步回歸法,數(shù)學(xué)建模,算法,回歸,大數(shù)據(jù),數(shù)據(jù)分析
18組數(shù)據(jù)出問題,應(yīng)該剔除。文章來源地址http://www.zghlxwxcb.cn/news/detail-582492.html

到了這里,關(guān)于【數(shù)學(xué)建?!壳嗌倌攴缸飭栴} | 逐步回歸分析法stepwise函數(shù) | 殘差分析rcoplot的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點(diǎn)僅代表作者本人,不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請(qǐng)注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符,請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋,一經(jīng)查實(shí),立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

相關(guān)文章

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請(qǐng)作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包