碼字總結(jié)不易,老鐵們來個三連:點贊、關注、評論
作者:[左手の明天]
?原創(chuàng)不易,轉(zhuǎn)載請聯(lián)系作者并注明出處
版權聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權協(xié)議,轉(zhuǎn)載請附上原文出處鏈接和本聲明。
由于客觀事物內(nèi)部規(guī)律的復雜及人們認識程度的限制,無法分析實際對象內(nèi)在的因果關系,建立合乎機理規(guī)律的數(shù)學模型。通過對數(shù)據(jù)的統(tǒng)計分析,找出與數(shù)據(jù)擬合最好的模型。
回歸模型是用統(tǒng)計分析方法建立的最常用的一類模型
1、適用的范圍:無法分析實際對象的因果關系,建立合乎確定的機理的數(shù)學模型,只可能根據(jù)數(shù)據(jù)去建立模型,再根據(jù)數(shù)據(jù)去檢驗模型。
2、具體的適用對象:在數(shù)學建模中必須用到的統(tǒng)計回歸模型的知識
3、解決步驟:根據(jù)已知數(shù)據(jù),從常識和經(jīng)驗來判斷和分析,輔以作圖,決定取那幾個回歸變量,以及他們的形式。
目錄
一元線性回歸模型
一元線性回歸模型的形式
matlab實現(xiàn)
多元線性回歸模型
多元線性回歸模型形式
一般形式
解析形式
矩陣形式
多元線性回歸模型的假設
matlab實現(xiàn)
1、確定回歸系數(shù)的點估計值
2、求回歸系數(shù)的點估計和區(qū)間估計、并檢驗回歸模型
?3、畫出殘差及其置信區(qū)間
多項式回歸模型
一元多項式回歸
1、回歸
2、預測和預測誤差估計
多元二項式回歸?
非線性回歸模型
逐步回歸
常見模型實例
線性回歸實例——牙膏的銷售量
問題提出
基本模型
模型求解
結(jié)果分析
銷售量預測
模型改進
兩模型銷售量預測比較
兩模型與x1,x2關系的比較
交互作用影響的討論?
完全二次多項式模型?
非線性回歸實例——酶促反應
問題提出
方案
分析:酶促反應的基本性質(zhì)
基本模型:Michaelis-Menten模型
?解決方案一:線性化模型
?線性化模型結(jié)果分析
解決方案二:非線性化模型
非線性模型結(jié)果分析
混合反應模型
混合模型求解
簡化的混合模型?
一般混合模型與簡化混合模型預測比較
模型評注
軟件開發(fā)人員的薪金
問題提出
模型假設
模型:線性回歸
?模型求解?
結(jié)果
結(jié)果分析:殘差分析方法
模型改進
模型應用?
模型評注?
投資額與國民生產(chǎn)總值和物價指數(shù)
問題提出
模型分析
基本回歸模型
?結(jié)果與分析
自相關性的定性診斷:殘差診斷法
自回歸性的定量診斷:D-W檢驗?
D-W統(tǒng)計量與D-W檢驗
?廣義差分變換
投資額新模型的建立??
新模型的自相關性檢驗?
模型結(jié)果比較
投資額預測?
一元線性回歸模型
一元線性回歸模型的形式
1、估計參數(shù)a,b,σ^2;
2、檢驗模型正確與否;(即b→0)
3、預測或控制;
matlab實現(xiàn)
使用命令regress實現(xiàn)一元線性回歸模型的計算
b = regress (Y, X) ??
或
[b, bint, r, rint, stats] = regress(Y, X, alpha)?
殘差及其置信區(qū)間可以用rcoplot(r,rint)畫圖
例如:為了研究鋼材消費量與國民收入之間的關系,在統(tǒng)計年鑒上查得一組歷史數(shù)據(jù)。
年??份 |
1964 |
1965 |
1966 |
…… |
1978 |
1979 |
1980 |
消費(噸) |
698 |
872 |
988 |
…… |
1446 |
2736 |
2825 |
收入(億) |
1097 |
1284 |
1502 |
…… |
2948 |
3155 |
3372 |
試分析預測若1981年到1985年我國國民收入以4.5%的速度遞增,鋼材消費量將達到什么樣的水平?
x=[1097 1284 1502 1394 1303 1555 1917 2051 2111 2286 2311 2003 2435 2625 2948 3155 3372];
y=[698 872 988 807 738 1025 1316 1539 1561 1765 1762 1960 1902 2013 2446 2736 2825];
plot(x,y,'*')
?
x=[1097 1284 1502 1394 1303 1555 1917 2051 2111
2286 2311 2003 2435 2625 2948 3155 3372];
y=[698 872 988 807 738 1025 1316 1539 1561
1765 1762 1960 1902 2013 2446 2736 2825];
X=[ones(size(x')),x'],pause
[c,cint,r,rint,stats]=regress(y',X,0.05),pause
c = -460.5282 (參數(shù)a) 0.9840 (參數(shù)b)
cint = -691.8478 -229.2085 ( a的置信區(qū)間 )
0.8779 1.0900 ( b的置信區(qū)間 )
r = [ 79.1248 69.1244 -29.3788 -104.1112 -83.5709 -44.5286
-109.7219 -18.5724 -55.6100 -23.8029 -51.4019 449.6576
-33.4128 -109.3651 5.8160 92.1364 -32.3827]’(殘差向量)
rint=(略)(參見殘差分析圖)
stats = 0.9631 391.2713 0.0000
rcoplot(r,rint)
?預測:
x1(1)=3372;
for i=1:5
x1(i+1)=1.045*x1(i);
y1(i+1)=-460.5282+0.9840*x1(i+1);
end
x1 = 3372.0 3523.7 3682.3 3848.0 4021.2 4202.1
y1 = 3006.8 3162.9 3325.9 3496.3 3674.4
多元線性回歸模型
多元線性回歸模型形式
一般形式
解析形式
矩陣形式
多元線性回歸模型的假設
- 解釋變量?Xi?是確定性變量,不是隨機變量;解釋變量之間互不相關,即無多重共線性。
- 隨機誤差項具有0均值和同方差
- 隨機誤差項不存在序列相關關系
- 隨機誤差項與解釋變量之間不相關
- 隨機誤差項服從0均值、同方差的正態(tài)分布
matlab實現(xiàn)
1、確定回歸系數(shù)的點估計值
2、求回歸系數(shù)的點估計和區(qū)間估計、并檢驗回歸模型
?3、畫出殘差及其置信區(qū)間
rcoplot(r, rint)
例如:某建材公司對某年20個地區(qū)的建材銷售量Y(千方)、推銷開支、實際帳目數(shù)、同類商品競爭數(shù)和地區(qū)銷售潛力分別進行了統(tǒng)計。試分析推銷開支、實際帳目數(shù)、同類商品競爭數(shù)和地區(qū)銷售潛力對建材銷售量的影響作用。試建立回歸模型,且分析哪些是主要的影響因素。
設:推銷開支——x1?實際帳目數(shù)——x2同類商品競爭數(shù)——x3地區(qū)銷售潛力——x4
?
x1=[5.5 2.5 8 3 3 2.9 8 9 4 6.5 5.5 5 6 5 3.5 8 6 4 7.5 7]';
x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]';
x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]';
x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
y=[79.3 200.1 163.1 200.1 146.0 177.7 30.9 291.9 160 339.4 159.6 86.3 237.5 107.2 155 201.4 100.2 135.8 223.3 195]';
X=[ones(size(x1)),x1,x2,x3,x4];
[b,bint,r,rint,stats]=regress(y,X)
Q=r'*r
sigma=Q/18
輸出結(jié)果是:
b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501
β0 β1 β2 β3 β4
bint = 103.1071 280.7245……(系數(shù)的置信區(qū)間)
r =[ -6.3045 -4.2215 ……8.4422 23.4625 3.3938]
rint=(略)
stats = 0.9034(R2) 35.0509(F) 0.0000(p)
Q = r’*r
σ^2= Q/(n-2) = 537.2092 (近似)
多項式回歸模型
一元多項式回歸
1、回歸
(1)確定多項式系數(shù)的命令:[p,S]=polyfit(x,y,m)
?(2)一元多項式回歸命令:polytool(x,y,m)
2、預測和預測誤差估計
(1)Y=polyval(p,x)求polyfit所得的回歸多項式在x處 ?的預測值Y;
(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項式在x處的預測值Y及預測值的顯著性為DELTA
alpha缺省時為0.5
方法一
直接作二次多項式回歸:
t=1/30:1/30:14/30;
s=[11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90
85.44 99.08 113.77 129.54 146.48];
[p,S]=polyfit(t,s,2)
得回歸模型為 :
?方法二
化為多元線性回歸:
t=1/30:1/30:14/30;
s=[11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90
85.44 99.08 113.77 129.54 146.48];
T=[ones(14,1) t' (t.^2)'];
[b,bint,r,rint,stats]=regress(s',T);
b,stats
得回歸模型為 :
預測及作圖
?
Y=polyconf(p,t,S)
plot(t,s,'k+',t,Y,'r')
多元二項式回歸?
例:設某商品的需求量與消費者的平均收入、商品價格的統(tǒng)計數(shù) ? ? ? ? ?據(jù)如下,建立回歸模型,預測平均收入為1000、價格為6時的商品需求量.
方法一
?直接用多元二項式回歸:
x1=[1000 600 1200 500 300 400 1300 1100 1300 300];
x2=[5 7 6 6 8 7 5 4 3 9];
y=[100 75 80 70 50 65 90 100 110 60]';
x=[x1' x2'];
rstool(x,y,'purequadratic')
在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。
則畫面左邊的“Predicted Y”下方的數(shù)據(jù)變?yōu)?8.47981,即預測出平均收入為1000、價格為6時的商品需求量為88.4791.
在畫面左下方的下拉式菜單中選”all”, 則beta、rmse和residuals都傳送到Matlab工作區(qū)中.
在Matlab工作區(qū)中輸入命令: beta, rmse
?
?方法二
?
?結(jié)果為:
b =
110.5313
0.1464
-26.5709
-0.0001
1.8475
stats =
0.9702 40.6656 0.0005
非線性回歸模型
?(2)非線性回歸命令:nlintool(x,y,’model’, beta0,alpha)
[Y,DELTA]=nlpredci(’model’, x,beta,r,J) 求nlinfit 或nlintool所得的回歸函數(shù)在x處的預測值Y及預測值的顯著性為1-alpha的置信區(qū)間Y±DELTA.
逐步回歸
逐步回歸的命令是:
運行stepwise命令時產(chǎn)生三個圖形窗口:Stepwise ?Plot,Stepwise ?Table,Stepwise ?History.
在Stepwise ?Plot窗口,顯示出各項的回歸系數(shù)及其置信區(qū)間.
Stepwise Table 窗口中列出了一個統(tǒng)計表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計量剩余標準差(RMSE)、相關系數(shù)(R-square)、F值、與F對應的概率P.
例:水泥凝固時放出的熱量y與水泥中4種化學成分x1、x2、x3、 x4 有關,今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一線性模型.
?1、數(shù)據(jù)輸入:
x1=[7 1 11 11 7 11 3 1 2 21 1 11 10]';
x2=[26 29 56 31 52 55 71 31 54 47 40 66 68]';
x3=[6 15 8 8 6 9 17 22 18 4 23 9 8]';
x4=[60 52 20 47 33 22 6 44 22 26 34 12 12]';
y=[78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8
113.3 109.4]';
x=[x1 x2 x3 x4];
2、逐步回歸:
(1)先在初始模型中取全部自變量: ? ? ? ? ? ? ? ? ? ?
stepwise(x,y) 得圖Stepwise Plot 和表Stepwise Table
圖Stepwise Plot中四條直線都是虛線,說明模型的顯著性不好
從表Stepwise Table中看出變量x3和x4的顯著性最差.
(2)在圖Stepwise Plot中點擊直線3和直線4,移去變量x3和x4
移去變量x3和x4后模型具有顯著性.
雖然剩余標準差(RMSE)沒有太大的變化,但是統(tǒng)計量F的 值明顯增大,因此新的回歸模型更好.
常見模型實例
線性回歸實例——牙膏的銷售量
問題提出
建立牙膏銷售量與價格、廣告投入之間的模型;預測在不同價格和廣告費用下的牙膏銷售量。
收集了30個銷售周期本公司牙膏銷售量、價格、廣告費用,及同期其他廠家同類牙膏的平均售價。
基本模型
模型求解
結(jié)果分析
銷售量預測
模型改進
兩模型銷售量預測比較
兩模型與x1,x2關系的比較
交互作用影響的討論?
完全二次多項式模型?
?MATLAB中有命令rstool直接求解
?從輸出 Export 可得
鼠標移動十字線(或下方窗口輸入)可改變x1, x2, 左邊窗口顯示預測值 及預測區(qū)間
x1=[-0.0500 0.2500 0.6000 0 0.2500 0.2000 0.1500 0.0500 -0.1500 0.1500 0.0200 0.0100 0.4000 0.4500 0.3500 0.3000 0.5000 0.5000 0.4000 -0.0500 -0.0500 -0.1000 0.2000 0.1000 0.5000 0.6000 -0.0500 0 0.0500 0.5500];
x2=[5.5000 6.7500 7.2500 5.5000 7.0000 6.5000 6.7500 5.2500 5.2500 6.0000 6.5000 6.2500 7.0000 6.9000 6.8000 6.8000 7.1000 7.0000 6.8000 6.5000 6.2500 6.0000 6.5000 7.0000 6.8000 6.8000 6.5000 5.7500 5.8000 6.8000];
y=[7.3800 8.5100 9.5200 7.5000 9.3300 8.2800 8.7500 7.8700 7.1000 8.0000 7.8900 8.1500 9.1000 8.8600 8.9000 8.8700 9.2600 9.0000 8.7500 7.9500 7.6500 7.2700 8.0000 8.5000 8.7500 9.2100 8.2700 7.6700 7.9300 9.2600];
x=[x1',x2'];
rstool(x,y,'quadratic')
?在Matlab工作區(qū)中輸入命令: beta 得
beta =
31.1478
16.7348
-8.3212
-2.4124
1.5219
0.7338
非線性回歸實例——酶促反應
問題提出
研究酶促反應(酶催化反應)中嘌呤霉素對反應速度與底物(反應物)濃度之間關系的影響
建立數(shù)學模型,反映該酶促反應的速度與底物濃度以及經(jīng)嘌呤霉素處理與否之間的關系
方案
設計了兩個實驗 :酶經(jīng)過嘌呤霉素處理;酶未經(jīng)嘌呤霉素處理。實驗數(shù)據(jù)見下表:?
分析:酶促反應的基本性質(zhì)
底物濃度較小時,反應速度大致與濃度成正比;
底物濃度很大、漸進飽和時,反應速度趨于固定值。
基本模型:Michaelis-Menten模型
?解決方案一:線性化模型
?線性化模型結(jié)果分析
解決方案二:非線性化模型
x=[0.02 0.02 0.06 0.06 0.11 0.11 0.22 0.22 0.56 0.56 1.10 1.10];
y=[76 47 97 107 123 139 159 152 191 201 207 200];
beta0=[195.8027 0.04841];
[beta,R,J]=nlinfit(x,y,'hx',beta0);
betaci=nlparci(beta,R,J);
beta,betaci
yy=beta(1)*x./(beta(2)+x);
plot(x,y,'o',x,yy,'+'),pause
nlintool(x,y,'hx',beta)
非線性模型結(jié)果分析
混合反應模型
在同一模型中考慮嘌呤霉素處理的影響,用未經(jīng)嘌呤霉素處理的模型附加增量的方法。
混合模型求解
簡化的混合模型?
一般混合模型與簡化混合模型預測比較
模型評注
軟件開發(fā)人員的薪金
問題提出
建立模型研究薪金與資歷、管理責任、教育程度的關系
分析人事策略的合理性,作為新聘用人員薪金的參考
46名軟件開發(fā)人員的檔案資料
資歷~ 從事專業(yè)工作的年數(shù);
管理~ 1=管理人員,0=非管理人員;
教育~ 1=中學,2=大學,3=更高程度
模型假設
假設: y~ 薪金,x1 ~資歷(年) ? ? ? ? ? ? ? x2 = 1~ 管理人員,0~ 非管理人員
假設: 資歷每加一年薪金的增長是常數(shù); ? ? ? ? ? ? ? 管理、教育、資歷之間無交互作用
模型:線性回歸
模型求解?
?
Matlab程序: xinjindata.m ?xinjin.m
xinjindata.m:
序號、工資y、資歷x1、管理x2、學歷、x3、x4、xx
xinjin.m :
M=dlmread('xinjindata.m');
x1=M(:,3);x2=M(:,4);x3=M(:,6);x4=M(:,7);y=M(:,2);
x=[ones(size(x1)) x1 x2 x3 x4 ]
[b,bi,r,ri,s]=regress(y,x)
結(jié)果
結(jié)果分析:殘差分析方法
?
?
?殘差大概分成3個水平,6種管理—教育組合混在一起,未正確反映?
?
?
?殘差全為正,或全為負,管理—教育組合處理不當
模型改進
模型應用?
模型評注?
- 對定性因素(如管理、教育),可以引入0-1變量處理,0-1變量的個數(shù)應比定性因素的水平少1
- 殘差分析方法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項常常能夠改善模型
- 剔除異常數(shù)據(jù),有助于得到更好的結(jié)果
- 可以直接對6種管理—教育組合引入5個0-1變量
投資額與國民生產(chǎn)總值和物價指數(shù)
問題提出
建立投資額模型,研究某地區(qū)實際投資額與國民生產(chǎn)總值 ( GNP ) 及物價指數(shù) ( PI ) 的關系
根據(jù)對未來GNP及PI的估計,預測未來投資額?
模型分析
許多經(jīng)濟數(shù)據(jù)在時間上有一定的滯后性
以時間為序的數(shù)據(jù),稱為時間序列?
時間序列中同一變量的順序觀測值之間存在自相關
若采用普通回歸模型直接處理,將會出現(xiàn)不良后果
需要診斷并消除數(shù)據(jù)的自相關性,建立新的模型
基本回歸模型
?結(jié)果與分析
自相關性的定性診斷:殘差診斷法
自回歸性的定量診斷:D-W檢驗?
D-W統(tǒng)計量與D-W檢驗
廣義差分變換
投資額新模型的建立??
?
新模型的自相關性檢驗?
模型結(jié)果比較
投資額預測?
對未來投資額yt 作預測,需先估計出未來的國民生產(chǎn)總值x1t 和物價指數(shù) x2t
文章來源:http://www.zghlxwxcb.cn/news/detail-487576.html
文章到這里就介紹了,有沒有收獲滿滿,那就快鞏固吧,當然看到這里說明你是好學的,畢竟文章這么長,覺得不錯的話來個三連~~~~文章來源地址http://www.zghlxwxcb.cn/news/detail-487576.html
到了這里,關于數(shù)學建模之統(tǒng)計回歸模型詳解的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!