????????時間序列也稱動態(tài)序列,是指將某種現(xiàn)象的指標(biāo)數(shù)值按照時間順序排列而成的數(shù)值序列。時間序列分析大致可分成三大部分,分別是描述過去、分析規(guī)律和預(yù)測未來,本講將主要介紹時間序列分析中常用的三種模型:季節(jié)分解、指數(shù)平滑方法和ARIMA模型,并將結(jié)合Spss軟件對時間序列數(shù)據(jù)進行建模。
注:本文源于數(shù)學(xué)建模學(xué)習(xí)交流相關(guān)公眾號觀看學(xué)習(xí)視頻后所作
時間序列
時間序列數(shù)據(jù):
對同一對象在不同時間連續(xù)觀察所取得的數(shù)據(jù)。
例如:
(1)從出生到現(xiàn)在,你的體重的數(shù)據(jù)(每年生日稱一次)。
(2)中國歷年來GDP的數(shù)據(jù)。
(3)在某地方每隔一小時測得的溫度數(shù)據(jù)。
時間序列概念
????????時間序列也稱動態(tài)序列,是指將某種現(xiàn)象的指標(biāo)數(shù)值按照時間順序排列而成的數(shù)值序列。
時間序列由兩個組成要素構(gòu)成:
(1)第一個要素是時間要素:?年、季度、月、周、日、小時、分鐘、秒
(2)第二個要素是數(shù)值要素。
時間序列根據(jù)時間和數(shù)值性質(zhì)的不同,可以分為時期時間序列和時點時間序列。
時期序列中,數(shù)值要素反映現(xiàn)象在一定時期內(nèi)發(fā)展的結(jié)果;
時點序列中,數(shù)值要素反映現(xiàn)象在一定時點上的瞬間水平。
區(qū)分時期和時點時間序列
例如:
(1)從出生到現(xiàn)在,你的體重的數(shù)據(jù)(每年生日稱一次)。
(2)中國歷年來GDP的數(shù)據(jù)。
(3)在某地方每隔一小時測得的溫度數(shù)據(jù)。
????????????????(1)和(3)是時點時間序列;(2)是時期時間序列
時期序列可加,時點序列不可加。
????????時期序列中的觀測值反映現(xiàn)象在一段時期內(nèi)發(fā)展過程的總量,不同時期的觀測值可以相加,相加結(jié)果表明現(xiàn)象在更長一段時間內(nèi)的活動總量; 而時點序列中的觀測值反映現(xiàn)象在某一瞬間上所達(dá)到的水平,不同時期的觀測值不能相加,相加結(jié)果沒有實際意義。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (灰色預(yù)測模型里面有一個累加的過程)
時間序列分解
????????因為時間序列是某個指標(biāo)數(shù)值長期變化的數(shù)值表現(xiàn),所以時間序列數(shù)值變化背后必然蘊含著數(shù)值變換的規(guī)律性,這些規(guī)律性就是時間序列分析的切入點。
一般情況下,時間序列的數(shù)值變化規(guī)律有以下四種:
一個時間序列往往是以上四類變化形式的疊加。
長期趨勢:T
????????長期趨勢 (Secular trend,T) 指的是統(tǒng)計指標(biāo)在相當(dāng)長的一段時間內(nèi),受到長期趨勢影響因素的影響,表現(xiàn)出持續(xù)上升或持續(xù)下降的趨勢,通常用字母 T 表示。例如,隨著國家經(jīng)濟的發(fā)展,人均收入將逐漸提升;隨著醫(yī)學(xué)水平的提高,新生兒死亡率在不斷下降。
季節(jié)趨勢:S
????????季節(jié)趨勢(Seasonal Variation,S)是指由于季節(jié)的轉(zhuǎn)變使得指標(biāo)數(shù)值發(fā)生周期性變動。這里的季節(jié)是廣義的,一般以月、季、周為時間單位,不能以年作單位。例如雪糕和棉衣的銷量都會隨著季節(jié)氣溫的變化而周期變化。每年的長假(五一、十一、春節(jié))都會引起出行人數(shù)的大量增加。
百度指數(shù) (baidu.com)
循環(huán)變動:C
????????循環(huán)變動(Cyclical Variation,C)與季節(jié)變動的周期不同,循環(huán)變動通常以若干年為周期,在曲線圖上表現(xiàn)為波浪式的周期變動。這種周期變動的特征表現(xiàn)為增加和減少交替出現(xiàn),但是并不具嚴(yán)格規(guī)則的周期性連續(xù)變動。最典型的周期案例就是市場經(jīng)濟的商業(yè)周期和的整個國家的經(jīng)濟周期。
不規(guī)則變動:I
????????不規(guī)則變動(Irregular Variation,I)是由某些隨機因素導(dǎo)致的數(shù)值變化,這些因素的作用是不可預(yù)知和沒有規(guī)律性的,可以視為由于眾多偶然因素對時間序列造成的影響(在回歸中又被稱為擾動項)。
????????以上四種變動就是時間序列數(shù)值變化的分解結(jié)果。有時這些變動會同時出現(xiàn)在一個時間序列里面,有時也可能只出現(xiàn)一種或幾種,這是由引起各種變動的影響因素決定的。正是由于變動組合的不確定性,時間序列的數(shù)值變化才那么千變?nèi)f化。
四種變動與指標(biāo)數(shù)值最終變動的關(guān)系可能是疊加關(guān)系,也可能是乘積關(guān)系。
疊加模型和乘積模型
(1)如果四種變動之間是相互獨立的關(guān)系,那么疊加模型可以表示為:
(2)如果四種變動之間存在相互影響關(guān)系,那么應(yīng)該使用乘積模型:
注意:?
(1)數(shù)據(jù)具有年內(nèi)的周期性時才能使用時間序列分解,例如數(shù)據(jù)是月份數(shù)據(jù)(周期為12)、季度數(shù)據(jù)(周期為4) ,如果是年份數(shù)據(jù)則不行。
(2)在具體的時間序列圖上,如果隨著時間的推移,序列的季節(jié)波動變得越來越大,則反映各種變動之間的關(guān)系發(fā)生變化,建議使用乘積模型;反之,如果時間序列圖的波動保持恒定,則可以直接使用疊加模型;當(dāng)然,如果不存在季節(jié)波動,則兩種分解均可以。
小例子
隨著時間變化,搜索美賽數(shù)據(jù)的季節(jié)波動越來越大,那么使用乘積模型會更精確。
隨著時間變化,銷售數(shù)據(jù)的季節(jié)波動越來越大,那么使用乘積模型會更精確。
Spss操作
Spss處理時間序列中的缺失值
(1) 缺失值發(fā)生在時間序列的開頭或者尾部,可采用直接刪除的方法。
(2)缺失值發(fā)生在序列的中間位置,則不能刪除(刪除后原有的時間序列會錯位),可采用替換缺失值的方法。
替換缺失值的五種方法
Spss定義時間變量
時間序列圖(時序圖)
季節(jié)性分解
結(jié)果解讀
畫出分解后的時序圖
?時間序列分析
建立時間序列分析模型
指數(shù)平滑模型(Spss官方文檔)
?
Simlpe模型
關(guān)于平滑系數(shù)??的選取原則:
(1)如果時間序列具有不規(guī)則的起伏變化,但長期趨勢接近一個穩(wěn)定常數(shù),α值一般較小(取0.05‐0.02之間)
(2)如果時間序列具有迅速明顯的變化傾向,則α應(yīng)該取較大值(取0.3‐0.5)
(3)如果時間序列變化緩慢,亦應(yīng)選較小的值(一般在0.1‐0.4之間)實際上,Spss的專家建模如果選擇了Simple模型用來估計,那么軟件會幫我們自動選取一個適合的平滑系數(shù)使得預(yù)測誤差最小。
簡單指數(shù)平滑法預(yù)測
線性趨勢模型(linear trend)
參考:7.2 Trend methods | Forecasting: Principles?and?Practice (2nd?ed) (otexts.com)
阻尼趨勢模型(Damped trend)
霍特趨勢和阻尼趨勢預(yù)測
7.2 Trend methods | Forecasting: Principles?and?Practice (2nd?ed) (otexts.com)
簡單季節(jié)性(Simple seasonal)
7.4 A taxonomy of exponential smoothing methods | Forecasting: Principles?and?Practice (2nd?ed) (otexts.com)
溫特加法模型(Winters' additive)
Forecasting: Principles?and?Practice (otexts.com)
溫特乘法模型(Winters' multiplicative)
Forecasting: Principles?and?Practice (otexts.com)
溫特加法和乘法預(yù)測
Forecasting: Principles?and?Practice (otexts.com)
一元時間序列分析的模型
????????下面的這些概念只介紹一個大概,要完全弄懂還需要大家課后自己努力。如果實在學(xué)習(xí)這小部分有困難,大家可以選擇放棄理論部分,不用細(xì)究每一個細(xì)節(jié)和概念,我們的重心可以放在運用上。
(1)平穩(wěn)時間序列和白噪聲序列
(2)差分方程和滯后算子
(3)AR模型
(4)MA模型
(5)ARMA模型
(6)ACF和PACF
(7)ARMA模型的估計
(8)AIC和BIC準(zhǔn)則
(9)ARIMA模型
(10)SARIMA模型
時間序列的平穩(wěn)性(stationary series)
一些時間序列的圖形
差分方程
????????將某個時間序列變量表示為該變量的滯后項、時間和其他變量的函數(shù),這樣的一個函數(shù)方程被稱為差分方程。
差分方程的齊次部分:只包含該變量自身和它的滯后項的式子。
差分方程的特征方程
差分方程的齊次部分:只包含該變量自身和它的滯后項的式子。
這p個解的模長(實根取絕對值,虛根取模)的大小決定了形為ARMA(p,q)模型的{}是否平穩(wěn)
滯后算子
MA模型、AR模型和ARMA(p,q)模型?
AR(p)模型(auto regressive)
AR(p)模型平穩(wěn)的條件
小例子
?
MA(q)模型(moving average)
MA模型和AR模型的關(guān)系
MA(q)模型的平穩(wěn)性
只要q是常數(shù),那么MA(q)模型一定是平穩(wěn)的。
?
ARMA(p,q)模型
????????自回歸移動平均模型(Autoregressive Moving Average,ARMA),就是設(shè)法將自回歸過程AR和移動平均過程MA結(jié)合起來,共同模擬產(chǎn)生既有時間序列樣本數(shù)據(jù)的那個隨機過程的模型。
ARMA(p,q)模型的平穩(wěn)性
ACF自相關(guān)系數(shù)
PACF偏自相關(guān)函數(shù)
AR(1)模型(系數(shù)符號相反)
Walter Enders《Applied Econometric Time Series Fourth Edition》
MA(1)和AR(2)模型
ARMA(1,1)模型和總結(jié)表格
ARMA模型的識別
????????圖1和圖2上均有兩條藍(lán)色的線,其表示假設(shè)檢驗對應(yīng)的上下臨界值,如果自相關(guān)系數(shù)或偏自相關(guān)系數(shù)位于這兩條線內(nèi),則認(rèn)為它們與0沒有顯著的差異。
正確識別ARMA模型的階數(shù)太難了
ARMA模型的估計
ARMA模型的極大似然估計:第四章 極大似然估計 - 百度文庫 (baidu.com)
模型選擇:AIC和BIC準(zhǔn)則(選小原則)
????????過擬合問題:加入的參數(shù)個數(shù)越多,模型擬合的效果越好,但這卻是以提高模型復(fù)雜度為代價的。因此,模型選擇要在模型復(fù)雜度與模型對數(shù)據(jù)的解釋能力之間尋求最佳平衡。
AIC和BIC是選小原則,我們要選擇使得AIC或BIC最小的模型。
(BIC對于模型的復(fù)雜程度的懲罰系數(shù)更大,因此BIC往往比AIC選擇的模型更簡潔)
檢驗?zāi)P褪欠褡R別完全
????????估計完成時間序列模型后,我們需要對殘差進行白噪聲檢驗,如果殘差是白噪聲,則說明我們選取的模型能完全識別出時間序列數(shù)據(jù)的規(guī)律,即模型可接受;如果殘差不是白噪聲,則說明還有部分信息沒有被模型所識別,我們需要修正模型來識別這一部分的信息。
?
ARIMA(p,d,q)模型
ARIMA(1,1,1)時間序列圖
x <‐ arima.sim(list(order = c(1,1,1), ar = 0.6, ma=‐0.5), n = 100)
ARIMA(1,2,1)時間序列圖
x <‐ arima.sim(list(order = c(1,2,1), ar = 0.6, ma=‐0.5), n = 100)
SARIMA(Seasonal ARIMA)模型
????????到目前為止,我們只關(guān)注非季節(jié)性數(shù)據(jù)和非季節(jié)性ARIMA模型。然而,ARIMA模型也能夠?qū)V泛的季節(jié)數(shù)據(jù)進行建模。
????????季節(jié)性ARIMA模型是通過在ARIMA模型中包含額外的季節(jié)性項而生成的,其形式如下:
Spss時間序列建模的思路
下面的步驟是自己在思考建模的過程,不是寫在論文中的:
(1)處理數(shù)據(jù)的缺失值問題、生成時間變量并畫出時間序列圖;
(2)數(shù)據(jù)是否為季度數(shù)據(jù)或者月份數(shù)據(jù)(至少有兩個完整的周期,即兩年),如果是的話則要觀察圖形中是否存在季節(jié)性波動。
(3)根據(jù)時間序列圖大致判斷數(shù)據(jù)是否為平穩(wěn)序列(數(shù)據(jù)圍繞著均值上下波動,無趨勢和季節(jié)性)
(4)打開Spss,分析‐‐時間序列預(yù)測—創(chuàng)建傳統(tǒng)模型(高版本的Spss可能才有這個功能),看看Spss專家建模器得出的最優(yōu)的模型類型。
(5)如果最后的結(jié)果是ARIMA(p,0,q)模型,那么我們就可以畫出時間序列的樣本ACF和PACF圖形進行分析;如果得到的是ARIMA(p,1,q)模型,我們可以先對數(shù)據(jù)進行1階差分后再用ACF和PACF圖形分析;如果得到的結(jié)果與季節(jié)性相關(guān),那么我們可以考慮使用時間序列分解。
例題1:銷量數(shù)據(jù)預(yù)測
前期準(zhǔn)備工作
下面的步驟是自己在思考建模的過程,不是寫在論文中的:
(1)數(shù)據(jù)為季度數(shù)據(jù)(有四個周期),從圖中看出也有季節(jié)性波動,即第二季度的銷量較高,第四季度較低;
(2)根據(jù)時間序列圖可知數(shù)據(jù)不平穩(wěn),有向上的趨勢;
(3)Spss的專家建模給出的最合適的模型是溫特加法模型;
(4)溫特加法模型意味著原時間序列數(shù)據(jù)含有線性趨勢和穩(wěn)定的季節(jié)成分,我們可以使用加法時間序列分解;
(5)利用Spss我們可以對未來兩年的銷售數(shù)據(jù)進行預(yù)測。
Spss時間序列建模器
默認(rèn)在所有的指數(shù)平滑模型和ARIMA模型中選擇合適的模型。
自動檢測異常值的方法
操作步驟
注:
(1)預(yù)測值和擬合值是不相同的,預(yù)測值是將樣本外年份的數(shù)據(jù)帶入模型計算得到的,而擬合值是將樣本的年份重新帶入模型計算得到的。
(2)這里保留殘差的ACF和PACF圖形可以幫助我們判斷殘差是否為白噪聲,即該時間序列是否能被模型識別完全。
常用的評價指標(biāo)
參數(shù)估計值表格
白噪聲進行殘差檢驗
預(yù)測的結(jié)果和效果圖
例題2:人口數(shù)據(jù)預(yù)測
預(yù)測結(jié)果
殘差的白噪聲檢驗
預(yù)測效果圖形
?
例題3:上證指數(shù)預(yù)測
直接進行專家建模的結(jié)果
剔除異常值后重新建模
預(yù)測效果
例題4:GDP增速預(yù)測
用所有數(shù)據(jù)進行預(yù)測(剔除異常值)
出錯的原因
課后作業(yè)
文章來源:http://www.zghlxwxcb.cn/news/detail-803751.html
結(jié)語
沒有結(jié)語,挺多的今天,好好看好好學(xué)ヾ( ̄▽ ̄)Bye~Bye~文章來源地址http://www.zghlxwxcb.cn/news/detail-803751.html
到了這里,關(guān)于數(shù)學(xué)建模day15-時間序列分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!