時(shí)間序列分析概述和數(shù)據(jù)預(yù)處理
時(shí)間序列的概念:也稱為動態(tài)序列,是指將某種現(xiàn)象的指標(biāo)值按照時(shí)間順序排列而成的數(shù)值序列。
時(shí)間序列的組成要素:時(shí)間要素、數(shù)值要素。
時(shí)間序列的分類:
- 時(shí)期時(shí)間序列:數(shù)值要素反應(yīng)現(xiàn)象在一定時(shí)期內(nèi)的發(fā)展的結(jié)果;
- 時(shí)點(diǎn)時(shí)間序列:數(shù)值要素反映現(xiàn)象在一定時(shí)間點(diǎn)上的瞬間水平。
備注:時(shí)期序列可以累積相加,時(shí)點(diǎn)序列不能相加。因此后面的灰色預(yù)測模型只能用于時(shí)期時(shí)間序列。
時(shí)間序列分析的內(nèi)容:時(shí)間序列分析可以分為描述過去、分析規(guī)律和預(yù)測未來三個(gè)部分。
數(shù)據(jù)預(yù)處理(去除缺失值):缺失值處理是時(shí)間序列分析模型的基本預(yù)處理。
- 缺失值處理方法:缺失值發(fā)生在時(shí)間序列的頭部或尾部,則采用直接刪除的方法;缺失值發(fā)生在序列的中間位置,則不能刪除,可以采用缺失值替換的方法。
- SPSS提供五種替換缺失值的方法:序列平均值;臨近點(diǎn)的平均值;臨近點(diǎn)的中位數(shù);線性插值;臨近點(diǎn)的線性趨勢。
- SPSS進(jìn)行數(shù)據(jù)缺失值預(yù)處理:
1.打開SPSS軟件并導(dǎo)入數(shù)據(jù),依次點(diǎn)擊:轉(zhuǎn)換→替換缺失值
2.選擇需要替換缺失值的變量,指定新的變量的名稱和替換缺失值的方法。
數(shù)據(jù)預(yù)處理(定義時(shí)間變量):需要指定哪一個(gè)屬性是時(shí)間變量避免出錯(cuò)。
- 打開導(dǎo)入了數(shù)據(jù)的SPSS軟件,依次點(diǎn)擊:
數(shù)據(jù)→定義日期和時(shí)間
- 選擇個(gè)案類型并指定起始時(shí)間。
SPSS繪制時(shí)間序列圖:
- 依次點(diǎn)擊:
分析→時(shí)間序列預(yù)測→序列圖
2.選擇時(shí)間變量和因變量。
繪制完成的圖片可以雙擊進(jìn)去進(jìn)行相關(guān)的優(yōu)化。
時(shí)間序列分解模型
時(shí)間序列分解的前提:數(shù)據(jù)具有周期性才能使用時(shí)間序列分解,也就是說年份數(shù)據(jù)不能使用時(shí)間序列分解模型。
時(shí)間序列的分解元素:
- 長期變動趨勢(T):統(tǒng)計(jì)指標(biāo)在相當(dāng)長的一段時(shí)間內(nèi),受到長期趨勢影響因素的影響,表現(xiàn)出持續(xù)上升或持續(xù)下降的趨勢。
- 季節(jié)趨勢(S):由于季節(jié)的轉(zhuǎn)變使得指標(biāo)數(shù)值發(fā)生周期性變動。這里的季節(jié)是廣義的,一般以月、季、周為時(shí)間單位,不能以年作為單位。
- 循環(huán)變動(C):與季節(jié)變動的周期不同,往往以若干年為一個(gè)周期,在曲線圖上表現(xiàn)為波浪式的周期變動。
- 不規(guī)則變動(I):由于某些隨機(jī)因素導(dǎo)致的數(shù)值變化,這些因素的作用是不可預(yù)知且沒有規(guī)律性的,可以視為由于眾多偶然因素對時(shí)間序列造成的影響,也就是回歸中的擾動項(xiàng)。
以上四種變動就是時(shí)間序列數(shù)值變化的分解結(jié)果。有時(shí)這些變動會同時(shí)出現(xiàn)在一個(gè)時(shí)間序列中,但是有時(shí)候也可能只出現(xiàn)一種或幾種。
疊加模型和乘積模型:
- 使用情況:如果四種變動是相互獨(dú)立的關(guān)系,就應(yīng)該使用疊加模型;如果存在相互影響,則應(yīng)該使用乘積模型。
- 推薦使用:如果在時(shí)間序列圖上,隨著事件的推移,序列的季節(jié)波動越來越大,則建議使用乘積模型;如果季節(jié)波動保持穩(wěn)定,則建議使用疊加模型。當(dāng)不存在季節(jié)波動時(shí)則兩種分解都可以。
SPSS進(jìn)行時(shí)間序列分解:
- 依次點(diǎn)擊:
分析→時(shí)間序列預(yù)測→季節(jié)性分解
2.選擇需要進(jìn)行時(shí)間序列分解的變量,指定模型是疊加還是乘積。如果周期長度為奇數(shù)則選擇所有點(diǎn)相等,為偶數(shù)則選擇端點(diǎn)按0.5加權(quán)。
SPSS時(shí)間序列分析結(jié)果:
結(jié)果解釋:
- 疊加模型:每一個(gè)季節(jié)的季節(jié)因子表示該季節(jié)的指標(biāo)超過全年平均指標(biāo)的水準(zhǔn)。如果大于零則表示高于全年平均指標(biāo),小于零則表示低于全年平均指標(biāo)。
- 乘法模型:每一個(gè)季節(jié)的季節(jié)因子表示該季節(jié)的指標(biāo)為全年平均指標(biāo)的多少倍。如果大于一則表示高于全年平均指標(biāo),小于一則表示低于全年平均指標(biāo)。
如何使用結(jié)果進(jìn)行預(yù)測:將預(yù)測結(jié)果變量中的季節(jié)性調(diào)整后序列加上季節(jié)因子,得到一個(gè)新的變量序列,對該序列進(jìn)行擬合即可使用擬合函數(shù)進(jìn)行預(yù)測。
SPSS專家建模器:從指數(shù)平滑模型和ARIMA模型中找出最合適的擬合模型。
指數(shù)平滑模型
簡單指數(shù)平滑模型:
- 適用情況:適用于不含趨勢和季節(jié)成分的時(shí)間序列。
- 預(yù)測原理:每一個(gè)平滑后的數(shù)據(jù)都是由過去的數(shù)據(jù)加權(quán)求和后所得,越接近當(dāng)期的數(shù)據(jù)權(quán)重越大。
- 模型不足:簡單指數(shù)平滑模型只能進(jìn)行一期的預(yù)測。
霍特線性趨勢模型:
- 適用條件:線性趨勢,不含有季節(jié)成分。
- 預(yù)測原理:有兩個(gè)平滑方程(水平平滑方程和趨勢平滑方程)和一個(gè)預(yù)測方程。
布朗線性趨勢模型:霍特線性趨勢模型的一個(gè)特例,認(rèn)為模型中的水平平滑參數(shù)和趨勢平滑參數(shù)相等。
阻尼趨勢模型:
- 適用情況:線性趨勢逐漸減弱且不含有季節(jié)成分。
- 模型原理:在霍特線性趨勢模型的基礎(chǔ)上進(jìn)行延伸?;籼鼐€性趨勢模型對長期預(yù)測往往過高,阻尼線性趨勢模型緩解了較高的線性趨勢。
簡單季節(jié)性模型:適用于含有穩(wěn)定的季節(jié)成分,不含有趨勢。
溫特加法模型:適用于含有線性趨勢和穩(wěn)定的季節(jié)成分。
溫特乘法模型:適用于含有線性趨勢和不穩(wěn)定的季節(jié)成分。
ARIMA模型
平穩(wěn)時(shí)間序列:
- 平穩(wěn)時(shí)間序列的優(yōu)點(diǎn):平穩(wěn)的時(shí)間序列是最容易處理的時(shí)間序列。
- 平穩(wěn)的時(shí)間序列需要滿足的三個(gè)條件:均值為固定常數(shù);方差存在且為常數(shù);協(xié)方差只與間隔有關(guān),與時(shí)間點(diǎn)無關(guān);
- 平穩(wěn)性檢驗(yàn):一般,可以通過觀察時(shí)序圖來判斷時(shí)間序列是否平穩(wěn),也可以通過假設(shè)檢驗(yàn)的方法來進(jìn)行判斷。
備注:上述的要求稱為協(xié)方差平穩(wěn),也稱為弱平穩(wěn)另外還有一種嚴(yán)格平穩(wěn),要求太高,因此時(shí)間序列中沒有特殊說明則默認(rèn)為弱平穩(wěn)。
- 白噪聲序列:均值為0的弱平穩(wěn)時(shí)間序列就稱為白噪聲序列,因此白噪聲序列是一種特殊的平穩(wěn)時(shí)間序列。一般時(shí)間序列中的擾動項(xiàng)就被視為白噪聲序列。
差分方程:
- 定義:將某個(gè)時(shí)間序列變量表示為該變量的滯后項(xiàng)、時(shí)間和其他變量的函數(shù),這樣的一個(gè)函數(shù)方程就被稱為差分方程。
- 差分方程的齊次部分:只包含該變量自身和它的滯后項(xiàng)的計(jì)算式。
- 滯后算子:一種方便的表示方法。
將差分方程的齊次部分轉(zhuǎn)化為特征方程,特征方程有p個(gè)解,這p個(gè)解的模長的大小決定了形為ARMA(p,q)模型的因變量序列是否平穩(wěn)。
P階自回歸模型(AR模型):
- 模型結(jié)構(gòu):將自身的滯后項(xiàng)作為自變量進(jìn)行回歸分析。
- 適用情況:自回歸只能用于預(yù)測與自身前期相關(guān)的經(jīng)濟(jì)現(xiàn)象,也就是受到歷史因素影響較大的經(jīng)濟(jì)現(xiàn)象。對于受到社會因素影響較大的經(jīng)濟(jì)現(xiàn)象不適合采用自回歸。
- 注意事項(xiàng):這里討論的AR模型一定是平穩(wěn)的時(shí)間序列模型,如果原始序列不平穩(wěn)也要先轉(zhuǎn)換為平穩(wěn)的序列后才能進(jìn)行建模。
備注:AR模型有專門用于判斷平穩(wěn)性的算法。對于一些不平穩(wěn)的模型可以通過差分的方法轉(zhuǎn)化為平穩(wěn)的時(shí)間序列。
移動平均模型(MA模型):
- 模型平穩(wěn)性:可以證明MA(q)模型只要q是常數(shù),則該模型一定是平穩(wěn)的。
- 與AR模型的關(guān)系:為了簡化AR模型參數(shù)估計(jì)的工作量可以引入MA模型,使得模型中的參數(shù)可以盡可能少。
自回歸移動平均模型(ARMA模型):
- 模型原理:設(shè)法將自回歸過程和移動平均過程結(jié)合起來。
- 模型平穩(wěn)性:平穩(wěn)性只與自回歸AR部分有關(guān)。
- 模型難點(diǎn):很難正確地識別ARMA模型的階數(shù)。
- 模型參數(shù)求解:ARMA模型目前最常用的參數(shù)估計(jì)方法是極大似然估計(jì)法。
模型完全性檢驗(yàn):
時(shí)間序列模型估計(jì)完成后需要對殘差進(jìn)行白噪聲檢驗(yàn)。如果殘差是白噪聲,則說明我們選擇的模型能完全識別出時(shí)間序列數(shù)據(jù)的規(guī)律,所以模型可以接受;如果殘差不是白噪聲,則說明還有部分信息沒有被識別利用,需要修正模型來識別這一部分信息。
SPSS中會自動算出P值,如果P值小于0.05則拒絕原假設(shè),此時(shí)模型沒有識別完全,需要進(jìn)行修正。
ARIMA模型:差分自回歸移動平均模型。首先對原始時(shí)間序列分解進(jìn)行差分使得其變得平穩(wěn),然后再適用ARMA模型求解。
SARIMA模型:在ARIMA模型中包含額外的季節(jié)性項(xiàng)生成的模型。
SPSS專家建模器的使用步驟
專家建模器原理:SPSS中的專家建模器會自動查找每個(gè)相依序列的最佳擬合模型。如果指定了自變量,則專家建模器為ARIMA模型中的內(nèi)容選擇那些與該相依序列具有顯著統(tǒng)計(jì)關(guān)系的模型。適當(dāng)時(shí),使用差分或平方根或自然對數(shù)轉(zhuǎn)換對模型變量進(jìn)行轉(zhuǎn)換。缺省情況下,可以將專家建模器限制為僅搜索ARIMA模型或僅搜索指數(shù)平滑模型,還可以指定自動檢測離群值。
1.依次點(diǎn)擊:分析→時(shí)間序列預(yù)測→創(chuàng)建傳統(tǒng)模型
2.設(shè)置時(shí)間序列的因變量。(也可以手動選擇僅從指數(shù)平滑模型和ARIMA模型中進(jìn)行篩選)
3.設(shè)置自動檢測并修改異常值。依次點(diǎn)擊:條件→離群值→自動檢測離群值
,并勾選所有離群值類型。
4.點(diǎn)擊統(tǒng)計(jì)并勾選參數(shù)估計(jì)值。
5.點(diǎn)擊圖,并勾選擬合值、殘差自相關(guān)系數(shù)和殘差偏自相關(guān)系數(shù)。
6.點(diǎn)擊“保存”并勾選預(yù)測值。
7.點(diǎn)擊“選項(xiàng)”并選擇“評估期結(jié)束第一個(gè)個(gè)案到指定日期之間的個(gè)案,并輸入結(jié)束的時(shí)間。
備注:
①預(yù)測值和擬合值的區(qū)別:擬合值是對已經(jīng)有的時(shí)間序列的重新擬合,預(yù)測值是對未來的發(fā)展進(jìn)行預(yù)測。
②保留ACF和PACF的作用:判斷殘差是否為白噪聲,如果是的話則可以認(rèn)為時(shí)間序列模型識別完全。
專家建模器運(yùn)行結(jié)果:
-
模型類型:
由表格可知最佳的模型是溫特加法模型,因此可以判斷時(shí)間序列含有線性趨勢和穩(wěn)定的季節(jié)成分,所以也可以使用疊加型時(shí)間序列分解。 -
模型擬合度:
模型評價(jià)指標(biāo):
①平穩(wěn)的R方和正態(tài)化BIC:可以用平穩(wěn)的R2或者標(biāo)準(zhǔn)化BIC(BIC準(zhǔn)則),這兩個(gè)指標(biāo)同時(shí)考慮了擬合的好壞和模型的復(fù)雜度。
②R方:R方也可以用于評價(jià)擬合結(jié)果的好壞,越接近于1則擬合效果越好。 -
模型統(tǒng)計(jì):
顯著性:顯著性小于0.05則表示認(rèn)為殘差序列不是白噪聲,大于0.05則表示殘差序列是白噪聲。
離群值數(shù):離群值的個(gè)數(shù)。 -
模型參數(shù):(此處為溫特加法模型的模型參數(shù))
-
ACF和PACF圖:文章來源:http://www.zghlxwxcb.cn/news/detail-789485.html
所有藍(lán)色柱形圖都位于兩條黑色線之間表示通過ACF和PACF判定模型的識別完全。文章來源地址http://www.zghlxwxcb.cn/news/detail-789485.html
-
擬合圖像:
到了這里,關(guān)于數(shù)學(xué)建模學(xué)習(xí)筆記(15)時(shí)間序列分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!