python使用ARIMA進(jìn)行時(shí)間序列的預(yù)測(cè)（基礎(chǔ)教程）

2年前作者：開始King分類：Toy博客閱讀(24)違法舉報(bào)

這篇具有很好參考價(jià)值的文章主要介紹了python使用ARIMA進(jìn)行時(shí)間序列的預(yù)測(cè)（基礎(chǔ)教程）。希望對(duì)大家有所幫助。如果存在錯(cuò)誤或未考慮完全的地方，請(qǐng)大家不吝賜教，您也可以點(diǎn)擊"舉報(bào)違法"按鈕提交疑問。

時(shí)間序列就是以時(shí)間為索引的數(shù)據(jù)，比如下面這種形式
python arima,機(jī)器學(xué)習(xí),python 數(shù)據(jù)鏈接：https://pan.baidu.com/s/1KHmCbk9ygIeRHn97oeZVMg
提取碼：s0k5

python使用ARIMA建模，主要是使用statsmodels庫(kù)

首先是建模流程，如果不是太明白不用擔(dān)心，下面會(huì)詳細(xì)的介紹這些過程

首先要注意一點(diǎn)，ARIMA適用于短期 單變量預(yù)測(cè)，長(zhǎng)期的預(yù)測(cè)值都會(huì)用均值填充，后面你會(huì)看到這種情況。

首先導(dǎo)入需要的包

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
from statsmodels.stats.diagnostic import acorr_ljungbox
from statsmodels.graphics.tsaplots import plot_pacf,plot_acf

載入數(shù)據(jù)

df=pd.read_csv('./附件1-區(qū)域15分鐘負(fù)荷數(shù)據(jù).csv',parse_dates=['數(shù)據(jù)時(shí)間'])
df.info()

將默認(rèn)索引改為時(shí)間索引

data=df.copy()
data=data.set_index('數(shù)據(jù)時(shí)間')

1 繪制時(shí)序圖

plt.plot(data.index,data['總有功功率（kw）'].values)
plt.show()

python arima,機(jī)器學(xué)習(xí),python 劃分訓(xùn)練集和測(cè)試集

train=data.loc[:'2018/1/13 23:45:00',:]
test=data.loc['2018/1/14 0:00:00':,:]

2 平穩(wěn)性檢驗(yàn)

# 單位根檢驗(yàn)-ADF檢驗(yàn)
print(sm.tsa.stattools.adfuller(train['總有功功率（kw）']))

python arima,機(jī)器學(xué)習(xí),python 1%、%5、%10不同程度拒絕原假設(shè)的統(tǒng)計(jì)值和ADF比較，ADF同時(shí)小于1%、5%、10%即說明非常好地拒絕該假設(shè)，本數(shù)據(jù)中，adf結(jié)果為-5.22，小于三個(gè)level的統(tǒng)計(jì)值，說明數(shù)據(jù)是平穩(wěn)的
3 白噪聲檢驗(yàn)
使用 $Q_{BP}$ 和 $Q_{LB}$ 統(tǒng)計(jì)量進(jìn)行序列的隨機(jī)性檢驗(yàn)

# 白噪聲檢驗(yàn)
acorr_ljungbox(train['總有功功率（kw）'], lags = [6, 12],boxpierce=True)

python arima,機(jī)器學(xué)習(xí),python 各階延遲下LB和BP統(tǒng)計(jì)量的P值都小于顯著水平（ $\alpha=0.05$ ）,所以拒絕序列為純隨機(jī)序列的原假設(shè)，認(rèn)為該序列為非白噪聲序列
4 計(jì)算ACF,PACF

# 計(jì)算ACF
acf=plot_acf(train['總有功功率（kw）'])
plt.title("總有功功率的自相關(guān)圖")
plt.show()

python arima,機(jī)器學(xué)習(xí),python

# PACF
pacf=plot_pacf(train['總有功功率（kw）'])
plt.title("總有功功率的偏自相關(guān)圖")
plt.show()

python arima,機(jī)器學(xué)習(xí),python
5 選擇合適的模型進(jìn)行擬合

ACF	PACF	模型
拖尾	截尾	AR
截尾	拖尾	MA
拖尾	拖尾	ARMA

如果說自相關(guān)圖拖尾，并且偏自相關(guān)圖在p階截尾時(shí)，此模型應(yīng)該為AR(p )。
如果說自相關(guān)圖在q階截尾并且偏自相關(guān)圖拖尾時(shí)，此模型應(yīng)該為MA(q)。
如果說自相關(guān)圖和偏自相關(guān)圖均顯示為拖尾，那么可結(jié)合ACF圖中最顯著的階數(shù)作為q值，選擇PACF中最顯著的階數(shù)作為p值，最終建立ARMA(p,q)模型。

從ACF和PACF圖的結(jié)果來看，p=7,q=4

model = sm.tsa.arima.ARIMA(train,order=(7,0,4))
arima_res=model.fit()
arima_res.summary()

因?yàn)榭醋韵嚓P(guān)圖和偏自相關(guān)圖有很大的主觀性，因此，可以通過AIC或BIC來確定最合適的階數(shù)

trend_evaluate = sm.tsa.arma_order_select_ic(train, ic=['aic', 'bic'], trend='n', max_ar=20,
                                            max_ma=5)
print('train AIC', trend_evaluate.aic_min_order)
print('train BIC', trend_evaluate.bic_min_order)

python arima,機(jī)器學(xué)習(xí),python

6 模型預(yù)測(cè)

predict=arima_res.predict("2018/1/14 0:00:00","2018/1/14 23:45:00")
plt.plot(test.index,test['總有功功率（kw）'])
plt.plot(test.index,predict)
plt.legend(['y_true','y_pred'])
plt.show()
print(len(predict))

python arima,機(jī)器學(xué)習(xí),python
7 模型評(píng)價(jià)

from sklearn.metrics import r2_score,mean_absolute_error
mean_absolute_error(test['總有功功率（kw）'],predict)

python arima,機(jī)器學(xué)習(xí),python
8 殘差分析

res=test['總有功功率（kw）']-predict
residual=list(res)
plt.plot(residual)

python arima,機(jī)器學(xué)習(xí),python
查看殘差的均值是否在0附近

np.mean(residual)

python arima,機(jī)器學(xué)習(xí),python

殘差正態(tài)性檢驗(yàn)

import seaborn as sns
from scipy import stats
plt.figure(figsize=(10,5))
ax=plt.subplot(1,2,1)
sns.distplot(residual,fit=stats.norm)
ax=plt.subplot(1,2,2)
res=stats.probplot(residual,plot=plt)
plt.show()

python arima,機(jī)器學(xué)習(xí),python
在開頭說過，ARIMA不適用長(zhǎng)期預(yù)測(cè)，下面把預(yù)測(cè)范圍調(diào)大，看看是否和文章開頭所說的一致

predict=arima_res.predict("2018/1/14 0:00:00","2018/1/18 23:45:00")

plt.plot(range(len(predict)),predict)
plt.legend(['y_true','y_pred'])
plt.show()
print(len(predict))

python arima,機(jī)器學(xué)習(xí),python 文章來源地址http://www.zghlxwxcb.cn/news/detail-797630.html

到了這里，關(guān)于python使用ARIMA進(jìn)行時(shí)間序列的預(yù)測(cè)（基礎(chǔ)教程）的文章就介紹完了。如果您還想了解更多內(nèi)容，請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！

本文來自互聯(lián)網(wǎng)用戶投稿，該文觀點(diǎn)僅代表作者本人，不代表本站立場(chǎng)。本站僅提供信息存儲(chǔ)空間服務(wù)，不擁有所有權(quán)，不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載，請(qǐng)注明出處：如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實(shí)不符，請(qǐng)點(diǎn)擊違法舉報(bào)進(jìn)行投訴反饋，一經(jīng)查實(shí)，立即刪除！

分享到：

領(lǐng)支付寶紅包贊助服務(wù)器費(fèi)用

風(fēng)速預(yù)測(cè) | Python基于CEEMDAN-CNN-Transformer+ARIMA的風(fēng)速時(shí)間序列預(yù)測(cè)
效果一覽基本介紹 CEEMDAN-CNN-Transformer+ARIMA是一種用于風(fēng)速時(shí)間序列預(yù)測(cè)的模型，結(jié)合了不同的技術(shù)和算法。收集風(fēng)速時(shí)間序列數(shù)據(jù)，并確保數(shù)據(jù)的質(zhì)量和完整性。這些數(shù)據(jù)通常包括風(fēng)速的觀測(cè)值和時(shí)間戳。CEEMDAN分解：使用集合經(jīng)驗(yàn)?zāi)B(tài)分解（CEEMDAN）將風(fēng)速時(shí)間序列分解為多
2024年01月25日
瀏覽(26)
用Python語言進(jìn)行時(shí)間序列ARIMA模型分析
應(yīng)用時(shí)間序列時(shí)間序列分析是一種重要的數(shù)據(jù)分析方法，應(yīng)用廣泛。以下列舉了幾個(gè)時(shí)間序列分析的應(yīng)用場(chǎng)景： 1.經(jīng)濟(jì)預(yù)測(cè)：時(shí)間序列分析可以用來分析經(jīng)濟(jì)數(shù)據(jù)，預(yù)測(cè)未來經(jīng)濟(jì)趨勢(shì)和走向。例如，利用歷史股市數(shù)據(jù)和經(jīng)濟(jì)指標(biāo)進(jìn)行時(shí)間序列分析，可以預(yù)測(cè)未來股市的走向。
2024年02月03日
瀏覽(20)
Python中的ARIMA模型、SARIMA模型和SARIMAX模型對(duì)時(shí)間序列預(yù)測(cè)
最近我們被客戶要求撰寫關(guān)于時(shí)間序列預(yù)測(cè)的研究報(bào)告，包括一些圖形和統(tǒng)計(jì)輸出。? 使用ARIMA模型，您可以使用序列過去的值預(yù)測(cè)時(shí)間序列。在本文中，我們從頭開始構(gòu)建了一個(gè)最佳ARIMA模型，并將其擴(kuò)展到Seasonal ARIMA（SARIMA）和SARIMAX模型。時(shí)間序列是在定期時(shí)間間隔內(nèi)記
2024年02月04日
瀏覽(33)
使用Google大模型Bard(PaLM)理解時(shí)間序列預(yù)測(cè)模型ARIMA
Google Bard的新模型使用的是PaLM，暫時(shí)不支持中文，本次測(cè)試使用Bard模型來輔助理解一個(gè)時(shí)間序列預(yù)測(cè)模型ARIMA。 A: ARIMA stands for Autoregressive Integrated Moving Average. It is a statistical model that is used to forecast time series data. ARIMA models are based on the idea that the current value of a time series can be
2024年02月08日
瀏覽(20)
時(shí)間序列預(yù)測(cè) | Matlab自回歸差分移動(dòng)平均模型ARIMA時(shí)間序列預(yù)測(cè)
效果一覽文章概述時(shí)間序列預(yù)測(cè) | Matlab自回歸差分移動(dòng)平均模型ARIMA時(shí)間序列預(yù)測(cè)，單列數(shù)據(jù)輸入模型評(píng)價(jià)指標(biāo)包括:MAE、RMSE和R2等，代碼質(zhì)量極高，方便學(xué)習(xí)和替換數(shù)據(jù)。要求2018版本及以上。部分源碼
2024年02月13日
瀏覽(29)
【時(shí)序分析】使用skforecast進(jìn)行時(shí)間序列預(yù)測(cè)并分享14個(gè)Python時(shí)間序列分析庫(kù)
2023年12月14日
瀏覽(30)
時(shí)序預(yù)測(cè) | Python實(shí)現(xiàn)ARIMA-LSTM差分自回歸移動(dòng)平均模型結(jié)合長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)時(shí)間序列預(yù)測(cè)
預(yù)測(cè)效果基本介紹時(shí)序預(yù)測(cè) | Python實(shí)現(xiàn)ARIMA-LSTM差分自回歸移動(dòng)平均模型結(jié)合長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)時(shí)間序列預(yù)測(cè) 直接替換數(shù)據(jù)即可用適合新手小白附贈(zèng)案例數(shù)據(jù) 可直接運(yùn)行程序設(shè)計(jì) 完整程序和數(shù)據(jù)下載方式私信博主回復(fù)： Python實(shí)現(xiàn)ARIMA-LSTM差分自回歸移動(dòng)平均模型結(jié)合長(zhǎng)
2024年02月07日
瀏覽(31)
SPSS軟件實(shí)操——ARIMA時(shí)間序列預(yù)測(cè)模型
時(shí)間序列預(yù)測(cè)——ARIMA模型 https://blog.csdn.net/beiye_/article/details/123317316?spm=1001.2014.3001.5501 ?????????????? 案例：基于ARIMA模型對(duì)螺紋鋼價(jià)格預(yù)測(cè)——以南昌市為例鋼鐵作為我國(guó)經(jīng)濟(jì)發(fā)展主要戰(zhàn)略原材料，其價(jià)格成本也是工程造價(jià)預(yù)算的重要組成部分，利用時(shí)間
2024年01月25日
瀏覽(22)
時(shí)序預(yù)測(cè) | MATLAB實(shí)現(xiàn)AR、ARMA、ARIMA時(shí)間序列預(yù)測(cè)模型答疑
基本介紹 AR 自回歸模型（Autoregressive Model），通常簡(jiǎn)稱為AR模型，是一種用于時(shí)間序列分析和預(yù)測(cè)的統(tǒng)計(jì)模型。它基于時(shí)間序列自身的歷史值來預(yù)測(cè)未來值，通過將當(dāng)前時(shí)刻的觀測(cè)值與前一時(shí)刻的觀測(cè)值之間的關(guān)系進(jìn)行建模。 AR模型的基本思想是，當(dāng)前時(shí)刻的值可以由之前時(shí)
2024年02月09日
瀏覽(30)
時(shí)間序列預(yù)測(cè)算法梳理（Arima、Prophet、Nbeats、NbeatsX、Informer）
自回歸滑動(dòng)平均（Autoregressive integrated moving average，ARIMA）模型由Box和Jenkins于1970年提出。他們認(rèn)為某些非平穩(wěn)序列中，某一部分與其他部分相似，而這種同質(zhì)性可經(jīng)d階差分后就可以成為平穩(wěn)序列，成為混合自回歸-滑動(dòng)平均過程。那么該非平穩(wěn)序列為ARIMA模型，用表示。其中
2024年02月06日
瀏覽(34)