VR虚拟现实张晓峒讲季节ARIMA模型.docx
- 文档编号:9917237
- 上传时间:2023-02-07
- 格式:DOCX
- 页数:17
- 大小:26.52KB
VR虚拟现实张晓峒讲季节ARIMA模型.docx
《VR虚拟现实张晓峒讲季节ARIMA模型.docx》由会员分享,可在线阅读,更多相关《VR虚拟现实张晓峒讲季节ARIMA模型.docx(17页珍藏版)》请在冰豆网上搜索。
VR虚拟现实张晓峒讲季节ARIMA模型
(VR虚拟现实)张晓峒讲季节ARIMA模型
第1讲季节时间序列(SARIMA)模型
1.时间序列(ARIMA)模型回顾
时间序列分析方法由Box-Jenkins(1976)年提出。
它适用于各种领域的时间序列分析。
时间序列模型不同于经济计量模型的两个特点是:
(1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。
(2)明确考虑时间序列的非平稳性。
如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。
时间序列模型的应用:
(1)研究时间序列本身的变化规律(何种结构,建立模型,有无确定性趋势,有无单位根,有无季节性成分)。
(2)在回归模型的预测中首先预测解释变量的值。
(3)非经典经济计量学的基础知识之一。
滞后算子与差分算子
滞后算子:
表示时间滞后的算子,常用L或B表示。
例,Lxt=xt-1,Lnxt=xt-n。
差分:
时间序列变量的本期值与其滞后值相减的运算叫差分。
表示差分运算的算子称作差分算子,常用或D表示。
差分分为一阶差分和高阶差分,一次差分和高次差分。
例,一阶差分xt=xt-xt-1=xt-Lxt=(1-L)xt。
例,高阶差分kxt=xt-xt-k=xt–Lkxt=(1-Lk)xt。
例,二次差分xt=(1-L)2xt=(1–2L+L2)xt=xt–2xt-1+xt–2。
高阶差分常用于季节性数据的差分,如季度数据的4阶差分、月度数据的12阶差分等。
滞后算子与差分算子可以直接参与运算。
滞后算子有如下性质。
(1)常数与滞后算子相乘等于常数。
Lc=c
(2)滞后算子适用于分配律。
(Li+Lj)xt=Lixt+Ljxt=xt-i+xt–j
(3)滞后算子适用于结合律。
LiLjxt=Li+jxt=xt-i–j,(Lj)2xt=LjLjxt=L2jxt=xt–2j
(4)滞后算子的零次方等于1。
L0xt=xt
(5)滞后算子的负整数次方意味着超前。
L-ixt=xt+i
中文对时间前后的描述混乱。
以前,从前,前年,滞后现在以后,今后,后年,超前
时间
backward,lag,now,lead,forward,
几种典型的随机过程
1.白噪声(whitenoise)过程
对于随机过程{xt,tT},如果E(xt)=0,Var(xt)=2,tT;Cov(xt,xt+k)=0,(t+k)T,k0,则称{xt}为白噪声过程。
2.随机游走(randomwalk)过程
对于下面的表达式
xt=xt-1+ut
如果ut为白噪声过程,则称xt为随机游走(随机游动、随机漫游)过程。
3.自回归过程,AR(p)
如果一个剔出均值和确定性成分的线性过程可表达为
xt=1xt-1+2xt-2+…+pxt-p+ut,
其中i,i=1,…p是自回归参数,ut是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。
xt是由它的p个滞后变量的加权和以及ut相加而成。
4.移动平均过程,MA(q)
如果一个剔出均值和确定性成分的线性随机过程可用下式表达
xt=ut+1ut–1+2ut-2+…+qut–q=(1+1L+2L2+…+qLq)ut=L)ut
其中1,2,…,q是移动平均参数,ut为白噪声过程,则上式称为q阶移动平均过程,记为MA(q)。
之所以称“移动平均”,是因为xt是由q+1个ut和ut滞后项的加权和构造而成。
“移动”指t的变化,“平均”指加权和。
5.自回归移动平均过程,ARMA(p,q)
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。
ARMA(p,q)的一般表达式是
xt=1xt-1+2xt-2+…+pxt-p+ut+1ut-1+2ut-2+...+qut-q
即
(1-1L-2L2-…-pLp)xt=(1+1L+2L2+…+qLq)ut
或
(L)xt=(L)ut
其中(L)和(L)分别表示L的p,q阶特征多项式。
ARMA(p,q)过程的平稳性只依赖于其自回归部分,即(L)=0的全部根取值在单位圆之外(绝对值大于1)。
其可逆性则只依赖于移动平均部分,即(L)=0的根取值应在单位圆之外。
6.单整(单积)自回归移动平均过程,ARIMA(p,d,q)
考虑如下模型
(L)dyt=(L)ut
其中(L)是一个平稳的自回归算子。
即(L)=0的根都大于1。
(L)表示可逆的移动平均算子。
(L)=0的根都大于1。
则称yt为(p,d,q)阶单整(单积)自回归移动平均过程,记为ARIMA(p,d,q)。
其中(L)d称为广义自回归算子。
Wold分解定理:
任何协方差平稳过程xt,都可以被表示为
xt--dt=ut+1ut-1+2ut-2+…+=
其中表示xt的期望。
dt表示xt的线性确定性成分,如周期性成分、时间t的多项式和指数形式,虚拟变量等,可以直接用xt的滞后值预测。
0=1,<∞。
ut为白噪声过程。
ut表示用xt的滞后项预测xt时的误差。
ut=xt-E(xtxt-1,xt-2,…)
称为xt的线性非确定性成分。
当dt=0时,称xt为纯线性非确定性过程。
对于一般的(漂移项非零)ARMA(p,q)过程,
(L)xt=+(L)ut
(1)
xt的期望是
E(xt)=E()+E(ut)===
这就是漂移项与均值的关系
所以
(1)式也可以写为,
(L)(xt-)=(L)ut
(2)
任何漂移项非零(含有确定性成分)的平稳过程都可以通过对该序列先退均值(退确定性成分)再研究。
均值的大小并不影响模型的结构。
所以以零均值过程研究模型类型具有代表性。
2.季节时间序列模型
在某些时间序列中,存在明显的周期性变化。
这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。
这类序列称为季节性序列。
比如一个地区的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周期的变化。
在经济领域中,季节性序列更是随处可见。
如季度时间序列、月度时间序列、周度时间序列等。
处理季节性时间序列只用以上介绍的方法是不够的。
描述这类序列的模型之一是季节时间序列模型(seasonalARIMAmodel),用SARIMA表示。
较早文献也称其为乘积季节模型(multiplicativeseasonalmodel)。
设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为s,即时间间隔为s的观测值有相似之处。
首先用季节差分的方法消除周期性变化。
季节差分算子定义为,
s=1-Ls
若季节性时间序列用yt表示,则一次季节差分表示为
syt=(1-Ls)yt=yt-yt-s
对于非平稳季节性时间序列,有时需要进行D次季节差分之后才能转换为平稳的序列。
在此基础上可以建立关于周期为s的P阶自回归Q阶移动平均季节时间序列模型(注意P、Q等于2时,滞后算子应为(Ls)2=L2s。
P(Ls)sDyt=Q(Ls)ut(2.60)
对于上述模型,相当于假定ut是平稳的、非自相关的。
当ut非平稳且存在ARMA成分时,则可以把ut描述为
p(L)dut=q(L)vt(2.61)
其中vt为白噪声过程,p,q分别表示非季节自回归、移动平均算子的最大阶数,d表示ut的一阶(非季节)差分次数。
由上式得
ut=p-1(L)-dq(L)vt(2.62)
把(2.62)式代入(2.60)式,于是得到季节时间序列模型的一般表达式。
p(L)P(Ls)(dsDyt)=q(L)Q(Ls)vt(2.63)
其中下标P,Q,p,q分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d,D分别表示非季节和季节性差分次数。
上式称作(p,d,q)(P,D,Q)s阶季节时间序列模型或乘积季节模型。
保证(dsDyt)具有平稳性的条件是p(L)P(Ls)=0的根在单位圆外;保证(dsDyt)具有可逆性的条件是q(L)Q(Ls)=0的根在单位圆外。
当P=D=Q=0时,SARIMA模型退化为ARIMA模型;从这个意义上说,ARIMA模型是SARIMA模型的特例。
当P=D=Q=p=q=d=0时,SARIMA模型退化为白噪声模型。
(1,1,1)(1,1,1)12阶月度SARIMA模型表达为
(1-1L)(1-1L12)12yt=(1+1L)(1+1L12)vt
12yt具有平稳性的条件是1<1,1<1,12yt具有可逆性的条件是1<1,1<1。
设log(Yt)=yt,变量12yt在EViews中用DLOG(Y,1,12)表示(这样表示的好处是EViews可以直接预测到Y),上式的EViews估计命令是
DLOG(Y,1,12)AR
(1)SAR(12)MA
(1)SMA(12)
(0,1,1)(0,1,1)12阶月度SARIMA模型表达为
12yt=(1+1L)(1+1L12)vt(2.64)
(2.64)式的EViews估计命令是
DLOG(Y,1,12)MA
(1)SMA(12)
由(2.64)式得
12yt=(1+1L)(1+1L12)vt=vt+1Lvt+1L12vt+11L13vt
=vt+1vt–1+1vt–12+11vt–13
上式对应的EViews估计命令是
DLOG(Y,1,12)MA
(1)MA(12)MA(13)
模型表达式是
12yt=vt+1vt–1+12vt–12+13vt–13
这是一个非季节模型表达式。
以上两个EViews估计命令是等价的,都是估计MA(13)模型。
注意:
唯一不同点是上式对vt–13的系数13没有约束,而对季节模型来说,相当于增加了一个约束条件,13=11。
进一步化简
(yt–yt-12)=vt+1vt–1+1vt–12+11vt–13
yt–yt-12=vt+1vt–1+1vt–12+11vt–13
用于预测的模型型式是
yt=yt-1+yt-12–yt–13+vt+1vt–1+1vt–12+11vt–13(2.65)
由季节时间序列模型的一般表达式。
p(L)P(Ls)(dsDyt)=q(L)Q(Ls)vt(2.63)
可写为
p(L)P(Ls)sD(dyt)=q(L)Q(Ls)vt
*(L)dyt=*(L)vt
其中,*(L)=p(L)P(Ls)sD,*(L)=q(L)Q(Ls)。
从上式可以看出SARIMA模型(2.63)可以展开为ARIMA(p+PS+DS,d,q+QS)模型。
对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序列图以及时间序列的相关图和偏相关图分析得到。
以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用SARIMA模型描述。
建立SARIMA模型,
(1)首先要确定d,D。
通过差分和季节差分把原序列变换为一个平稳的序列。
令
xt=dsDyt
(2)然后用xt建立p(L)P(Ls)xt=q(L)Q(Ls)vt模型。
注意:
(1)用对数的季节时间序列数据建模时通常D不会大于1,P和Q不会大于3。
(2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。
利用乘积季节模型预测也与上面介绍的预测方法类似。
3.季节时间序列建模案例
案例1:
(文件名:
5b2c3)北京市1978:
1~1989:
12社会商品零售额月度数据(yt,单位:
亿元人民币)曲线见图2.32,数据见表2.3。
yt与时间呈指数关系且存在递增型异方差。
对数的社会商品零售额月度数据(Lnyt)曲线见图2.33。
Lnyt与时间近似呈线性关系(异方差问题也得到抑制)。
图2.32yt图2.33Lnyt
通过Lnyt的相关图和偏相关图(见图2.34)可以看到Lnyt是一个非平稳序列(相关图衰减很慢)且Lnyt与其12倍数的滞后期存在自回归关系。
图2.34Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分,得Lnyt(图2.35)。
图2.36是对Lnyt进行2次一阶差分的结果,序列2Lnyt是过度差分序列。
从Lnyt的相关图和偏相关图(图2.37)可以看到,通过差分Lnyt的平稳性得到很大改进,但与其12倍数的滞后期存在显著的自相关关系。
图2.35Lnyt图2.362Lnyt
图2.37Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一次季节性差分(或12阶差分),得12Lnyt(图2.38)。
从12Lnyt的相关图和偏相关图(图2.39)可以看到12Lnyt仍然是非平稳的。
图2.3812Lnyt,(EViews:
DLOG(Y,0,12))
图2.3912Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分和一阶季节性差分,得12Lnyt(见图2.40)。
从xt的相关图和偏相关图(见图2.41)可以看到12Lnyt近似为一个平稳过程。
图2.4012Lnyt=xt,(EViews:
DLOG(Y,1,12))
图2.4112Lnyt的相关图(下)和偏相关图(上)
建模1:
用1978:
1~1989:
11期间数据,估计yt的(1,1,1)(1,1,0)12阶季节时间序列模型,得结果如下:
(1+0.5924L)(1+0.4093L12)12Lnyt=(1+0.4734L)vt(2.66)
(4.5)(5.4)(1.9)
R2=0.33,s.e.=0.146,Q(36)=15.5,20.05(36-2-1)=44
EViews估计命令是
DLOG(Y,1,12)AR
(1)SAR(12)MA
(1)
EViews输出结果见图2.42。
注意:
(1)仔细对照(2.66)式和图2.42输出结果,不要把自回归系数估计值的符号写错。
通过自回归特征根倒数-0.59可知,把表达式中的算子写作(1+0.5924L)是正确的。
通过移动平均特征根倒数-0.47可知,把表达式中的算子写作(1+0.4734L)是正确的。
(2)表达式中,季节和非季节因子(特征多项式)之间是相乘关系。
(3)在EViews估计命令中把变量写作DLOG(Y,1,12)的好处是可以直接对yt和12Lnyt预测。
(4)以上EViews估计命令为例,如果命令中没有AR
(1)项,那么SAR(12)项的输出结果将变为AR(12),为什么?
模型残差序列的相关与偏相关图如图2.43。
图2.42EViews估计结果
图2.43模型残差序列的相关与偏相关图
对于12Lnyt来,模型参数全部有显著性,Q(36)=15.5<20.05(36-2-1)=44。
两种检验通过。
见输出结果(2.42),对于12Lnyt,模型共有14个特征根。
图2.44D12DLnyt的实际与静态预测序列图2.45yt的实际与静态预测序列
图2.44D12DLnyt的实际与动态预测序列图2.45yt的实际与动态预测序列
对1989年第12月份yt进行样本外1期预测,结果如图2.46。
图2.46EViews预测结果图2.471989年第12月份(样本外1期)预测评价
预测误差是
==0.076
建模2:
进一步分析12Lnyt的相关图和偏相关图,也可以建立成一个纯季节移动平均模型。
用1978:
1~1989:
12期间数据得(0,1,1)(0,1,1)12季节乘积模型EViews估计结果如下,
图2.4112Lnyt的相关图(下)和偏相关图(上)
12Lnyt=(1-0.35L)(1-0.61L12)vt(2.67)
(-4.4)(-9.1)
R2=0.36,DW=1.86,F=71.9,s.e.=0.038,Q(36)=21.88,20.05(36-2)=44
模型参数全部有显著性,Q(36)=21.88<20.05(36-2)=44。
两种检验通过。
上式变换为,
Lnyt–Lnyt-12=vt-0.35vt–1-0.61vt–12+0.2135vt–13
Lnyt=Lnyt-1+Lnyt-12–Lnyt–13+vt-0.35vt–1-0.61vt–12+0.2135vt–13(2.68)
(2.67)式也是一个可以选用的模型。
表2.3北京市社会商品零售额(yt)月度数据(单位:
亿元人民币,1978:
1~1989:
12)
年:
月
yt
年:
月
yt
年:
月
yt
年:
月
yt
年:
月
yt
1978:
01
134.3
1980:
06
168.2
1982:
11
205.8
1985:
04
343.4
1987:
09
499.5
1978:
02
119.4
1980:
07
163.5
1982:
12
248.2
1985:
05
341.2
1987:
10
505.2
1978:
03
128.3
1980:
08
161.6
1983:
01
243.2
1985:
06
346.0
1987:
11
518.7
1978:
04
126.4
1980:
09
172.9
1983:
02
217.5
1985:
07
329.9
1987:
12
617.9
1978:
05
128.8
1980:
10
166.5
1983:
03
226.2
1985:
08
328.1
1988:
01
570.7
1978:
06
127.8
1980:
11
175.2
1983:
04
223.5
1985:
09
358.2
1988:
02
561.3
1978:
07
121.1
1980:
12
197.7
1983:
05
221.0
1985:
10
358.4
1988:
03
570.4
1978:
08
118.4
1981:
01
212.1
1983:
06
220.5
1985:
11
376.6
1988:
04
567.9
1978:
09
125.7
1981:
02
177.9
1983:
07
205.8
1985:
12
451.0
1988:
05
570.9
1978:
10
123.6
1981:
03
182.9
1983:
08
206.9
1986:
01
412.0
1988:
06
603.9
1978:
11
128.5
1981:
04
184.2
1983:
09
218.8
1986:
02
374.5
1988:
07
591.8
1978:
12
145.2
1981:
05
184.0
1983:
10
216.0
1986:
03
390.0
1988:
08
636.2
1979:
01
164.7
1981:
06
182.4
1983:
11
235.0
1986:
04
387.0
1988:
09
674.5
1979:
02
126.2
1981:
07
175.6
1983:
12
282.0
1986:
05
389.8
1988:
10
647.7
1979:
03
143.7
1981:
08
172.0
1984:
01
268.4
1986:
06
397.7
1988:
11
640.5
1979:
04
143.7
1981:
09
184.9
1984:
02
227.6
1986:
07
381.4
1988:
12
804.2
1979:
05
145.5
1981:
10
184.7
1984:
03
248.6
1986:
08
386.9
1989:
01
694.3
1979:
06
143.7
1981:
11
195.1
1984:
04
247.0
1986:
09
429.8
1989:
02
673.8
1979:
07
138.4
1981:
12
224.8
1984:
05
249.9
1986:
10
428.8
1989:
03
718.7
1979:
08
136.7
1982:
01
233.6
1984:
06
253.1
1986:
11
444.4
1989:
04
690.3
1979:
09
145.5
1982:
02
182.0
1984:
07
245.5
1986:
12
527.7
1989:
05
676.6
1979:
10
150.7
1982:
03
206.6
1984:
08
249.6
1987:
01
478.3
1989:
06
665.8
1979:
11
149.0
1982:
04
202.2
1984:
09
272.3
1987:
02
442.4
1989:
07
642.2
1979:
12
164.7
1982:
05
201.7
1984:
10
278.7
1987:
03
461.4
1989:
08
638.9
1980:
01
190.3
1982:
06
202.6
1984:
11
299.4
1987:
04
458.2
1989:
09
674.1
1980:
02
174.9
1982:
07
192.8
1984:
12
366.3
1987:
05
458.2
1989:
10
652.7
1980:
03
163.2
1982:
08
186.2
1985:
01
364.8
1987:
06
468.5
1989:
11
641.9
1980:
04
168.4
1982:
09
199.3
1985:
02
349.1
1987:
07
454.5
1989:
12
734.1
1980:
05
168.6
1982:
10
198.2
1985:
03
359.1
1987:
08
458.9
案例2香港季节GDPt数据的拟合(季节时间序列模型,file:
HongKong)
1980:
1~2002:
4年香港季度GDPt序列曲线见图2.27(数据见表2.4,单位:
港元)。
1980~1997年GDPt随时间呈指数增长。
1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDPt总量几乎没有增长。
另一个特征是GDPt随时间呈递增型异方差。
所以,用对数的季度GDPt数据(LnGDPt,曲线见图2.48)建立季节时间序列模型。
图2.47GDPt图2.48LnGDPt
通过LnGDPt的相关图和偏相关图(图2.49)可以看到LnGDPt是一个非平稳序列(相关图衰减得很慢)。
图2.49LnGDPt的相关图和偏相关图
对LnGDPt进行一阶差分,得DLnGDPt(见图2.50)。
DLnGDPt的平稳性得到很大改进,但其季节因素影响还很大。
从DLnGDPt的相关图和偏相关图(图2.51)也可以明显地看到这个特征。
若对LnGDPt直接进行一次季节差分(四阶差分),得D4LnGDPt见图2.52。
其波动性也很大。
相关图和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- VR 虚拟现实 张晓峒讲 季节 ARIMA 模型