自回归移动平均模型解析.docx
- 文档编号:9026746
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:45
- 大小:519.58KB
自回归移动平均模型解析.docx
《自回归移动平均模型解析.docx》由会员分享,可在线阅读,更多相关《自回归移动平均模型解析.docx(45页珍藏版)》请在冰豆网上搜索。
自回归移动平均模型解析
第二章自回归移动平均模型
Box和Jenkins创立的ARMA
并由此对时间序列的变化进
一些金融时间序列的变动往往呈现出一定的平稳特征,由模型就是借助时间序列的随机性来描述平稳序列的相关性信息,行建模和预测。
第一节ARMA模型的基本原理
ARMA模型由三种基本的模型构成:
自回归模型(AR,Auto-regressiveModel),移动平均模型(MA,MovingAverageModel)以及自回归移动平均模型(ARMA,Auto-regressiveMovingAverageModel)。
2.1.1自回归模型的基本原理
1.AR模型的基本形式
AR模型的一般形式如下:
办乂「1办」•2办上\%申;t
其中,c为常数项,'1,2^\模型的系数,;t为白噪声序列。
我们称上述方程为p
阶自回归模型,记为AR(p)。
2.AR模型的平稳性
此处的平稳性是指宽平稳,即时间序列的均值,方差和自协方差均与时刻无关。
即若时
间序列{%}是平稳的,即E(yt)=^,Var(yt2,Cov(yt,y—)=。
为了描述的方便,对式(2.1)的滞后项引入滞后算子。
若yt二xtj,定义算子“L”,
r.k
使得yt=Lxt=为4L称为滞后算子。
由此可知,L人=Xt±。
对于式子(2.1),可利用滞后算子改写为:
yt=c丄%2L2%pLP%t
移项整理,可得:
(1-丄-2L2--pLp)yt二c;t
AR(p)的平稳性条件为方程1-1L-qL2-…-pL^0的解均位于单位圆外。
3.AR模型的统计性质
(1)AR模型的均值。
假设AR(p)模型是平稳的,对AR(p)模型两边取期望可得:
根据平稳序列的定义知,E(yJ=•I,由于随即干扰项为白噪声序列,所以E(;J=0,
因此上式可化简为:
(1-1-2-…-')亠八0
1一%-%―…_©p
(2)AR模型的方差。
直接计算AR(p)模型的方差较困难,这里引入Green函数。
AR(p)模型可以改写成如下形式:
yt
:
(L)
设■j…■p为平稳AR(p)模型的反特征根,则
p
:
:
J(L)=1一丄一2L2-川一pLp"【(1-丄)。
i=1
进一步,
pkpp『:
:
yt亠.tki('iLVtki订;t「j='Gj;t_j
i=11—,-iLimj=oj=0imj=0
p
其中,ki为常数,Gj八.ki■ij,称为Green函数,因为''p均在单位圆内,所
i=1
以Green函数是呈负指数下降的。
对上式两边取方差,可得:
C3O
2
var(yt)=、Gjvar(;t_j)
j=0
由于随机干扰项为白噪声序列,所以var(;t_j)=匚2。
因为Green函数是呈负指数下降,
--2
所以Gj:
:
:
:
:
,这说明平稳时间序列方差有界,且等于常数、Gj务2。
j=0j=P
(3)自协方差函数。
假设将原序列已经中心化,贝VE(yt)=0,则对AR(p)模型等号两边同时乘以
yt上(-k_1),两边取期望得:
E(ytytjJ=土卜少―)jEWt^ytjJ…•pE(yt_pytjJE(心…)
因为当期的随机干扰项与过去的时间序列值无关,所以:
E(;tyt上)=0。
因此,上式
可以化为:
G二】「丄2—'……
其中rk,表示k阶自协方差。
2.1.2移动平均模型的基本原理
1.MA模型的基本形式
MA模型的一般形式如下:
办=UJ」二2;2…乜2
其中,u为常数项,rc2…Jp为模型的系数,;t为白噪声序列。
我们称上述方程为q阶移动平均模型,记为MA(q)。
2、MA模型的可逆性
对于一个MA(q)模型:
yt=U•;t72宀22…Tq;tT
将其写成滞后算子的形式:
yt-u=(1,丄F2,qLq);t
若方程1••1L2•TqLq=0的根全部落在单位圆外,则称MA模型是可逆的。
可逆性可以保证MA模型可以改写成:
'■■(L)(yt-u^’
即MA模型可以转化为AR模型,同时可以保证参数估计的唯一性。
3、MA模型的数字特征
(1)均值
当q:
:
:
:
:
时,对于一般的MA(q)模型:
yt=U"^-tJ^2-t_2L入討_q
两边取期望,可得:
E(yJ=E(u•“;2I;t,*LVq;t^)二u
即一般的MA(q)模型的期望值即为模型中的常数项。
(2)方差
对MA(q)模型,两边取方差:
Var(yt)=Var(u•t:
:
勺;t」:
:
*2t_2•……为戈卫)=(1W-……V);『
(3)协方差函数
rk二Elyy上)=E[(u•上Tt」二t2•…F;t』)(uyT2丄V'…為化简可得:
匚2(1V2;;•川v:
),k=0k二F卞1•川启山),0你"
0,kq
2.1.3自回归移动平均模型的基本原理
1、ARMA模型的基本形式
ARMA模型的一般形式如下:
yt二C「2丫2一•;t二1;2二22一二p;tT
显然ARMA(p,q)模型可看成是AR(p)模型和MA(q)模型相结合的混合形式。
2、ARMA模型的平稳性和可逆性
对于一个ARMA(p,q)模型,
yt=C「1丫2「2人,…;t二1;tJ二22fp
将其写为滞后算子的形式:
(1一丄一\L2-1_一pLp)yt二c(1JL^L2LjqLq)t
两边同时除以(1-]L-;L2-L-\Lp)
其中:
叫)二
由此可以看出,ARMA模型的平稳性完全取决于AR(p)模型的参数,与MA(q)模型的参数无关。
类似地,ARMA模型的可逆性完全取决于MA(q)模型的参数,与AR(p)模型的参数无关。
3、ARMA模型的数字特征
(1)期望
对于一个一般的ARMA(p,q)模型两边同时取期望,化简得:
E(yJ=
(2)自协方差函数
厲=E(yty十)=E[(艺GJ)(无Gjflt*J]
<=0j=0
=E[.一Gi•_Gj;t_i;tk_j]i£j£
□0
=二2''GiGik
i£
第二节时间序列的相关性分析与平稳性
2.2.1时间序列的自相关系数
2.2.1.1自相关函数(ACF
1、AR(p)的自相关函数
在上一节中已经介绍了AR(p)模型的协方差函数满足下式:
rk=人―2「心'.……「p—
由于自相关系数坯二土,因此:
ro
人二1凡丄-2;k2……「P凡』
该式表示自相关系数满足p阶差分方程。
根据差分方程解的性质,上差分方程的通解可以写为:
p
珥k)八G
i=1
其中,Ci为任意不全为0的常数,是滞后多项式的反特征根。
根据平稳性的性质,
闊灯:
【。
从自相关系数的一般形式可看出,闻[:
始终不为0,但是随着滞后阶数的增加,自
相关系数慢慢逼近0,在图形上表现出一定的拖尾性。
2、MA模型的自相关函数
根据上一节推导的MA模型的自协方差函数的表达式,MA模型的自相关函数表示为:
1,k=0
0:
k_q
1V£•川応
0,kq
忙=丄=1Fl•川启/q4
截尾的。
3、ARMA模型的自相关函数
根据ARMA模型的自协方差函数,不难得到ARMA模型的自相关函数:
QO
■./为GjGi*
4=」=
k:
.
0、Gi2
i=0
由此可以看出,ARMA模型的自相关函数不具有截尾性。
事实上,ARMA模型若满足可
逆性,其形式相当于一个无穷阶的AR模型,因此自相关函数与AR模型一样具有拖尾性。
2.2.1.2偏自相关函数(PACF
1、偏自相关函数的定义
自相关函数卜;不能纯粹地表示霜与之间的相关性,两者的相关性还会受到:
辽-,亠..
;加护……■-的间接影响,为了单纯地表示.■与:
之间的相关性,这里引入偏自相关函数。
偏自相关函数表示在固定……沁I的情况下豁与聘出之间的相关性。
下面介绍
偏自相关函数Lhj的计算方法。
设序列yt可由下回归方程估计:
yt=时yti*人2yt2■IH■kk丄yt上1.yt±"a
根据回归方程的性质,式中估计系数翠慝即为偏自相关函数。
为了估计回归系数,采用
OLS方法,即
L=E(yt-k1ytl-'k2yt_2「kk丄yt_k_'kkytJk)达到取小。
对L关于各回归系数求偏导,可得到以下方程组:
:
:
1,2「HI'kk讥
:
2=k1i1:
%k2i0HI'kkik2
―k
k^■;k2'k^l--kk?
0
该方程组称为Yule-Wolker方程。
根据自相关系数,求解Y-W方程即可得到偏自相关系
数。
2、AR(p)的偏自相关函数
对于AR(p濮型,匕时,
Pk
l~e((耳+-粥)斤可▼g%%』尸
i=ij*
由于••与序列的滞后项无关,因此一:
7,且当
:
=打jP
"0,p1:
:
jEk
由此,AR(p)模型的偏自相关函数如愛在k>p后等于0,即AR(p)模型的偏自相关函数具有截尾性。
事实上,AR模型偏相关函数的截尾性也可直接从该模型的表达式看出。
AR(p)
模型实质上假设序列至多只与滞后p阶的值相关,因此偏自相关函数至多在p阶处非0。
3、MA(q)和ARMA(p,q)的偏自相关函数
由于MA(q)和ARMA(p,q)相当于无穷阶的AR模型,因此这两个模型的偏自相
关函数均不具有截尾性,而是拖尾性。
221.3ARMA模型自相关系数与偏自相关系数的估计与检验
根据以上分析,不同ARMA模型自相关系数与偏自相关系数的表现存在明显的差异。
表2.1给出了三类模型ACF与PACF的特征。
表2.1ARMA类模型ACF与PACF的特征
模型
自相关系数
偏自相关函数
AR(p)
拖尾
\p阶截尾
MA(q)
q阶截尾
拖尾
ARMA(p,q)
拖尾
拖尾
因此,我们可以通过观察偏自相关函数来识别并确定AR模型的滞后阶数,通过自相关
函数来识别并确定MA模型的滞后阶数q。
那么对于给定的样本数据,如何估计样本ACF与
PACF并从统计角度检验两者是否为0呢?
下面分别介绍ACF与PACF的估计与检验。
1、样本ACF与PACF的估计与实现
而言,样本自协方差表示为:
1T_k
%二百》侨一0如+厂刃
j=i
其中「表示样本均值。
那么SACF=.。
对于PACF主要是利用Yule-Wolker方程求解。
当滞后阶数较大时,Y-W方程直接计算较
难,目前多采用递推算法来求解。
2、样本ACF与PACF的显著性检验
ACF和
若序列满足独立性,则由统计渐进分布的有关定理可知,当样本个数充分大时,
PACF均满足均值为0,方差1/T的正态分布,即
因此若區|:
;[«匸,|轨「:
1.筠\匸,则可认为样本数据是独立的,即自相关系数
和偏自相关系数均不显著异于0。
该检验法即为正态检验法。
Portmanteau检验法是联合检验法,即检验直到k阶的自相关系数是否同时为0。
该检
验法使用Q统计量进行检验。
Q统计量具体形式为:
Q=T(T+2)》去
j=i
其中T为样本容量,k为设定的滞后阶数。
Q统计量服从诜I;;分布。
当Q统计量超过设定的临界值时,就拒绝原假设,即序列至少存在k阶以内的自相关性。
2.2.2时间序列平稳性检验
建立ARMA的前提是序列是平稳的。
检验平稳性常用的方法主要有三种:
经验法、自/
偏自相关系数法、单位根检验法。
1经验法
经验法是通过观察图形的方式来初步判断时间序列是否平稳的。
首先画出时间序列的
图形,如果该图形围绕某一直线上下以较小的幅度波动,则该序列一般是平稳的,否则是不
平稳的。
2、自/偏自相关系数法
由于ARMA模型的自/偏自相关系数要么是截尾的,要么是拖尾的,因此可以观察时间
序列的自/偏自相关图,如果时间序列的自/偏自相关系数从某个滞后期开始均与0无差异,可以认为该时间序列是平稳的;若自/偏自相关系数衰减很慢,且与0存在明显的差异,贝U时间序列是非平稳的。
3、单位检验法
常用的单位根检验法主要包括DF检验法和ADF检验法。
(1)DF检验法
DF检验包括三种形式:
%二九•;t
yt八ytvc;t
%二Lyt4ctt
其中,c为常数项,t表示线性趋势,随机干扰项独立同分布,且服从N(0,二2)。
根据平稳性的概念,若序列yt是不平稳的,则回归系数防辺。
一般乍:
〉1较易识别。
因此判断序列yt是否平稳,主要是判断是否为1。
如果]=1,则说明序列存在单位根,是不平稳的,否则是平稳的。
yi=yna
Lyt=ytc亠冷
.:
yt=yt二c亠Et;t
其中,,因此可以将DF检验的原假设和备择假设分别为:
H。
:
已:
:
、:
:
:
0
相应的统计量为:
P
DF=^—
std(p)
DF的形式与t统计量相似,但是该统计量并不服从t分布,Dickey和Fuller(1979)给
出了利用蒙特卡罗模拟方法模拟的临界值,因此该检验称为DF检验。
DF检验是左侧检验,
且不同形式的方程临界值是不同的。
注意DF检验只有当时间序列为AR
(1)过程时才有效。
如果存在高阶滞后相关,那么将违背随机干扰项独立同分布的假设。
因此,Dickey-Fuller提
出来ADF检验来弥补DF检验的不足。
(2)ADF检验
假设时间序列存在p阶自相关,那么用p阶自回归方程来判断单位根,形式为:
y^iyt丄;yt2申;t
上式两边同时减去yt,通过整理可得:
p丄
闷=讪丄、:
i"yt^■*
pp丄
其中,iT,S「-'j
i=±j=t-H
上述检验形式是在DF检验方程中加入了力的高阶滞后项,因此可以看成是DF检验的
增广形式,简称ADF检验。
与DF检验类似,ADF检验也存在三种形式,
p_L
•yt二讪1亠二':
.汇•寸
i士
p-L
"yt二cf、:
i3t丄"
i士
Pl
绍=c•、:
t•Tyt丄一二-i.-yt丄•t
i.1
不难看出,当p=1时,ADF检验就是DF检验,因此DF检验是ADF检验的特例。
检验的原假设和备择假设为:
Ho:
40
Hi:
匸:
:
:
0
即原假设为序列至少存在一个单位根,备择假设为序列不存在单位根。
使用ADF检验
时,应该注意如下几个问题:
首先,要确定合理的滞后阶数。
其次,因为检验统计量的临界值依赖于方程的形式,因此选择检验的方程形式很重要。
再者,如果检验的结果是拒绝原假设,那么原序列就不存在单位根,即原序列是平稳的;如果接受原假设,则序列是不平稳的,需要进行若干次差分,直到拒绝原假设,从而确定序
列单整的阶数。
例2.1以2003年2月到2010年4月上证国债(交易代码000012)月末收盘指数为原始数据进行分析。
首先对指数序列取对数,然后对这个收益率序列进行单位根检验,结果
如下:
表2.2上证综指收益率单位根检验表
NullHypothesis:
LSPhasaunitroot
Exogenous:
Constant,LinearTrend
LagLength:
0(AutomaticbasedonSIC,MAXLAG=11)
t-Statistic
Prob.*
AugmentedDickey-Fullerteststatistic
-2.027989
0.5777
Testcriticalvalues:
1%level
-4.068290
5%level
-3.462912
10%level
-3.157836
从检验结果来看,应该接受原假设,即认为该序列存在单位根。
第三节季节性ARMA模型
GDP、消费支出等。
它们
2.3.1时间序列的季节性
在现实中,存在一些经济时间序列具有明显的季节性,比如
具有共同的特点:
有规律,每年重复出现,表现为逐年同时期有相同的变化方向和大致相同
的变动幅度。
一般我们认为季节性是一种对数据的干扰,在数据分析中通常将其过滤。
那么
该如何识别时间序列的季节性。
常用的分析方法是自相关图分析法。
观察时间序列的自相关图,如果是月度数据,可以观察滞后期为12、24、36……的自
相关系数;如果是季度数据,可以观察滞后期为4、8、12……的自相关系数。
如果自相关
系数与0无差异,那么同月或者同季度之间不相关,即不存在季节性,否则该时间序列具有
季节性。
值得注意的是,若时间序列的趋势性较强时,这种趋势性会掩盖季节性,因此分析
季节性时,应该先消除时间序列的趋势性。
由于季节性是对数据的一种干扰,因此在数据分析中常常消除季节性。
常用的处理季节性的方法主要包括三种:
(1)移动平均法;
(2)用X-11方法去掉时间序列的季节性;(3)
采用逐期差分和季节差分,建立SARMA模型。
下面先简单介绍一下移动平均法和X-11方法,
再重点介绍SARMA模型。
1、移动平均法
移动平均法是将原时间序列的两个或多个时期的数据进行平均,用平均值代替原序列
值,以此来平滑周期性。
假设周期长度为s,则在时点t上的移动平均值可以表示为:
s丄
'%丄
MAt=広
s
2、X-11方法
X-11方法最初是由美国人口普查局在1965年研究开发出来的方法。
它的基本原理是滑动平均法法。
这种方法能适应各经济指标的性质,并根据季节调整的目的进行相应的调整及进行算法的选择。
X-11方法包括两种模型:
加法模型和乘法模型。
加法模型的基本形式为:
yt二人shU
乘法模型的基本形式为:
yt=TtStItDt
其中Tt为趋势循环要素,St为季节要素,It为不规则变动要素,Dt为周工作日变动要素。
常用的是乘法模型,但注意乘法模型仅适用于时间序列数据为正的情况。
例2.2以江苏省2001年1月到2009年12月的每月的社会消费品零售总额为原始数
据,进行季节性分析。
数据来源于中经网统计数据库。
数据的时间序列图如下。
从图中可以看出,该序列存在一定的周期性季节性变动。
采用X-11方法进行季节性调
整,结果如下:
SERIES0SA
从图中可以看出,经过调整,季节性因素与不规则因素得到了一定程度的消除。
2.3.2季节性ARMA模型
SARMA模型是在回归项中加入季节自回归项(SAR和季节移动平均项(SMA)来考虑
季节性的。
假设季节长度为S,则
SMA(q)(m)S的一般形式为:
yt-u=(1nL•pl2-VqLq)(i•PsLSrsL2S-rsLmS)t
其中q为一般移动平均项的滞后阶数,m为季节性滞后阶数。
SAR(p)(k)沖勺一般形式为:
(1一丄一2L2-1|1一pLP)(1—!
sLs—2sL2S-1|1一kSLkS)yt・I
S
SARMA的一般形式只需将SAR和SMA合并即可,简记为:
SARMA(p,q)(k,m)。
为了进一步理解季节模型的特点,以滞后两阶的AR模型为例,无季节性的AR
(2)模
型如下:
yt=c叽2%n;t
用滞后算子表示:
(1-丄-2l2)yt=c;t
对于带有季节性的季度数据,若k=1,则模型就会变成下式:
(1-丄-2L2)(1--L4)yt二c;t
它等价于:
yt=c「办」」2%丄一勺心」yt_6;t
因此该季节性AR模型实质上具有稀疏系数的更高阶AR模型。
SARMA模型的自相关系数与偏自相关系数与普通的ARMA模型类似,只是ACF和PACF
的计算需要计算滞后期分别为S2S……mS处的大小,性质与ARMA模型相同,即季节自回
归模型的季节偏相关函数按季节周期的增加而截尾;季节移动平均模型的季节自相关函数按
季节周期增加而截尾;混合的季节自回归移动平均模型的季节自相关函数和偏相关函数均按指数衰减。
例2.3引用例22的数据进行季节性分析。
为了便于分析,首先将数据取自然对数,然后进行差分去除趋势性。
下图是新序列的自相关图,结果如下:
1
1
]1
10.0790.079068310409
匚
a
匚:
1
2-0.211^0.2135613S0060
1
1
II
11
3O.OOS0.043562110.132
1
了
II
40.1410.094785860.097
|匸
1
1匚
il
5-0.106-0.1279.16390103
匚
J
匚
1
e-0.602-0.57550.9600.000
1匚
1
1
7-0119-0.T2952.6190.000
1
JI
匸
1
£0101-0.15953.8130.000
1[
1
9-0.027-0.07853.9000.000
匚
II
匚
1
10-0.233-0.29460.4190000
1
11
1
110,122-0.02762.2370000
1
|
1
ZI
120.7600.563133.OS0000
1
1
n
1301710284136.710,000
匚
1
t1
1
14-0.207-0.042142.000.000
1
]
11
1
150.019-0.042142.130.000
1
1
160.165-0.098145.630.000
1匚
1
1匚
1
17-0d41-0.132148220000
匚
1
1-
1
18-0.527-0.0271S4.5B0000
II
11
1ff;-0J420.0471S7.220.000
1
II
□l
200.1340.143189.640.000
1[
1
1
1i
21-0.0750038190.400,000
匚
1
1
(1
22-02210.015197.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 移动 平均 模型 解析