第20章平稳时间序列.docx
- 文档编号:10155885
- 上传时间:2023-02-08
- 格式:DOCX
- 页数:70
- 大小:78.17KB
第20章平稳时间序列.docx
《第20章平稳时间序列.docx》由会员分享,可在线阅读,更多相关《第20章平稳时间序列.docx(70页珍藏版)》请在冰豆网上搜索。
第20章平稳时间序列
©陈强,《高级计量经济学及Stata应用》课件,第二版,2014年,高等教育出版社。
第20章平稳时间序列
根据时间序列的随机过程特性,可分为“平稳序列”(stationary)与“非平稳序列”(non-stationary)两大类,需使用不同的计量方法。
20.1时间序列的数字特征
记随机变量y的观测值为{y1,
y2,,
yT},并假设为(严格)平稳过程。
故该序列的期望、方差等数字特征不随时间而变。
∑
T
期望μ≡E(y)反映序列的平均水平,用y≡1
T
t=1yt
来估计。
方差Var(y)反映序列的波动幅度,用1∑T
(y-
y)2来估计。
T-1
t=1t
定义时间序列{yt}的k阶自协方差(autocovarianceoforderk)
γk≡Cov(yt,
yt+k)=E[(yt
-μ)(yt+k
-μ)]
它反映同一变量(y)相隔k期之间的自相关程度。
对γk的估计值为“样本自协方差”:
γˆ≡
1∑T-k(y
-
y)(y
-
y)
kT-k
t=1
tt+k
定义时间序列{yt}的k阶自相关系数(autocorrelationoforderk)
ρ≡Corr(y,y
)≡Cov(yt,
yt+k)
ktt+k
Var(yt)
对于平稳过程,ρk不依赖于时间,仅是滞后阶数k的函数,故称为“自相关函数”(AutocorrelationFunction,简记ACF)。
将(k,
ρk)画成图,即为“自相关图”(correlogram)。
由于ρk
=ρ-k,
故一般只画自相关图的正半边。
对ρk的估计值为“样本自相关系数”:
ρˆk
≡γˆk
γˆ0
yt与yt+k之间的相关性可能由二者之间的变量{yt+1,,
yt+k-1}引起。
定义时间序列{yt}的k阶偏自相关系数(partialautocorrelationoforderk)为
ρ*≡Corr(y,y|y,,y)
ktt+kt+1t+k-1
即给定{yt+1,,
yt+k-1}条件下,yt与yt+k的条件相关系数。
k
ρ*只是k的函数,称为“偏自相关函数”(PartialAutocorrelationFunction,简记PACF)。
对以下k阶自回归方程进行OLS估计:
yt=β0
+β1yt-1++βkyt-k
+
εt
k
k
则βˆ就是“k阶样本偏自相关系数”ρˆ*。
20.2自回归模型对于样本数据{y1,
y2,,
yT},最简单的预测方法为AR
(1):
yt=β0
+β1yt-1+εt
(t=2,,T)
tε
εt为白噪声,E(εt)=0,Var(ε
)=σ2
,且无自相关。
假设β1
<1,则{yt}为渐近独立的平稳过程。
由于yt-1依赖于{εt-1,,ε1},而εt
与{εt-1,,ε1}不相关,故
yt-1与εt
不相关,OLS一致。
ε
但使用OLS将损失一个样本容量。
为提高估计效率,考虑MLE。
假设{εt}为iid,服从N(0,σ2)。
对方程两边取期望
E(y)=β0+β1E(y)
故{yt
}的无条件期望为
β0
1-β1
。
对方程两边取方差可得
Var(y)=β2Var(y)+σ2
1ε
ο2
故{yt}的无条件方差为ε。
故
1
1-β2
⎛βσ2⎫
y1~
Nç0,ε⎪
y1的其(无条件)密度函数为
⎝1-β11-β⎭
2
1
1⎪⎧-⎡y-(β(1-β))⎤2⎪⎫
f(y)=
exp⎨⎣101⎦⎬
ε
1
y11
⎩⎪2σ2(1-β2)⎪⎭
在给定y1的条件下,y2的条件分布为
yy~N(β+βy,σ2)
21011ε
其条件密度为
1⎧-(y-β-βy)2⎫
fyy
(y2
y1)=
exp⎨2011⎬
ε
21⎩
2σ2⎭
y1与y2的联合分布密度为
fy,y
(y1,
y2)=
fy(y1)fy|y
(y2|
y1)
12121
依次类推,yy
~N(β
+
βy
σ2),
t=2,,T。
tt-101t-1ε
整个样本数据{y1,
y2,,
yT}的联合概率密度为
fy1,,yT(y1,,
yT)=
fy1(y1)∏
T
t=2
fyt|yt-1(yt
|yt-1)
对数似然函数为
lnL(β
β,σ2;y,,y
)=lnf(y)+∑T
lnf
(y|y)
01ε1
Ty11
t=2
yt|yt-1
tt-1
代入fy1(y1)与
fyt|yt-1(yt
|yt-1)的表达式可得
11⎡y
-(β
(1-β
))⎤2
lnL=-ln2π-ln⎡⎣σ2(1-β2)⎤⎦-
⎣101⎦
-∑
22ε1
2σ2(1-β2)
ε
1
T-1
T-12
T(y-β-βy)2
-ln2π-
2
2lnσε
t01t-1
ε
t=22σ2
此估计量称为“精确最大似然估计量”(ExactMLE)。
如果T较大,第一个观测值对似然函数的贡献较小,可忽略。
考
虑在y1给定的情况下,{y2,,yT}的条件分布,则对数似然函数简化为
T-1
T-12
T(y-β
-βy)2
lnL=-
ln2π-
22
lnσε
t=2
t01t-1
ε
2σ2
-∑
2
此估计量称为“条件最大似然估计量”(conditionalMLE)。
为使上式最大化,须让右边第三项的分子最小化,
min
{β0,β1}
其结果与OLS一样。
T
∑
t=2
(yt
-β0-β1
yt-1)
更一般地,考虑AR(p):
yt=β0
+β1yt-1++βpyt-p
+
εt
对AR(p)的估计与AR
(1)类似。
在使用“条件MLE”时,考虑在给定{y1,,
yp}的情况下,
{yp+1,,
yT}的条件分布。
由于条件MLE等价于OLS,而后者并不依赖于正态性假定,故条件MLE的一致性也不依赖于正态性假定。
如何估计pˆ?
方法一:
由大到小的序贯t规则(general-to-specificsequentialt
rule)。
设最大滞后期pmax,令pˆ=pmax进行估计,并对最后一个滞
后期系数的显著性进行t检验。
如果接受该系数为0,则令
pˆ=
pmax
-1,重新进行估计,再对最后一个滞后期的系数进行t检
验,如果显著,则停止;否则,令pˆ=
pmax
-
2;以此类推。
方法二:
使用信息准则,选择pˆ使得AIC,BIC或HQIC最小化,分别记为pˆAIC,pˆBIC与pˆHQIC。
比如,
minAIC≡ln(e'eT)+
p
其中,e'e为残差平方和。
2(p+1)
T
20.3移动平均模型
另一类时间序列模型为“移动平均过程”(MovingAverageProcess,简记MA)。
一阶移动平均过程为MA
(1):
yt=
μ+εt
+θεt-1
{εt}为白噪声,εt的系数被标准化为1。
使用条件MLE估计。
ε
假设{εt}为iid,且服从N(0,σ2)。
如果已知εt-1,则
ytε
t-1~
N(μ
+θε
t-1
σ2)
ε
假设ε0
=0,则可知ε1=
y1-μ。
给定ε1,则可知ε2
=y2
-μ-θε1。
以此类推,使用公式“εt
=yt
-μ-θεt-1”计算出全部{ε1,ε2,,εT}。
给定ε0
=0的条件,可写下样本数据{y1,
y2,,
yT}的似然函数。
q阶移动平均过程,记为MA(q):
yt=
μ+εt
+θ1εt-1+θ2εt-2
++θqεt-q
也可以进行条件MLE估计,即在给定“ε0
=ε-1
==ε-q+1
=0”的
条件下,最大化样本数据的似然函数。
20.4ARMA
将AR(p)与MA(q)结合起来,得到ARMA(p,q):
yt=β0
+β1yt-1++βpyt-p
+
εt
+θ1εt-1++θqεt-q
{εt}为白噪声。
给定{y1,,
yp}与“ε0
=ε-1
==ε-q+1
=0”,可进行条件MLE估计。
如何用数据来估计(pˆ,qˆ)?
先考察数据的自相关函数(ACF)与偏自相关函数(PACF),以判断是否存在p=0或q=0的情形。
如果p=0,则为MA(q):
yt=
μ+εt
+θ1εt-1+θ2εt-2
++θqεt-q
如果j
>q,则Cov(yt,
yt-j)=0,因为产生yt的扰动项{εt,εt-1,,εt-q}
与产生yt-j的扰动项{εt-j,εt-j-1,,εt-j-q}无交集。
对于MA(q)模型,ACF函数在j>q时都等于零,出现“截尾”。
另一方面,AR
(1)的ACF函数呈指数衰减,称为“拖尾”(tailsofftozero),不存在截尾。
如果q=0,则ARMA(p,q)简化为AR(p)模型:
yt=β0
+β1yt-1++βpyt-p
+
εt
假设真实模型为AR(p),却用OLS来估计AR(p+1),即
yt=β0
+β1yt-1++
βpyt-p
+βp+1yt-p-1+εt,则plimβˆp+1
T→∞
=0,因为
βp+1
=0。
而βˆp+1正是对(p+1)阶偏自相关函数的估计。
对于AR(p)模型,PACF函数在j>
p时都等于零,即出现截尾。
另一方面,MA(q)模型的PACF函数逐渐衰减,拖尾,不存在截尾。
总之,对于AR(p)模型,其ACF函数拖尾,而PACF函数截尾。
如出现这种情形,可判断为AR(p)。
对于MA(q)模型,其ACF函数截尾,而PACF函数拖尾。
如出现这种情形,可判断为MA(q)。
如果以上两种情形均不符合,则考虑一般的ARMA(p,q)模型,其中p,q均不为零。
Box,JenkinsandReinsel(1994)认为,对大多数情况,p≤
2与q≤2
就足够了。
可让pmax与qmax更大些,使用信息准则或序贯t规则。
在估计模型之后,需进行诊断性分析,以确定ARMA(p,q)模型的假定是否成立。
最重要的假定是,扰动项{εt}为白噪声。
如果模型过小,即pˆ<
p或qˆ
动项出现自相关,不再是白噪声。 可使用Q检验来检验模型的残差是否存在自相关。 如果残差存在自相关,应考虑使模型更大些,重新对模型进行估计,再检验新模型的残差是否为白噪声,如此反复。 20.5自回归分布滞后模型 在自回归模型中,可引入其他变量构成“自回归分布滞后模型” (AutoregressiveDistributedLagModel,简记ADL(p,q)): yt=β0 +β1yt-1++βpyt-p +γ1xt-1++γqxt-q + εt 例记通货膨胀率为πt,失业率为unt,预测模型为 ∆πt =β0 +β1∆πt-1+β2∆πt-2 +β3∆πt-3 +β4∆πt-4 +γ1unt-1+εt 此ADL(4,1)为经验菲利普斯曲线(empiricalPhillipCurve)。 如果γ1 <0,则失业率越低,物价越有上涨的压力;而通胀的调整 也受到过去通胀变化的滞后作用。 可引入更多解释变量。 比如,共有K个解释变量{x1t,, xKt},其 中第j个解释变量xjt共有qj个滞后值被包括在模型中,j =1,,K: yt=β0 +β1yt-1++βpyt-p +γ11x1,t-1++γ1q x1,t-q+ +γK1xK,t-1++γKqxK,t-q 11 + KK εt 如果自回归分布滞后模型满足以下假定,则可用OLS来估计。 (i) E(εt |yt-1, yt-2,, x1,t-1, x1,t-2,, xK,t-1, xK,t-2,)=0。 此假定类似 于严格外生性假设,意味着扰动项εt与所有解释变量的整个历史全部无关。 这保证了对滞后期(p,q1,,qK)的设定是正确的。 如果滞后期设定不正确,比如,真实模型还应该包括yt-(p+1),但βp+1yt-(p+1)却被纳入εt中,则εt便与解释变量相关,导致OLS不一致。 (ii){yt, x1t,, xKt}为渐近独立的平稳序列。 (iii){yt, x1t,, xKt}有非零的有限四阶矩。 (iv)解释变量无完全多重共线性。 对滞后期数的选择可使用信息准则,或使用t,F检验来检验最后一期系数的显著性。 更一般地,可以在ARMA模型中引入其他变量,称为“ARMAX”模型。 20.6ARMA模型的Stata命令及实例 20.7误差修正模型 从经济理论而言,变量之间可能存在长期均衡关系,而变量的短期变动为向这个长期均衡关系的部分调整。 “误差修正模型”(ErrorCorrectionModel,简记ECM)正是这一思想在计量的体现。 考虑AR (1): yt=β0 +β1yt-1+εt β1<1,故{yt}为平稳过程。 对方程两边求期望,令长期均衡值y* =E(y )=E(y ),可得 y*= β0 1-β1 tt-1 将β0=(1-β1)y代入原方程,并在方程两边减去yt-1可得 * ∆y=(1-β)y*-(1-β)y+ε t11 t-1t ∆y=(1-β )(y*-y)+ε t1 t-1t errorcorrection AR (1)的误差修正模型,将∆yt表达为对长期均衡的偏离(y*- 的部分调整(即误差修正),加上扰动项。 yt-1) 考虑ADL模型: yt=β0 +β1yt-1+γ0xt +γ1xt-1+εt β1<1。 假设经济理论认为(y, x)之间存在长期均衡关系y =φ+θx。 方程两边求期望,令y* =E(y)=E(y),x*=E(x)=E(x ),可得 tt-1tt-1 y*=β +βy*+γx*+γx* 0101 (1-β)y*=β+(γ+γ)x* 1001 y*=β0 +(γ0 +γ1)x* 故φ= β0,θ =γ0 +γ1 。 (1-β1)(1-β1) 1-β11-β1 θ称为“长期乘数”(long-runmultiplier),衡量当x永久性地变化一单位时,导致y的永久性变化幅度。 β0=(1-β1)φ,γ0 +γ1 =(1-β1)θ。 在方程两边减去yt-1,并在方程右边加上、减去γ0xt-1: ∆yt =β0 -(1-β1)yt-1+γ0(xt -xt-1)+(γ0 +γ1)xt-1+εt 代入β0 =(1-β1)φ,可得 ∆yt =(1-β1)φ -(1-β1)yt-1+γ0∆xt +(γ0 +γ1)xt-1+εt 代入γ0 +γ1 =(1-β1)θ,则有 ∆yt =γ0∆xt +(β1-1)(yt-1-φ-θxt-1)+εt errorcorrection (β1-1)(yt-1-φ -θxt-1)称为“误差修正项”(errorcorrectionterm)。 {φ,θ}为长期参数,{γ0,β1-1}为短期参数。 ECM的形式看似非线性,但仍是线性回归,可把它还原为ADL 模型,用OLS来估计。 20.8MA(∞)与滞后算子 MA(q)的自相关函数(ACF)存在截尾。 如果希望自相关系数永远不为0,可考虑MA(∞): 其中,θ0 =1。 yt=μ ∞ +∑ j=0 θjεt-j 无穷多个随机变量之和,能收敛到某随机变量吗? 一个充分条件是,序列{θ ∞ } jj=0 为“绝对值可加总”(Absolutely j=0 Summable,简记AS),即∑∞ θj<∞(有限)。 在AS的条件下,不仅MA(∞)有定义,而且是弱平稳过程;如果{εt} 为iid,则MA(∞)严格平稳。 时间序列分析常引入“滞后算子”(lagoperator)。 定义Ly=y ,L2y=L(Ly)=y ,…,Lpy=y 。 特别地, tt-1 ttt-2 tt-p L0y=1⋅y=y。 ttt 滞后算子的运算相当于幂函数。 比如,Lp ⋅Lq =Lp+q。 由于∆yt =yt - yt-1 =(1-L)yt,故差分算子∆≡1-L。 对于AR(p),yt =β0 +β1yt-1++βpyt-p + εt,可用滞后算子表示: y=β+βLy++βLpy+ε t01tptt 移项可得 y-βLy--βLpy=β+ε t1tpt0t 向右提取公因子yt (1-β1 L--β Lp)y =β0 + εt pt 定义“滞后多项式”(lagpolynomial)β(L)≡1-β1 L--β Lp,则 p β(L)yt =β0 + εt 如果存在β(L)-1,则可以在两边左乘β(L)-1,得到AR(p)的“解”。 12 定义对于任意一个实数序列(α0,α1,α2,),定义其对应的滤波 (filter)为α(L)=α0 +αL+αL2 +。 命题假设{xt}为弱平稳过程,序列{θ ∞ } jj=0 为绝对值可加总(AS), 则yt=α ∞ +∑ θ j=0 jxt-j=α ∞j +∑ Lx θ j=0jt 有定义,且为弱平稳。 进一 步,如果{xt}为iid,则{yt}严格平稳。 定义对于两个滤波“α(L)=α+αL+α L2+”与 012 “β(L)=β+βL+βL2+”,定义其乘积为 012 δ(L)≡α(L)β(L)≡(α+αL+αL2+)(β+βL+β L2+) 012012 =αβ+(αβ+αβ)L+(αβ+αβ+αβ )L2+ 000110201102 滤波的乘积满足交换律。 最感兴趣的情形是δ(L)=1,即令上式的常数项α0β0为1,而其余各项的系数均为0。 称β(L)为α(L)的“逆”(inverse),并记为α(L)-1。 只要α0≠0,则α(L)-1都有定义且唯一,因为可以得到满足 α(L)β(L)=1的唯一解(β0,β1,β2,),即β0=1α0,β1=-α1β0α0,等等。 例(1-L)-1 =1+L+L2 +L3+ 证明: (1-L)(1+L+L2 + L3 +)=1。 但(1-L)-1不再是AS。 例(1-βL)-1 =1+βL+β2L2 +β3L3+ 证明: 将上例中的“L”换成“βL”即可。 如果β 为AS。 <1,则(1-βL)-1 命题对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 20 平稳 时间 序列