基于APF算法的贝叶斯金融厚尾MSSV模型研究.docx
- 文档编号:9510627
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:23
- 大小:29.33KB
基于APF算法的贝叶斯金融厚尾MSSV模型研究.docx
《基于APF算法的贝叶斯金融厚尾MSSV模型研究.docx》由会员分享,可在线阅读,更多相关《基于APF算法的贝叶斯金融厚尾MSSV模型研究.docx(23页珍藏版)》请在冰豆网上搜索。
基于APF算法的贝叶斯金融厚尾MSSV模型研究
基于APF算法的贝叶斯金融厚尾MSSV模型研究
第24卷第9期
V01.24No.9
统计与信息论坛
Statistics&InformationForum
20o9年9月
Sep.,2009
【统计理论与方法】
基于APF算法的贝叶斯金融厚尾MSSV模型研究
朱慧明,郝立亚,曾惠芳
(湖南大学工商管理学院,湖南长沙410082)
摘要:
针对金融时间序列普遍具有的波动聚集性和厚尾特征,将对风险管理尤为重要的一些极端点纳入
模型之中,构建厚尾马尔科夫转移随机波动模型,采用带辅助变量的粒子滤波算法对波动和潜在状态进行预
测,并估计模型参数.由于t分布与正态分布的特殊关系,通过选取不同自由度进行仿真分析,研究发现
MSSV—t模型较一般MSSV模型对于消除波动持续性参数的高估问题更加有效.结合对中国上证综指股
价波动的实证研究,证明了基于APF算法的MSSV-t模型在潜在波动状态的预测及突发事件的探测方面具
有优良的性质,同时具备提高波动预测精度的能力.
关键词:
时间序列分析;贝叶斯推断;MSSV模型;APF;仿真
中图分类号:
F064.1:
012.8文献标志码:
A文章编号:
1007—3116(2009)09—0003—08
一
引言
金融理论和实践的研究过程中,随机波动模型
(StochasticVolatility,简称SV)得到越来越多的关
注.与条件异方差模型不同,随机波动模型将波动
视为一个独立的潜在随机过程,以此解释金融时间
序列所表现出的各种特征[卜.在金融经济领域,
由于突发事件的影响,时间序列的波动常常在不同
的水平聚集.S0和Eraker等于1998年对该现象进
行了研究,并且指出这种波动的聚集性可以用一个
潜在的马尔可夫过程进行较好的刻画,从而提出了
马尔可夫转化随机波动模型(MarkovSwitching
StochasticVolatility,简称MSSV)[3-5JoMadhu和
Raul将其应用在对短期汇率行为的解释方面,取得
较为理想的结果6.但是,作为基本SV模型的拓
展,MSSV模型在刻画金融时间序列其他特性时具
有诸多局限.因此,Roberm令观测方程的信息服从
厚尾分布,将MSSV模型进行了拓展.信息的厚
尾分布可以将观测量的极值纳入模型,对风险管理
具有重要的意义.
MSSV模型中具有两个潜在变量,分别为波动
变量和状态变量,它们反映了观测序列中的有效信
息.由于模型中潜在变量的存在以及模型在状态空
间的非线性结构,使得无法得到模型的解析形式.
随着计算机技术的发展,抽样模拟技术越来越成熟,
状态空间为非线性非高斯的模型估计成为可能.在
贝叶斯方法的基础上,发展了两种应用广泛的抽样
仿真技术,一种是马尔可夫链蒙特卡洛方法
(MarkovChainMonteCarlomethod,简称MCMC),
Gibbs抽样方法是其中最简单也是应用最广泛的一
种抽样方法,然而Gibbs抽样方法对模型和参数的
设定有较大的依赖性,且不适用于在线数据(on—
linedata).
针对在线数据的时变性以及序贯特点,发展了
另外一种抽样模拟技术,即序贯马尔可夫方法(Se—
quenti~MarkovChain,简称SMC)oDoucet和de—
Freitas等深入讨论了SMC方法的理论和应用,特
别介绍了其中应用较广的粒子滤波算法J.为了
克服一般粒子滤波算法具有的退化现象,Pitt和
Shephard引入了辅助变量粒子滤波算法(Auxiliary
收稿日期:
2009—04—15;修复日期:
2009—07—08
基金项目:
国家自然科学基金项目《随机波动预测模型的贝叶斯分析及其在金融领域中研究》(70771038);教育部人文社
会科学规划项目《时间序列计量经济模型的贝叶斯分析及其应用研究)(063AglO001)
作者简介:
朱慧明(1966一),男,湖南湘潭人,教授,博士生导师,研究方向:
贝叶斯计量经济模型;
郝立亚(1983一),女,河北邯郸人,博士生,研究方向:
金融工程与风险管理.
3
统计与信息论坛
ParticleFilter,简称APF)并应用于SV模型的波动
估计,显示了该算法相对于其他模拟型算法的优越
性并且指出该算法具有对异常点的优秀探测能
力【9J9.Liu和West提出使用参数后验分布的核密
度估计作为更新粒子的重要性密度函数,以保证估
计的收敛性,从而解决了APF算法的参数估计问
题[1oI.
粒子滤波方法在国内也得到了广泛的关注和研
究,杨小军和潘泉等在Bayes框架内分析了序贯重
要性采样原理,总结了粒子滤波器发展过程中的各
种改进策略和新变种,讨论了粒子滤波器在各个领
域的应用及进展[11].卢发兴,吴玲对比分析了卡
尔曼滤波和粒子滤波各自的优缺点,为实际应用中
算法的选择提供依据[12J.而对于APF算法,目前
只有程水英和张剑云采用该算法解决空对海BO—
TMA中的非线性滤波问题,并通过仿真实验说明其
具有良好的非线性滤波估计性能u.
本文主要研究厚尾MSSV模型,将厚尾分布设
定为t分布,构建MSSV—t模型,采用APF算法估
计模型参数,预测波动及潜在波动状态,通过自由度
的变化与MSSV模型进行比较分析.在仿真分析
的基础上,对中国上证综指股价波动进行实证研究,
证明基于APF算法的MSSV—t模型在潜在波动
状态的预测及突发事件的探测方面具有优良性质,
同时具备提高波动预测精度的能力.
二,模型结构分析
Taylor于1986年指出,波动过程的原动力是经
济突发事件而不是价格的走势[¨].在此基础上,
Shephard定义了SV模型的一般表达形式为[]:
fyt=exp(7Jt/2)e,£f~i.i.N(0,1)
(1)
【vt=口+触一l+,qt~i.i.aN(O,-C2)
(2)
其中,Yt为t时刻的观测变量,为波动的对数形
式,且与条件独立.£和为误差项,且分别服
从方差为1和r的独立正态分布.口和J9代表波动方
程中的参数项.
在一般SV模型的基础上,令S代表潜在波动
状态,其状态空间定义为{1,2,…,H},设其服从转
移概率为P舀=Pr(&:
IS卜l=i)的一阶马尔可
夫过程.在波动方程的截距项中引入服从一阶马尔
可夫过程的状态变量S,将一般SV模型的式
(2)转
化为式(3)的形式,与式
(1)共同组成MSSV模型的
一
般表达式.
4
~ot=+£一1十r/t,r/t~N(0,r)(3)
此处,r/t互相独立同分布.由于金融时间序列存在
波动的群集性特征,MSSV模型在刻画突发事件对
波动的影响方面优于一般SV模型.然而该模型在
刻画金融时间序列其他特性时具有诸多局限,如对
新息的正态性假设使得对风险管理尤为重要的一些
极端点被忽略,从而成为该模型的一个主要缺
陷[16].考虑到厚尾分布对极端值的描述能力,令观
测方程的新息服从t分布,构建了MSSV—t模型,
可以克服一般MSSV模型对极端点的拟和失效问
题.同时,由于t分布以自由度为中介与正态分布相
联系,通过选取不同的自由度,可以不断逼近正态分
布,从而对MSSV—t模型和MSs,,模型进行对比研
究.
MSSV—t模型主要描述波动的波动聚集性和
厚尾特征,模型的基本形式如下:
f(I)~(Yt10,ev,)
【(£J7.1卜.1,Sf)~N(£laj+£一1,r)
t=1,2,…,丁(4)
其中(Yt10,eVt)代表一个t分布的密度函数,定
义为
(Ytl0,ev,)
:
(1+;xp(Vt)))r(/2)~/
torexp()…一~
(5)
此处S代表潜在波动状态,它直接影响波动水平参
数的取值,而的取值决定波动的水平进而表
现为观测值的变化,这是该模型的作用机理.参数卢
反映了波动的持续性,LamoLlreux和Lastrapes指出
正是由于对不同波动水平聚集性的忽略使得对的
估计存在高估的可能[17].Carlos和Hedibert对西班
牙股票市场的实证分析中指出在随机波动模型中引
入服从马尔可夫转换的状态变量可以使得对值的
估计小于一般模型的估计值,从而展现了该模型的
优越性[儒].故值的估计精度从一定程度上可以作
为评判模型优劣的一个重要指标.代表t分布的自
由度,选取t分布作为厚尾特征的刻画分布主要是
由于t分布可以通过自由度与正态分布产生联系,
即当,c一00,t分布即为正态分布.在实际操作中,
=
30时则可以近似服从正态分布.利用这一关系,
可以对MSsV—t模型和MSSV模型进行对比研究.
为了方便起见,假设代表模型中的潜在变
量,即=(&,),其他参数均表示为.对该模型
朱慧明,郝立亚,曾惠芳:
基于APF算法的贝叶斯金融厚尾MSSV模型研究
的分析也即对波动变量和状态变量的预测以及参数
的估计.估计参数时,采用Hamilton的方
法[],将转化成式(6)所示的形式:
土
=1+(6)
此处>0,J:
=2,3,…,h,为示性函数,当
S≥时,=1,否则,/j=0.由于参数在取值
范围上的限制,故对其进行估计时,将其转化为
log(p/(1一P的形式.
三,APF算法设计
随着金融业和计算机信息技术的发展,金融市
场上的时间分割越来越小,信息反应越来越灵敏,这
造就了大量的在线数据.对于时变的市场状况,利
用MCMC算法进行估计时,每次运算都基于整体数
据,这无论在运算量上还是在灵敏度上都达不到实
际操作的要求.Carlos和Hedibert也在其研究中指
出,由于在实践过程中往往需要根据最新信息做出
即时的判断引,故基于整体数据的统计方法在实践
应用中总是失效的.然而,SMC算法基于序贯分析
的思想,当接收到新的数据时,可以及时反映到模型
中并提取其中的有效信息,对模型参变量进行更正
估计.因此该方法较MCMC方法具有灵敏度高,运
算量小,估计精确等优点,具有较高的实践意义.
作为SMC中的一种重要算法,APF算法可以
用来估计类似MSSV-t模型的非线性非高斯状态
空间模型,其核心思想是粒子权重的不重复抽样.
对于模型的未知参数0,一个常规的处理方法是将
其视为潜在变量,但是由于参数对于时间变化的
固定性会使得粒子权重产生退化现象.APF算法
借助于一个辅助变量来实现粒子权重的不重复抽
样,有效地克服了退化问题.
当观测值yt+1已知时,给定粒子集合{z,,
;},利用Chapman—Kolmogorov方程和蒙特卡洛
近似方法,可以得到如下潜在变量和参数的联合后
验分布的形式:
p(sct+1,Ot+1I1:
l+1)
声(+】IXt+1,Y1:
£;)p(x£+I'+】IY1:
)
p(+1I1:
)
屯+1;+1)p(xH1I+1,l:
)P(+1I1:
)
(M+1JJ:
£)
OC(+1IXt+1;+1)p(x£+1I+I'1:
£)(+1Iyl:
£)
N
≈
∑(+lI+1;+1)p(sc+1I五i,Ot+1)N(+1Imi,f=1
b)(7)
最后一步的结果采用Liu和West的高斯转移密
度函数定义方法[,以保证估计的收敛性,防止参
数估计过程中的高度分散.其中
=
∑硼
(一)
(一)
=口+(I—a)Ot
=
∑砌
为t时刻第i个粒子的权重,a和b均为超参数值.
设g∈{1,2,…,N}为辅助变量,用来实现粒子权
重的不重复抽样,则包括辅助变量的联合后验分布
的形式如下:
p(x£+1,Ot+1,glyl:
£+1)
=P(+1If+1)(z+1J西,+1)(+1Jmf,
b)(8)
而重要性密度函数的形式为
q(xf+1,Ot+l,glYl:
t+1)=P(yt十1Ig+1;
mf)p(Xt+1I西,+1)N(Ot+1Im,b)(9)
根据重要性密度函数更新权重,得到新的权重
形式为:
i∞
畿
p(+1Ii+1;+1)户(+1I,+1)N(+1Im,6v)
p(+1I1;m)p(+1I,+1)N(+IIm,b2)
:
(10)
P(+1I1;mf)
针对MSSV—t模型,假设已经得到初始化的粒
子集{z,,}1,设计出如下APF算法进行模型
拟合分析.
步骤1计算各参数初始粒子均值以及波动
分布参数和{m}..
步骤2计算下一时点的状态中问变量
+1}1和波动中间变量{;+1}l,此处i+1=
S
t+.+,s+船(St+ls;).
步骤3按如下的抽样方法,依次更新{g},
{+1}l,{汁i1}1和{i+1}l:
1.从辅助变量分布P(=z)OCP(yt+1I+1,
m)中抽取{}l,其中z∈1,2,…,忌
2.从参数高斯后验分布N(,6.)中抽取
{+.}.
3.从转移概率后验分布P(i+1I.)中抽取
5
统计与信息论坛
{i+}1.
4.从潜在波动变量后验分布N(口++1,
(Z.2)1)中抽取{i+1}l.
步骤4更新粒子权重{川i}.,更新方法为
?
.c
Pm(+1I1;£)
步骤5重复步骤1~4步,直到训练完所有的
观测值.
四,仿真分析
注意到t分布与正态分布的特殊关系,即当t
分布的自由度趋于无穷大时,可以近似服从正态分
布,因此可以采用不同自由度的值进行对比分析,从
—
个新的角度对基于APF算法的MSSV—t模型
和一般MSSV模型进行模型比较.为了具有对比
性,采用的是Carlos和Hedibert【18J,ROberto【7J以及
S0和Lain等[0]所共同采用的一组参数值进行数据
模拟,参数值见表1.首先模拟1000个样本量,在
采用APF的方法迭代时,每次迭代取1000个粒子
值.假设状态变量服从二阶马尔可夫过程.超
参数口=0.824,b=0.566.超参数的选取以及所有
参数的先验分布均符合Jeffrey先验分布准则.
首先对自由度为2的典型MSSV—t模型进行
基于APF算法的波动预测及参数估计.图1描述
了模拟数据的状态变量S的真实值,图2综合了观
测数据和波动的预测数据.两个图形对比可以看
出,由于状态变量S的变化是观测数据波动的主要
原因,故两者的变化保持一致,而通过APF方法得
到的波动估计值基本可以反映这种内在的一阶马尔
可夫过程.
一
状态真实值
0200400600800l000
观测样本量
图1模拟数据的状态变量St图
APF方法一个主要优点即在于它可以克服一
般粒子滤波普遍存在的退化现象.衡量退化现象的
一
个重要的指标为有效样本量ESS,计算ESS的公
式为:
N(11)
此处W为更新后的样本权重.采用式(11)计
算MSSV—t模型的有效样本量,结果如图3所示.
显然,对于每次迭代所抽取的有效粒子绝大部分都
保持在800以上,故该方法有效地克服了粒子退化
问题.
图2模拟的观测数据和波动的估计值U~图
U2004006008001000
观测样本量
图3APF算法估计MSSV—t模型的
有效样本量图
利用APF算法对自由度分别为2,8,15,30的
四个MSSV—t模型进行参数估计,表1给出了各
个模型参数的真实值以及APF算法估计值.由于
t分布和正态分布的特殊关系,当自由度取30时,
可以近似认为是正态分布.
表1四组模拟数据的APF参数估计值表
容易看出,随着自由度取值的增大,a1,2等参
数的估计值较接近真实值,而参数的估计值反而
越来越偏离真实值,并且正向高估.参数卢在随机
波动类模型中描述波动的持续性.对于金融时序数
据,条件异方差模型和随机波动模型的拟合都显示
出了高度的波动持续性,即值趋近于1.Lam—
oureux和Lastrapes在1990年的研究中指出由于拟
合模型对波动过程中结构差异的忽略会导致这种波
动的高度持续性存在着高估的可能,MSSV模型的
提出正是基于这一思路u'.本文通过对MSSV模
型进行拓展,采用APF方法进行模型估计,模拟结
朱慧明,郝立亚,曾惠芳:
基于APF算法的贝叶斯金融厚尾MSSV模型研究
果指出对于厚尾数据的拟合采用MSSV—t模型可
以更为精确的对波动持续性参数卢进行估计,从而
更为合理地解释高频数据的波动特征.
值得说明的是,对于自由度为2的厚尾数据,
APF方法对波动的预测较为平缓,这是由对马尔可
夫状态变量的估计偏差造成,但是总体上依然可以
观测样本量(df=2)
反映状态变量的转移变化.图4列出APF方法对
不同自由度的厚尾数据的波动估计值以及相应的真
实值.可见除了自由度为2的极端厚尾分布,APF
方法基本上可以捕捉到信息的变化,并通过状态变
量的一阶马尔可夫过程反映为波动的变化,对于突
发事件引起的异常变化具有良好的过滤筛选能力.
o200400600800looo
观测样本量(df=8)
020*********
观测样本量(df=30)
图4不同自由度模拟数据的波动估计值及真实值图
五,实证研究
采用MSSV—t模型来拟合中国上证综指的股
价波动,运用APF方法进行波动预测和潜在状态变
量以及相关其他参数的估计.数据样本的选取为
2002年1月4日至2008年11月21日,共1664个
观测值.在此区间,中国股市经历了多次熊市和牛
市之间的转变,而其中的一些重大突发事件如汶川
大地震以及美国次贷危机的发生都会造成股价的剧
烈波动.由于股票市场上存在不同水平的波动的聚
集现象,故可采用两阶段马尔可夫潜在状态变量来
描述这种高水平的波动和低水平的波动的聚集.此
外,大量的历史数据表明中国股市具有明显的尖峰
厚尾的特性,可将MSSV模型推广为MSSV—t模
型来拟合中国股市的股价波动.采用APF算法对
该模型进行估计,波动的预测值和观测时间序列的
对比图如图5所示,容易看出,该模型估计得到的波
动值与观测时间序列的变化具有一致性,可以反映
其内在的波动特征.图6直观给出对潜在状态变量
的估计图以及对应于观测时间序列的区间段,潜在
状态变量将波动状态进行了具体的划分,并且该划
分对英语观测时间序列的波动情况具有相合性.表
2对观测时间序列的各个区间段的标志事件进行了
说明,由此可见,基于APF算法的MSSV—t模型
在区分波动的潜在状态方面具有优良的性质,从而
可以准确地刻画波动的特征.
1/4/o21/2/o31/2/o41/4/o51/4/o61/4/o71/2/o8l1/21/o8
观测时间
图5上证综指观测数据和波动的预测值图
上证综指
观测时问
状态援嗣值
图6模型潜在状态预测图
为了进一步说明MSSV—t模型对波动的预测
精度,提取处于第二状态阶段的2006年10月至
2008年11月,对应实际情况对其波动预测值进行
7
统计与信息论坛
研究.与中国宏观形势的强劲走势保持同步,从
2006年7月开始至2007年12月,中国股票市场得
到了飞速的发展,2007年上证综指最高点较年初上
表2各区间段中国股市标志事件表
时间事件
2002年6月国有股减持停止
2002年12月中国QFII制度正式启动
2003年4月卫生部举行新闻发布会公布非典情况
2005年5月股权分制改革启动
2005年11月新证券法颁布,中小企业完成全流通
2..6年.月裹兽詈为全球最大P0在沪
涨2倍,沪深总市值突破30万亿.对于诸如股票市
场的风险投资而言,高收益意味着高风险,而高风险
的内因就是高水平的波动特征.在2007年的牛市
行情之下,宏观调控成为影响股指波动的重要原因.
如2007年5月30日,财政部宣布,即日起将证券交
易印花税上调至0.3%,沪深股市该日跌幅达6%以
上,两市跌停的个股超过900只.2007年年末,随
着房贷新政出台,准备金第十次提高,第六次加息.
上证综指12月18日下跌至4812.16点,大盘近两
个月的调整幅度为21.97%,超过了"5?
30"时
21.47%的调整幅度.进入2008年以来,随着美国
经济的持续衰退,全球金融市场状况不断恶化,加之
自然灾害等突发事件的影响,也使得这一期间内中
国股市处于高水平的波动状况.如2008年1月23
观测样本量
alpha1
日,美联储紧急降息75个基点;5月1213,四川汶
川县发生7.8级灾难性地震,余震波及全国,至晚问
统计死伤人数8000余人;9月8日,两房被美国政
府全面接管,次贷危机进一步升级等.这些突发事
件对中国股市的波动影响均在图7中有所体现.
图7上证综指波动预测与大事件对比图
由此可见,采用基于APF算法的MSSV—t模
型可以较好地拟合上证综指的样本数据,能准确把
握由于突发事件而引起的波动的变化,对不同潜在
状态的转移进行了有效的区分和刻画,在提高波动
的预测精度方面具有一定的现实意义.
采用APF方法估计模型的参数,各参数的后验
估计值及90%置信区间如图8所示.其中,波动持
续性参数卢的估计值为0.778,低于其他文献中趋近
于1的估计值,这说明由于模型的选择与估计方
法的配置使得估计精度有所提高,一定程度上避免了
对于波动的过高估计.第一个状态的内部转移概率
11为0.889,接近于1,从而保证了模型和方法的有
效性.自由度的估计值为5,更加印证了该样本数
据的厚尾特征,也说明了采用该模型的合理眭.
观测样本量
log(pll/(1-P..))
图8模型各参数的后验估计值及90%置信区间图
对该模型的APF算法退化情况进行评估,结果
如图9所示.从有效样本量的集中程度可以判断该
方法没有明显的退化现象,可以进行有效的估计.
8
六,结论
基于APF算法,通过对四个不同自由度的
朱慧明,郝立亚,曾惠芳:
基于APF算法的贝叶斯金融厚尾MSSV模型研究
图9模型的有效样本量图
MSSV—t模型潜在状态的预测及参数估计,表明了
对于厚尾数据的拟合采用MSSV—t模型可以更为
精确的估计波动持续性参数,从而较合理地解释
金融时序数据的波动特征,因此证明了MSsV—t
模型较MSSV模型在估计波动持续性方面更加有
参考文献:
效.此外波动真实值和估计值的比较也说明采用
APF方法基本上可以捕捉到信息的变化,并通过状
态变量的一阶马尔可夫过程反映为波动的变化,对
于突发事件引起的异常变化具有良好的过滤筛选能
力.而对中国上证综指的股价波动的实证分析验证
了股票时序数据的厚尾特征,并修正了波动持续性
参数的估计值,进一步证明了基于APF算法的
MSSV—t模型在对潜在波动状态的预测及突发事
件的探测方面的优良性质,对提高波动预测精度具
有一定的现实意义.由于研究的MSSV—t模型只
是厚尾MSSV模型的一种形式,对于其他分布形式
如stable分布是否也具有信息筛选及修正估计波动
持续性参数方面的优良性质有待进一步的研究.
[1]JacquierE,PolsonN,RossiP.Bayesiananalysisofstochasticvolatilitymodels[J].JournalofBusinessandEconomic
Statistics,1994,12(4):
371—417.
[2]KimS,ShephardN,ChibS.Stochasticvolatility:
likdihoodinfer
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 APF 算法 贝叶斯 金融 MSSV 模型 研究