ARMA算法整理.docx
- 文档编号:973554
- 上传时间:2022-10-14
- 格式:DOCX
- 页数:9
- 大小:276.04KB
ARMA算法整理.docx
《ARMA算法整理.docx》由会员分享,可在线阅读,更多相关《ARMA算法整理.docx(9页珍藏版)》请在冰豆网上搜索。
ARMA算法整理
信息通信网络时序指标动态阈值选取方式研究
整篇文章分为三部份,第一部份是点预测,第二部份是阈值d的选取,第三部份是结合二者进行区间预测。
其中第一部份是重点,分为两个小部份,别离为前期预处置查验和模型成立,模型成立部份又别离由6个小部份组成。
一、成立模型进行中心点预测
思路:
依照给出的数据序列,利用自相关系数,偏相关系数的性质,选择适合的模型进行模拟,如AR模型(AR(p)),MA模型(MA(q)),ARMA模型(ARMA(p,q)),并确信它们的阶数。
然后估量模型中未知参数的值,并利用AIC准那么来进行模型优化,从而能够对以后数据进行预测。
注:
概念:
概念:
概念:
建模:
1.前提预备
取得数据以后(比如移动公司一个月的通话时长记录),咱们要对数据进行一个预处置,判定给出的数据知足为平稳非白噪声序列,才能够利用上述几种模型对该数据序列进行建模。
(这是一个前提条件,因此,这就要求咱们在选取数据时要成心识的操纵)
(1)平稳性查验
那个地址咱们利历时序图查验的方式进行平稳性查验。
所谓时序图,确实是一个平面二维坐标图,通常横轴表示时刻,纵轴表示序列取值。
平稳序列的时序图应该显示出该序列始终在一个常数值周围随机波动,而且波动的范围有界的特点。
若是观看序列的时序图显示出明显的趋势性或周期性,那它通常不是平稳序列。
如此,咱们依照时序图就能够够判定是不是是平稳的。
(2)纯随机性查验
纯随机性序列:
若是序列值彼此之间没有任何相关性,那就意味着该序列是一个没有经历的序列,过去的行为对以后的进展没有丝毫阻碍,这种序列称之为纯随机序列。
白噪声序列是典型的纯随机序列。
那个地址咱们要验证咱们所要研究的数据序列不是纯随机序列,即过去的值对此刻有阻碍,才能成立ARMA模型,从而进行预测。
方式:
利用LB统计量
,式中为序列观测期数,为指定延迟期数,为自相关系数(当前与期前的相关系数)。
且。
一样只要计算出来延迟6期和延迟12期的LB及所对应的P值就能够够判定序列的随机性。
若是计算结果P值很小,大体上以为标准,只要小于即可判定该序列不是纯随机序列,属于非白噪声序列。
其中P值计算方式:
自由度的函数的密度函数为,对进行积分,代入之前计算的LB计算值,取得。
2.建模步骤
假设咱们的观看值序列通过序列预处置,能够判定为平稳非白噪声序列,那么咱们就能够够利用模型对该序列建模。
建模的大体步骤如下图:
(1)求出该观看值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。
(2)依照样本自相关系数和偏自相关系数的性质,选择阶数适当的模型进行拟合,即确信p,q的值。
(3)估量模型中未知参数的值。
(4)查验模型的有效性。
若是拟合模型通只是查验,专享步骤
(2),从头选择模型再拟合。
(5)模型优化。
充分考虑各类可能,成立多个拟合模型,从所有通过查验的拟合模型当选择最优模型。
(6)利用拟合模型,预测序列的以后走势。
平稳,非白噪声序列
计算样本自相关系数(ACF)和偏自相关系数(PACF)
ARMA模型识别
估计模型中未知参数的值
N
模型查验
Y
模型优化
预测序列将来的走势
计算样本自相关系数和偏自相关系数
因为咱们是通过考察平稳序列样本自相关系数和偏自相关系数的性质来选择适合的模型拟合观看值序列,因此模型拟合的第一步是要依照观看值序列的取值求出该序列的样本自相关系数和样本偏自相关系数的值。
样本自相关系数能够依照以下公式求得:
样本偏自相关系数能够利用样本自相关系数的值,依照以下公式求得:
式中,,
其中,是将的第列变成。
模型识别(计算p,q)
计算出样本自相关系数和偏自相关系数的值以后,就要依照他们表现出来的性质,选择适当的ARMA模型拟合观看值序列。
那个进程事实上确实是要依照样本自相关系数和偏自相关系数的性质估量自相关阶数和移动平均阶数,因此,模型识别进程也称为模型定阶进程。
理论依据:
(ARMA模型定阶的大体原那么)
模型定阶
拖尾
阶截尾
拖尾
阶截尾
拖尾
拖尾
模型
模型
模型
方式:
下面咱们考虑,在实际操作中,如何判定是截尾或拖尾。
即当样本自相关系数或偏自相关系数在延迟假设干阶以后衰减为小值波动时,什么情形下该看做相关系数截尾,什么情形下该看做相关系数在延迟假设干阶以后正常衰减到零值周围做拖尾波动。
由于当样本容量n充分大时,样本自相关系数近似服从正态散布:
样本偏自相关系数也一样近似服从那个正态散布:
依照正态散布的性质,有
注:
因此能够利用2倍标准差范围辅助判定。
若是样本自相关系数或偏自相关系数在最初的阶明显大于2倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围之内,而且由非零相关系数衰减为小值波动的进程超级突然,这时通常视为相关系数截尾,且截尾阶数为。
若是有超过5%的样本自相关系数落入2倍标准差范围之外,或是由显著非零的相关系数衰减为小值波动的进程比较缓慢或超级持续,这时通常视为相关系数不截尾,即拖尾。
如此,咱们就能够够依照最初的理论依据和计算的比较结果来选择适合的模型进行模拟。
(1)假设观看序列的自相关系数拖尾,偏自相关系数截尾,且截尾阶数为,那么选模型。
(2)假设观看序列的自相关系数截尾,且截尾阶数为,偏自相关系数拖尾,那么选模型。
(3)假设观看序列的自相关系数和偏自相关系数均拖尾,那么选模型。
参数估量
选择好拟合模型以后,下一步确实是要利用序列的观看值确信该模型的口径,即估量模型中未知参数的值。
比如:
模型中未知参数的估量为。
模型中未知参数的估量为。
模型中未知参数的估量为,
固然,这种低阶的ARMA模型能够依照公式直接带入求参数估量即可,但当阶数比较大时,参数估量值会超级复杂,这时咱们采纳最大似然估量或最小二乘估量方式。
极大似然估量:
记
最终,求解似然方程组
式中,
,为Green系数.
可是,由于和都不是的显式表达式,因此上述似然方程组事实上是由个超越方程组成,通常需要通过复杂的迭代算法才能求出未知参数的极大似然估量值。
最小二乘估量:
记
残差项为:
残差平方和为:
使残差平方和达到最小的那组参数即为的最小二乘估量值。
同极大似然估量一样,由于不是的显性函数,未知参数的最小二乘估量值通常也得借助迭代法求出。
网上有极大似然法和最小二乘法的程序代码,有的是matlab的。
模型查验
模型的查验主若是查验模型的有效性,一个好的拟合模型应该能够提取观看值序列中几乎所有的样本相关信息。
换言之,拟合残差项(真实值与拟合值的差)中将再也不包括任何相关信息,即残差序列应该为白噪声序列。
如此,咱们就通过查验残差序列是不是为白噪声序列来讲明所建模型是不是通过查验。
方式与上面的序列随机性查验方式一样,利用LB统计量,,只是那个地址要验证是属于白噪声序列,因此最后计算结果P值要大于才可判定残差序列是纯随机序列,进而说明该拟合模型通过了查验。
模型优化
关于给定的观看值序列,咱们能够成立多个拟合模型,模型优化确实是从所有通过查验的拟合模型当选择最优模型。
在那个地址,咱们利用AIC准那么(最小信息量准那么)来选择最优模型。
AIC准那么的思想是以为一个拟合模型的好坏能够从两方面去考察:
一方面是用来衡量拟合程度的似然函数值;另一方面是模型中未知参数的个数。
一个好的拟合模型应该是一个拟合精度和未知参数个数的综合最优配置,使得AIC最小的ARMA模型为最优模型。
模型的AIC函数为:
,其中。
序列预测
通过以上所有的步骤,咱们取得了最优的拟合模型,然后能够对以后的某一点进行预测。
二、阈值的选取
第一部份的模型取得的预测结果是一个点值,但是在现实生活中,由于环境的复杂性和因素的不可操纵性,预测结果应该是一个以预测值为中心点上下浮动的区间更为适合。
那个地址,咱们利用聚类分析的思想来确信区间的大小,即阈值的选取。
方式:
先利用K-均值聚类方式将同一时刻点的不同y值分为适合的
k类,然后再依照来确信阈值的大小。
K-均值聚类步骤:
(1)在n个样品中随机选择k个样品作为初始凝聚点,(或将所有样品分成k个初始类,然后将这k个类的均值作为初始凝聚点)。
(2)对除凝聚点之外的所有样品样品逐个归类,将每一个样品归入离它最近的凝聚点所在的类(采纳欧氏距离计算),然后将该类的凝聚点更新为这一类目前的均值。
(3)重复步骤
(2),直到每一个聚类再也不发生转变或知足某个终止条件为止。
一样的迭代终止条件为误差平方和最小或限定聚类次数。
误差平方和为,其中有n个数据,分为k类,为所在类的均值。
关于K-均值聚类,网上有程序代码。
三、模型结合动态阈值进行更准确预测
假设要实现以后某一时刻的区间预测,由第一步的中间点预测加上第二步计算的所在时刻点的上下浮动区间,即可取得该时刻的区间预测。
总结:
第一步的整体思路和作者一样,斜率概念没用到;第二步没有效遗忘曲线知识,直接对数据进行了聚类。
另外,实际中移动时长记录数据应该具有很强的周期性,利用非平稳序列(ARIMA模型)先排除季节性转变阻碍更好一些,但却不行建模,不明白作者怎么考虑的。
这些能够与客户再进一步沟通。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ARMA 算法 整理