spss时间序列分析教程.docx
- 文档编号:12119166
- 上传时间:2023-04-17
- 格式:DOCX
- 页数:16
- 大小:454.28KB
spss时间序列分析教程.docx
《spss时间序列分析教程.docx》由会员分享,可在线阅读,更多相关《spss时间序列分析教程.docx(16页珍藏版)》请在冰豆网上搜索。
spss时间序列分析教程
时间序列分析
时间序列概述
1.基本概念
()一般概念:
系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律0它是系统中某一变量受其它各种因素影响的总结果0
()研究实质:
通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展0它不研究事物之间相互依存的因果关系0
()假设基础:
惯性原则0即在一定条件下,被预测事物的过去变化趋势会延续到未来0暗示着历史数据存在着某些信息,利用它们可以解释与预测时间序列的现在和未来0近大远小原理(时间越近的数据影响力越大)和无季节性、无趋势性、线性、常数方差等0
()研究意义:
许多经济、金融、商业等方面的数据都是时间序列数据0时间序列的预测和评估技术相对完善,其预测情景相对明确0尤其关注预测目标可用数据的数量和质量,即时间序列的长度和预测的频率0
2.变动特点
()趋势性:
某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。
()周期性:
某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
()随机性:
个别为随机变动,整体呈统计规律。
()综合性:
实际变化情况一般是几种变动的叠加或组合。
预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。
3.特征识别认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。
()随机性:
均匀分布、无规则分布,可能符合某统计分布。
(用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。
)()平稳性:
样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。
样本序列的自相关函数只是时间间隔的函数,与时间起点无关。
其具有对称性,能反映平稳序列的周期性变化。
特征识别利用自相关函数:
P丫丫
其中丫是的阶自协方差,且P、
平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度0
实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列
都是非稳定的,但通过数据处理可以变换为平稳的。
4.预测类型
()点预测:
确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。
但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。
()区间预测:
未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。
区间的长度传递了预测不确定性的程度,区间的中点为点预测值。
()密度预测:
序列未来预测值的一个完整的概率分布。
根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。
5.基本步骤
()分析数据序列的变化特征。
()选择模型形式和参数检验。
()利用模型进行趋势预测。
()评估预测结果并修正模型。
随机时间序列
系统中某一因素变量的时间序列数据没有确定的变化形式,也不能用时间的
确定函数描述,但可以用概率统计方法寻求比较合适的随机模型近似反映其变化规律。
(自变量不直接含有时间变量,但隐含时间因素)
1.自回归()模型
(:
模型的名称:
模型的参数)(自己影响自己,但可能存在误差,误差即没有考虑到的因素)
()模型形式(&越小越好,但不能为:
&为表示只受以前的历史的影响不受其他因素影响)
©©©£
式中假设:
的变化主要与时间序列的历史数据有关,与其它因素无关;
£不同时刻互不相关,£与历史序列不相关。
式中符号:
模型的阶次,滞后的时间周期,通过实验和参数确定;当前预测值,与自身过去观测值、…、是同一序列不同时刻的随机变量,相互间有线性关系,也反映时间滞后关系;
、、……、同一平稳序列过去个时期的观测值;
©、©、、©自回归系数,通过计算得出的权数,表达依赖于
过去的程度,且这种依赖关系恒定不变;
£随机干扰误差项,是均值、常方差6、独立的白噪声序列,通过估计指定的模型获得。
()识别条件
当〉时,有©或©服从渐近正态分布()且(©>)的个数W,即平稳时间序列的偏相关系数©为步截尾,自相关系数逐步衰减而不截尾,则序列是()模型。
实际中,一般过程的函数呈单边递减或阻尼振荡,所以用函数判别(从阶开始的所有偏自相关系数均为)。
()平稳条件
一阶:
©V。
二阶:
©©V、©©V、©V。
©越大,自回归过程的波动影响越持久。
()模型意义
仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量相互独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性等造成的困难。
2.移动平均()模型
()模型形式
£0£0£0£
()模型含义用过去各个时期的随机干扰或预测误差的线性组合来表达当前预测值。
()的假设条件不满足时可以考虑用此形式。
总满足平稳条件,因其中参数0取值对时间序列的影响没有模型中参数的影响强烈,即这里较大的随机变化不会改变时间序列的方向。
()识别条件
当〉时,有自相关系数或自相关系数服从((刀))且(>(E))的个数w,即平稳时间序列的自相关系数为步截尾,偏相关系数©逐步衰减而不截尾,则序列是()模型。
实际中,一般过程的函数呈单边递减或阻尼振荡,所以用函数判别(从阶开始的所有自相关系数均为)。
()可逆条件
一阶:
0V。
二阶:
0V、00V。
当满足可逆条件时,()模型可以转换为()模型
3.自回归移动平均()模型
()模型形式
©©©£0£0£0£
式中符号:
和是模型的自回归阶数和移动平均阶数;
©和0是不为零的待定系数;£独立的误差项;是平稳、正态、零均值的时间序列。
()模型含义
使用两个多项式的比率近似一个较长的多项式,即其中个数比()模型中阶数小。
前二种模型分别是该种模型的特例。
一个过程可能是与过程、几个过程、与过程的迭加,也可能是测度误差较大的过程。
()识别条件
平稳时间序列的偏相关系数©和自相关系数均不截尾,但较快收敛到,则该时间序列可能是()模型。
实际问题中,多数要用此模型。
因此建模解模的主要工作是求解、和©、0的值,检验£和的
值。
()模型阶数
准则:
最小信息准则,同时给出模型阶数和参数的最佳估计,
适用于样本数据较少的问题。
目的是判断预测目标的发展过程与哪一随机过程最为接近。
因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。
具体运用时,在规定范围内使模型阶数从低到高,分别计算值,最后确定使其值最小的阶数是模型的合适阶数。
模型参数最大似然估计时()(T()模型参数最小二乘估计时(T()
式中:
为样本数,C为拟合残差平方和,、为参数。
其中:
、范围上线是较小时取的比例,较大时取的倍数。
实际应用中、一般不超过。
4.自回归综合移动平均()模型
()模型识别
平稳时间序列的偏相关系数©和自相关系数均不截尾,且缓慢衰减收敛,贝U该时间序列可能是()模型。
()模型含义
模型形式类似()模型,但数据必须经过特殊处理。
特别当线性时间序列非平稳时,不能直接利用()模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中一般不超过。
若时间序列存在周期性波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有暂时影响的时间序列。
即差分处理后新序列符合()模型,原序列符合()模型。
建模解模过程
1.数据检验
检验时间序列样本的平稳性、正态性、周期性、零均值,进行必要的数据处理变换。
()作直方图:
检验正态性、零均值。
按图形一直方图的顺序打开如图所示的对话框。
励序号呼号II——j物岬e;
门II季样本数据㈱本数据I
i-Templalc
厂UsechartspeciliMlioosfrom:
样本数据
图
从图中看出:
标准差不为、均值近似为,可能需要进行数据变换()作相关图:
检验平稳性、周期性。
按图形一时间序列一自相关的顺序打开如图所示的对话框。
将样本数据送入变量框,选中自相关和偏自相关项,暂不选数据转换项,点击设置项,出现如图所示对话框
Autocorrelations:
Opti
MaximumNumberofLags;|l
StandardErrorMethod
<*Independencemodel
「Bartlett'sapproximation
图
因为一般要求时间序列样本数据>,滞后周期v,所以此处控制最大滞后数值设定为。
点击继续返回自相关主对话框后,点击运行系统,输出自相关图如图所示。
LagNumber
图
从图中看出;样本序列数据的自相关系数在某一固定水平线附近摆动,且按周期性逐渐衰减,所以该时间序列基本是平稳的。
()数据变换:
若时间序列的正态性或平稳性不够好,则需进行数据变换。
常用有差分变换(利用一)和对数变换(利用一)进行。
一般需反复变换、比较,直到数据序列的正态性、平稳性等达到相对最佳。
2.模型识别
分析时间序列样本,判别模型的形式类型,确定、、的阶数。
()判别模型形式和阶数
1相关图法:
运行自相关图后,出现自相关图(图)和偏自相关图(图)。
LagNumber
图
从图中看出:
自相关系数和偏相关系数具有相似的衰减特点:
衰减快,相邻
二个值的相关系数约为,滞后二个周期的值的相关系数接近,滞后三个周期的值
的相关系数接近。
所以,基本可以确定该时间序列为()模型形式,但还不能确
定是()或是()模型。
但若前四个自相关系数分别为、、、,则可以考虑用()模
型。
另外,值得说明的是:
只是模型需要检验时间序列的平稳性,若该序列的偏自相关函数具有显著性,则可以直接选择使用模型。
实际上,具体应用自相关图进行模型选择时,在观察与函数中,应注意的关键问题是:
函数值衰减的是否快;是否所有之和为,即进行了过度差分;是否与的某些滞后项显著和容易解释的峰值等。
但是,仅依赖图形进行时间序列的模型识别是比较困难的。
2参数估计:
从()开始试验,一般到。
实际应用中,往往从()、……、(),逐个计算比较它们的值(或值),取其值最小的确定为模型。
()建立时间序列新变量
无论是哪种模型形式,时间序列总是受自身历史数据序列变化的影响,因此需将历史数据序列作为一个新的时间序列变量。
按数据转换一建立时间序列的顺序展开对话框,图。
图
1在功能下拉框中选择变量转换的函数,其中:
非季节差分:
计算时间序列连续值之间的非季节性差异。
季节性差分:
计算时间序列跨距间隔恒定值之间的季节性差异,跨距根据定义的周期确定。
领先移动平均:
计算先前的时间序列数值的平均值。
中心移动平均:
计算围绕和包括当前值的时间序列数值的平均值。
中位数:
计算围绕和包括当前值的时间序列的中位数。
累积和:
计算直到包括当前值的时间序列数值的累计总数。
滞后顺序:
根据指定的滞后顺序,计算在前观测量的值。
领先顺序:
根据指定的领先顺序,计算连续观测量的值。
平滑:
以混合数据平滑为基础,计算连续观测量的值。
以上各项主要用在生成差分变量、滞后变量、平移变量,并且还要关注差分、滞后、平移的次数,以便在建立模型、进行参数估计时,使方程达到一致。
2在顺序框中填入在前或在后的时间序列数值间隔的数目。
在新变量框中接受左边框移来的源变量。
在名称框中定义新变量的名称,但必单击改变方能成立。
3单击运行系统,在原数据库中出现新变量列。
另外,若需产生周期性时间序列的日期型变量,则按数据一定义日期的顺序展开如图所示对话框。
图
在样本栏中选择定义日期变量的时间间隔,在起始日期栏中设定日期变量第一个观测量的值,单击完成定义。
3.参数估计
采用最大似然估计或最小二乘估计等方法估计©、0参数值,并进
行显著性检验。
按分析一时间序列一模型的顺序展开如图对话框。
图
在图中:
选择原时间序列变量进入因变量框;
根据模型识别结果和建立的新时间变量,选择一个或多个变量进入自变量框;暂时不进行因变量的数据转换;
与自变量的选择对应,根据模型识别结果或实验的思路设定、()、
的值;选择模型中包含常数项;
分别单击保存和设置按钮,展开如图和对话框。
PtedictCases
Prediclfromeslimalionperiodthroughlastcase
CPredictthrough:
TheEsiimationPeriodis:
Allcases
ContinueCancelHelp
图
图中:
项,也可选择用
在建立变量栏选择新建变量结果暂存原数据文件新建变量代替原数据文件中计算结果项;在设定置信区间百分比下拉框选择;
在预测样本栏选择根据时期给出预测结果的方法。
图
图中:
在收敛标准栏选择迭代次数、参数变化精度、平方和变化精度,当运算达到其中一个参数的设定,则迭代终止;
在估计初始值栏选择由过程自动选择或由先前模型提供,-
般默认前者;
或详细资料、
在预测方法栏选择无条件或有条件最小二乘法
在输出控制栏选择最初和最终参数的迭代摘要或只显示最终参数。
单击,系统立即执行,输出信息如下:
Split
样本数据
样本数据
样本数据
样本数据
样本数据
各个输出统计量的意义:
常数项:
认为是取值恒为的常数变量,其系数就是自变量为时因变量的最优预测值,也称为预测基准值。
系数:
反映自变量对因变量影响的权重。
标准误:
表明样本数据的可靠性。
在(残差)参数近似服从正态分布条件下,系数加减两倍的标准误差近似等于总体参数的置信区间。
其值越小,置信区间越窄;并且其对于系数的相对值越小,估计结果越精确。
统计量:
估计系数与标准误差的比值,检验变量的不相关性。
一般给定显著水平,则拒绝原假设的值位于的置信区间外,其绝对值必大于。
概率值:
其值越小,则拒绝原假设不相关性的证据越充分。
其值接近与统计量接近相对应。
均值:
度量变量的集中度,传递随机变量的位置信息。
标准差:
度量变量的离散度,传递随机变量的规模信息。
平方和:
残差平方和是许多统计量的组成部分,孤立考察无太大价值。
准则:
信息准则和用于模型的选择,越小越好,但受自由度约束较为严重。
校正:
是模型中自变量对因变量变动的解释比例,度量方程预测因变量的成功程度,其是回归标准误差与因变量标准差比较的结果。
另一个比较方法是回归标准误差不超过因变量均值的则为好的模型。
统计:
用于检验随机误差项是否存在序列相关似然:
用于模型比较和假设检验,越大越好。
残差图:
4.模型检验
检验新建模型的合理性。
若检验不通过,则调整()值,重新估计参数和检验,反复进行直到接受为止。
但模型识别、参数估计、检验修正三个过程之间相互作用、相互影响,有时需要交叉进行、反复实验,才能最终确定模型形式。
()相关图检验残差白噪声:
因为白噪声过程是序列无关的,所以白噪声过程的自相关函数和偏自相关函数在自相关图中均为等于的水平直线。
()散点图检验残差独立性:
以误差值为纵坐标、以预测值为横坐标,观察散点分布的均匀性、随机性。
理想预测模型的预测误差一定是不可预测的、无规律的、序列无关的。
相应的统计量仅适用检验一阶序列。
()直方图检验残差零均值:
零均值仅检验残差序列无关,若正态分布则检验独立性。
()概率图检验残差自相关:
以显著性水平计算X()概率值,。
()均方差检验预测的效果:
以预测误差的均方差最小为标准,注意预测误差仅与预测周期有关,而与起始时刻无关。
5.模型预测预测系统研究对象的未来某时刻状态。
列出预测模型,计算预测值。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 时间 序列 分析 教程