数学建模中时间序列详细说明.docx
- 文档编号:7388577
- 上传时间:2023-01-23
- 格式:DOCX
- 页数:23
- 大小:176.64KB
数学建模中时间序列详细说明.docx
《数学建模中时间序列详细说明.docx》由会员分享,可在线阅读,更多相关《数学建模中时间序列详细说明.docx(23页珍藏版)》请在冰豆网上搜索。
数学建模中时间序列详细说明
数学建模中时间序列详细说明
(总19页)
基于Excel的时间序列预测与分析
1时序分析方法简介
时间序列相关概念
时间序列的内涵以及组成因素
所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。
如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化悄况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。
人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。
时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。
在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。
但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这儿类构成要素分别进行分析,以揭示时间序列的变动规律性。
影响时间序列的构成因素可归纳为以下四种:
(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。
这一变化通常是许多长期因素的结果。
(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。
这种因素是因经济多年的周期性变动产生的。
比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增地趋势线上下方。
(3)季节性变化(Seasonalvariation),指现象受季节性影响,按一固定周期呈现出的周期波动变化。
尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。
比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。
(4)不规则变化(Irregularmovement),指现象受偶然因素的影响而呈现出的不规则波动。
这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的佔汁值之间的偏差,它用于解释时间序列的随机变动。
不规则因素是山短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。
时间序列一般是以上儿种变化形式的叠加或组合出现的(如图。
110
90
80
I—II—ixGJOJCXJ
7°3COOGJTtinCOOCMrr
88666660006CPC*®6CT96OOO
ivi 图平稳序列 时间序列的分类 根据其所研究的依据不同,可有不同的分类: (1)按所研究的对象的多少来分,有一元时间序列和多元时间序列。 如某种商品的销 售量数列,即为一元时间序列;如果所研究对象不仅仅是这一数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。 (2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。 如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。 ⑶按序列的统讣特性分,有平稳时间序列和非平稳时间序列两类。 所谓时间序列的平稳性,是指时间序列的统计•规律不会随着时间的推移而发生变化。 平稳序列的时序图 直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;从理论上讲,分为严平稳与宽平稳两种。 相对的,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。 (4)按序列的分布规律来分,有高斯型(Guassian)和非高斯型时间序列(non-Guassian) 时间序列分析概述 时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而乂相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。 时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用也比较前两种方法复杂,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的111的。 时间序列分析方法包括: (1)确定性时序分析: 它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数y=f(t)来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。 具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等; (2)随机性时序分析: 其基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来来对时间序列进行预测。 为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如 下: 时间序列分析: 确定性时序分郴 '发展水平分析' 趋势变动分析周期波动分析趋势加周期波动分析一元/多元时序分析'可控/不可控时序分析马尔可夫分析贝叶斯分析 采用移动平均法、指数平滑法等 采用自回归模型、滑动平均模型等 确定性时间序列分析 山的介绍,我们知道时间序列的变动是长期趋势变动、季节变动、循环变动、不规则变动的耦合或叠加。 在确定性时间序列分析中通过移动平均、指数平滑、最小二乘法等方法来体现出社会经济现象的长期趋势及带季节因子的长期趋势,预测未来的发展趋势。 移动平均法 通过对时间序列逐期递移求得平均数作为预测值的一种方法叫移动平均法,它是对时间序列进行修匀,边移动边平均以排除偶然因素对原序列的影响,进而测定长期趋势的方法。 其简单的计算公式为: 预测值二最后〃个值的平均 其中: 〃二被认为是与预测下一个时期相关的最近的时期数 采用Excel进行移动平均时,在【数据分析】选项中选择【移动平均】,并在对话框中输入数据区域和移动见间隔即可。 说明: "的选择: 采用移动平均法进行预测,用来求平均数的时期数"的选择非常重要,这也是移动平均的难点。 因为"取值的大小对对所计•算的平均数的影响较大。 当八=1时,移动平均预测值为原数据的序列值。 当"二全部数据的个数时,移动平均值等于且为全部数据的算术平均值。 显然,〃值越小,表明对近期观测值预测的作用越重视,预测值对数据变化的反应速度也越快,但预测的修匀程度较低,佔计值的精度也可能降低。 反之,〃值越大,预测值的修匀程度越高,但对数据变化的反映程度较慢。 不存在一个确定时期〃值的规则。 一般〃在3〜200之间,视序列长度和预测目标惜况而定。 一般对水平型数据,〃值的选取较为随意;一般情况下,如果考虑到历史上序列中含有大量随机成分,或者序列的基本发展趋势变化不大,则"应取大一点。 对于具有趋势性或阶跃性特点的数据,为提高预测值对数据变化的反应速度,减少预测误差,"值取较小一些,以使移动平均值更能反映目前的发展变化趋势。 一般"的取值为3〜15。 具体取值要看实际情况,可山均方差MSE来评价(MSE的概念在第3节“预测方法的评估”中介绍)。 指数平滑法 指数平滑法是对过去的观测值加权平均进行预测,使第/+1期的预测值等于/期的实际观测值与第f期指数平滑值的加权平均值,即 预测值二&(上期值)+(1-a)(上次预测值) 一次指数平滑法预测模型为: (1-1)其中: ——第f期预测值; 儿一一第/期的实际观测值; &——平滑系数,且Ovavl。 将=ay\_2+(\-a)M,_2 =叽2+(1-讪_3 代入(1T)式中,可得: M,=fa(l-Q)'y—(1-2) r-0 公式(1-2)中各项系数和为: a+a(\-a)+-+a(\-a)'~1+(l-aY=a-~~-—+(l_a)' 1-(1-a) 'lt—>8时,(1—a)t0,系数和—>1。 所以,可以说M是f期以及以前各期观察值的指数加权平均值,观察值的权数按递推周期以儿何级数递减,各期的数据离第f期越远,它的系数愈小,因此它对预测值的影响也越小。 公式(1-1)稍作变换可得: Mw=M+q()"—M)(1-3) 可见,必+1是f期的预测值M加上用&调整的,期的预测误差(N-M)。 因此,简单指数平滑法用于预测实际上是根据本期预测误差对本期预测值作出一定的调整后得到的下一个预测值,即: 新的预测值二老的预测值+&X老预测值的误差 对老预测值所作的调整的幅度视&的大小而定。 说明: 平滑系数&的选择: &的取值对平滑效果影响很大,&越小平滑效果越显著.&取值的大小决定了在平滑值中起作用的的观察值的项数的多少,当&取值较大时,各观察值权数的递减速度快,因此在平滑值中起作用的观察值的项数就较少;而当&取值较小时,各观察值权数的递减速度很慢,因此在平滑值中起作用的观察值的项数就较多。 如果用移动平均数与指数平滑法相比,要使两者具有相同的灵敬程度,移动平均数〃的取值与指数平滑法中&的取值有如下关系: //-I1一a 飞a~ 当&取值〜之间时,如果要使移动平均具有相应的灵敏程度,则N的取值为: a n 39 19 9 ~6 当&取值较小时,指数平滑法的平滑能力较强,而&取值较大时,模型对现象变化的反应速度较快。 一般来说&取值的大小应当视所预测对象的特点及预测期的长短而定。 一般悄况下,观测值呈较稳定的水平发展,&值取〜之间;观测值波动较大时值取〜之间;观测值呈波动很大时,&值取〜之间。 采用Excel进行指数平滑预测步骤如下: 1、选择在【数据分析】选项中选择【指数平滑】; 2、在【输入区域】中输入数据区域; 3、在【阻尼系数】输入1-a的值(注: 阻尼系数二l-a); 4、在【输出区域】中选择预测结果输出位置;单击【确定】即可。 趋势预测 (1)线性趋势预测模型: y,=a+bt 用最小二乘法求待定参数"、"决定于标准方程组: [工D=+"工厂Ia=y-bt 趋势预测的误差可用线性回归中的佔计标准误差来衡量。 公式为: 片 ⑵二次曲线趋势预测模型: y^a+bt+ct2 根据最小二乘法推导待定参数"、/八c的标准方程组: 工=加+〃2? +巧/二 (3)指数曲线趋势预测模型: y,=ab1,其中a>b为未知数。 在这里必须要把指数先通过变量代换转化为直线趋势才能用最小二乘法来求参数,即: 两边取对数ln>,f=ln^+zln/\再根据直线形式的常数确定方法,可求得5"、最后取反对数得到"的值。 从总体上来说,确定性时序分析刻画了序列的主要趋势是直观简单、便于计算,但是比较粗略的,不能严格反映实际的变化规律,为了严格反映时序的变化必须结合随机时序分析法进一步完善对社会经济现象的分析以便进行决策。 随机性时间序列分析 平稳随机时间序列分析 在随机性时间序列分析中,分为(宽)平稳时序分析和非平稳时序分析。 平稳随机过程其统计特性(均值、方差)不随时间的平移而变化,在实际中若前后的环境和主要条件都不随时间变化就可以认为是平稳过程(宽平稳过程),具有(宽)平稳特性的时序称平稳时序。 平稳时序分析主要通过建立自回归模型(AR,AutoregressiveModels)>滑动平均 模型(M4,MovingAverageModels)和自回归滑动平均模型(ARMA,AutoregressiveMovingAverageModels)分析平稳的时间序列的规律,一般的分析程序可用下面框图表示: (1)自回归模型AR(p) 如果时间序列Xf(/=1,2,--)是平稳的且数据之间询后有一定的依存关系,即乙与前面X」X_2,…X"有关与其以前时刻进入系统的扰动(白噪声)无关,具有卩阶的记忆,描述这种关系的数学模型就是“阶自回归模型可用来预测: Xt= …外是自回归系数或称为权系数;①为白噪声,它对/产生的响应,它本身就是前后不相关的序列,类似于相关回归分析中的随机误差干扰项,其均值为零,方差为b,的白噪声序列。 上面模型中若引入后移算子B,则可改为: (l—B©-B2(p2=q(1-5) 记灰少一…一 则(1-4)可写成 卩(B)X— (1-6) 称(p(B)=0为AR(p)模型的特征方程。 特征方程的卩个根九(山1,2,…丿)被称为的特征根。 如果卩个特征根全在单位圆外,即 |2,-1>1/=1,2,•••,/? (1-7) 则称AR(p)模型为平稳模型,(1-7)被称为平稳条件。 山于是关于后移算子B的多项式,因此AR(p)模型是否平稳取决于参数cp、g…叭。 (2)滑动平均模型MA(q) 如果时间序列X丄=1,2,…)是平稳的与前面X-,X一2,…X-p无关与其以前时刻进入系统的扰动(口噪声)有关,具有q阶的记忆,描述这种关系的数学模型就是q阶滑动平均模型可用来预测: X,=a,-6xat_x+O2at_2+•--+0(lat_q(1一8) 上面模型中若引入后移算子3,则可改为: (3)自回归滑动平均模型ARMA(p,q) 如果时间序列X丄=1,2,…)是平稳的与前面…乂宀有关且与其以前时刻进入系统的扰动(口噪声)也有关,则此系统为自回归移动平均系统,预测模型为: X]一(P\X一\+02X—+…+=6-+&2勺・2+・・・+0"r(1-9) 即(1-B(P\-B込和宓,)x”=(1_qB_唧_Q0h 非平稳时间序列分析 在实际的社会经济现象中我们收集到的时序大多数是呈现出明显的趋势性或周期性,这样我们就不能认为它是均值不变的平稳过程,要用模型来预测应是要把趋势和波动综合考虑进来,是它们的叠加。 用模型来描述: X—匕(1-10) 丛表示X.中随时间变化的均值(往往是趋势值),齐是X,中剔除儿后的剩余部分, 表示零均值平稳过程,就可用自回归模型、滑动平均模型或自回归滑动平均模型来拟厶n© 要解模型匕="+匕,分以下两步: (1)具体求出丛的拟合形式,可以用上面介绍的确定性时序分析方法建模,求出//,,得 到拟合值,记为几。 (2)对残差序列进行分析处理,使之成为均值为零的随机平稳过程,再用平 稳随机时序分析方法建模求出匕,通过反运算,最后可得=h+匕。 22007年国内生产总值的预测 根据上面讨论的时序分析的方法,本文将之综合应用到对实际数据的分析预测中。 本文选取1978-2006历年国内生产总值作为时序数据,进行建模并预测。 我们从画出的走势图(如图知道这一时间序列是具有明显趋势且不含有周期性变化经济波动序列,即为非平稳的时间序列,对此序列进行建模预测需要用上面介绍的非平稳时间序列分析方法。 采用模型: (2-1) 2J3000 0000 oO -5O8 hfwk1® ■*1”■•丁•XiI11■iIii■IIIii■]Ii U刃OC寸gX0Z r-COSO0COOO66666OCDOO O-.666666O-.666OO«OO -V—«4*—<4*—<*—<-V—44v—440s? dCSICM 年份 图历年国内生产总值时间序列图 从图形(图)中我们可以判断出国内生产总值的确定趋势是按指数趋势发展的,因此 丛可以用趋势方程表示: "="/『,其中4#为待定参数。 利用1978〜2006年数据及利用对国内生产总值的趋势进行拟合,对指数曲线线性化,即两边取对数lg角=lga+"gb,在Excel中进行对其进行回归分析,结果见表。 于是,可得如下佔计模型与拟合图,如图所示。 lg/<=3.4499+0.06561R2=0.9878(2-2) SUMMARYOUTPUT 回归统计 MultipleR RSquare AdjustedRSquare标准误差观测值 29 方差分析 df SS MS F SignificanceF 回归分析残差总计 1 27 28 Coefficients 标准误差 tStat P-value Intercept XVariable1 I •g“ lg几 I Ig几 1 16 2 17 3 18 4 19 5 20 6 21 7 22 8 23 9 24 10 25 11 26 12 27 13 28 14 29 15 30 6 图指数曲线线性化拟合图 从统讣量疋=0.9878来看,模型通过了检验,且拟合图中可以看出实际值与拟合值很 接近,说明国内生产总值是符合指数长期趋势的。 再把模型(2-2)取反对数得: (2-3) A=2817.757036x1.16294(/, 根据拟合的“值,这里求出残差序列rz={xf-A},数据见表,残差序列图如图所 示。 年份 国内生产总值 预测值 A 残差序列 年份 国内生产总值 侦测值 残差序列 1978 1993 1979 1994 1980 1995 1981 1996 1982 1997 1983 1998 1984 1999 1985 2000 1986 2001 1987 2002 1988 2003 1989 2004 1990 2005 1991 2006 1992 2007 30000 -40000 图残差序列散点图 观察残差序列的散点图可知,该序列有很大的波动性,可认为是非平稳的。 将残差序列齐("1,2,……,29)进行差分使其平稳化,观察其差分散点图如图所 示,可认为: 2次差分后序列是平稳的,即令 (2-4) a=34…,29) 得到序列他}。 从而我们可以认为他}是平稳的。 25000 -15000 20000 15000 -5000 -10000 )^10000郴snnn郴5000鏗0 1次差分 20000 10000 0 10000 -20000 30000一2次差分 -30000 图差分后散点图 将序列{叱}零均值化: 山数据求得用S令 (2-5) w=叱一丽 得到序列{叫},从而算出序列{叫}的样本自相关函数念与样本偏相关函数0眾,结果如表如图所示。 从自相关一偏自相关图可以看出,久随着k的增大而衰减,有拖尾现象,而偏相关 函数九在k=2就落人随机区(在零附近波动),且恢』v 2 V29 =0.3714, k>2是截尾的。 所以初步判断残差序列为AR⑵模型。 表 u 25: K 22 d 16匸 亠 i i 3 10^ W 4= 11 图偏相关函数 k A A 札k k A A 1 16 2 17 3 18 4 19 5 20 6 21 7 22 8 23 9 24 10 25 11 26 12 27 13 28 14 29 15 30 注: 偏相关函数的讣算是用SPSS软件来实现得到的。 因为Excel中讣算很繁琐,有一定的困难。 设模型为 (2-6) 需要佔计的值,得出解如下: => 0=1.0715©=-0・2603 0+0・850帀2=0.8502 0.8502^,+%=0.6507 代入(2-6)式,AR (2)模型为 w(=1.0715⑷―]-0.2603w(^2+as 由特征方程(p(B)=0可得: 1-1.07153+0.260332=0 解此方程得特征根入=2.6863,易=1.4300 由|A|>1,肉|>1,则可判断此模型为平稳的AR (2)模型。 由表得到/0=E(wt)2=.35 、卩(p 戶1>1 二.35XX+X =.49 为了检验模型合理性,计算残差耳=叫-阿的自相关函数(如表。 珂=0]%-02叱・2/=56…,29 表 / 5 t A 3 17 4 18 5 19 6 20 7 21 8 22 9 23 10 24 11 25 12 26 13 27 14 28 15 29 16 30 根据残差分析检验方法,由八=25,取/n=6<-,构造统计量: 4 才6=±25・q"灯计算pg,R=l,2,…,6 "1 由咖今“挣S 得到结果见表。 表 k P(k) 心) 1 2 3 4 5 6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 时间 序列 详细 说明