基于时间序列模型的我国第三产业及其结构的实证分析.docx
- 文档编号:10698524
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:22
- 大小:149.66KB
基于时间序列模型的我国第三产业及其结构的实证分析.docx
《基于时间序列模型的我国第三产业及其结构的实证分析.docx》由会员分享,可在线阅读,更多相关《基于时间序列模型的我国第三产业及其结构的实证分析.docx(22页珍藏版)》请在冰豆网上搜索。
基于时间序列模型的我国第三产业及其结构的实证分析
基于时间序列模型的我国第三产业及其结构的实证分析
山东经济学院焦娜、郝祥如、徐海梅
一、问题的提出-2-
二、研究现状及存在的问题-3-
三、模型构建前的准备……-4-
(一)若干假设-4-
(二)模型构建的理论基础……•…..-4-
四、ARIMA模型的构建・・・・•••・・・・-5-
(一)时序图…………………………………………………….….-5-
(二)差分运算及纯随机性检验・•…-6-
(三)确定差分后的模型结构•….-7-
(四)显著性检验・…・-8-
(五)拟合模型的具体形式・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・-9-
五、残差自回归(Auto-Regressive模型的构建•……-9-
(一)建立延迟因变量回归模型-9-
(二)逐步回归结果.・-10-
(三)修正后的最终拟合模型…………………………………・・・・・-10-
六、模型比较选择……………………………………………………-11-
七、第三产业及其结构分析结论与对策建议・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・-12-
参考文献••…・・・・・-14-
附录二:
第三产业增加值构成-16-
内容摘要:
从1978改革开放到2009年的31年间,第三产业产值的平均增速超过10%,高于同期国内生产总值的平均增长速度,发展迅速的第三产业对全国经济发展和城市化建设的影响重大。
我们根据1952年到2008年的第三产业的产值占国内生产总值的比重数据,通过具体数据运用综合分析建立了ARIMA时间序列模型、基于延迟因变量的Auto-regressive非平稳的时间序列模型,通过二个模型对数据拟合的优劣程度来选取研究第三产业占国内生产总值的比重的最优模型,分析了第三产业各行业的比重以及发展趋势。
通过模型分析得出的结论是:
我国自1952年以来,第三产业产值在国民生产总值中的比重波动较大。
在1978年左右的一段时间,第三产业的比重达到低谷;但是在1984年之后情况好转且该比重逐年增加,这与改革开放政策实施后我国第三产业经济快速发展相吻合;且近年来第三产业在国民生产总值中的比重趋于稳定。
并针对第三产业产值比重的变化趋势进而对第三产业各行业产值的比重分析,了解到我国的第三产业的产业结构有待优化,在大力发展第三产业的同时,要注重产业结构的调整,促进第三产业更好更快的发展。
模型在建立的过程中,运用了SAS9.1,Stata11.0等统计软件,用差分法提取确定性信息消除显著的增长趋势,参数的检验应用了非参数的t检验方法,模型的显著性检验应用
了LB(Ljung-Box)为统计量的检验方法。
序列白噪声的检验引入了2n检验,而残差的自
相关性检验以及异方差检验运用了D-W检验以及Engle提出的拉格朗日乘子检验。
关键词:
第三产业ARIMA模型Auto-regressive模型比重
一、问题的提出
当前,我国人均GDP已经超过2000美元,城市化率达到47%,正处在工业化加速向中后期推进的阶段,从国际经验看,这一阶段第三产业协同带动经济增长的作用日益增强,逐步成为现代产业体系的主体。
然而从第三产业的总体供给看,总量明显不足,服务水平低,竞争力不强;从第三产业内部结构看,传统服务业较为发达,现代服务业、新兴服务业、物流业明显落后;从第三产业产值占GDP的比重来看,近几年发展处于持平状态,第三产业产值比重有待于提高。
2007年3月,国务院还出台了《关于加快发展服务业的若干意见》明确提出,到2010年力争使服务业增加值占国内生产总值的比重比2005年提高3个百分点;有条件的大中城市形成以服务经济为主的第三产业结构。
在这样的背景下,加快发展服务业成为我国面临的一项重大而长期的战略任务,具有重大而深远的现实意义。
尤其值得注意的是,多年来我国经济实现了持续快速增长,然而,产业结构不合理,经济发展方式粗放,资源环境制约加剧等问题依然存在,这些都是必须认真研究并需要切实加以解决的。
所以对第三产业产值比重的发展研究是非常必要的。
在研究数据发展趋势和数据预测上的问题上时间序列模型是较优模型,而比较之前的论文在就第三产业比重预测这一方面大多选用一个模型,但单一的模型总具有局限性,所以在具体到确定的ARIMA模型、基于延迟变量的Auto-regressive非平稳的时间序列模型,再针对我国的实证数据,到底哪种模型更优是我们的研究方向,也是对之前数据分析的突破。
同时,我们将第三产业各行业的产值比重和增长相对速度放在同一张图中进行直观的比较,进一步说明了第三产业产业结构不合理的现状。
二、研究现状及存在的问题改革开放以来中国第三产业的发展分两个时期。
第一个时期:
1978~1991年,恢复性高速增长时期。
其特点是:
第三产业增长速度高,比重提高快,但结构改善不大,第三产业增长主要靠传统服务业的带动。
第二个时期:
1992~2006年,结构改善期。
其特点是:
第三产业增长速度放慢,比重基本稳定,结构明显改善,新兴产业和高附加值产业发展势头好。
改革开放以来中国第三产业的发展特征:
一是第三产业在国民经济中所占比重(当年价)大幅度提高;二是第三产业迅速增长,增长速度呈现前期峰谷交替、后期平缓的态势;三是第三产业绝对发展水平迅速提高,与世界的差距正在缩小;四是第三产业内部结构演变,呈现明显的升级趋势;五是第三产业成为劳动力增长最快的产业;六是第三产业对GDP增长的贡献率在曲折中上升,成为国民经济的第二推动力;七是现代服务业劳动生产率增长速度明显高于传统服务业;八是东中西部第三产业占比趋同,但发展水平差距在迅速拉大。
在推进第三产业市场化改革过程中,对一些细节性的问题尤其在先行的规制制度完善方面考虑欠周详。
中国和发达国家相比,在第三产业市场化改革方面,相同之处体现在均
强调对自然垄断型服务企业进行产权变革、吸引民间资本注资。
不同之处则体现在以下两方面:
一是发达国家在对自然垄断型服务企业进行拆分时,强调竞争与效益兼顾的原则,而中国对竞争机制引入较为重视而对后者关注不足。
从垄断改革实施的效果看,忽略效益产生了较严重的后果。
二是发达国家往往先制定法律、法规,然后以此为依据推行市场化改革。
而中国推进第三产业的市场化改革通常是“摸着石头过河”,没有一套成熟的管制
体系,经常会出现一些意料之外的矛盾和困难,也使一些政策往往因缺乏法律法规支撑而导致力度不足。
三、模型构建前的准备
(一)若干假设
我们从近年来的经济发展趋势以及数据本身的性质作出了如下假设:
1我国第三产业产值比重的发展趋势能用ARMA(p,q)或者是ARIMA(p,d,q)模型来
拟合,可能其效果较好,但是不能较好的解释其经济意义。
2可以利用时间序列的分解定理:
Wold分解定理或者Cramer分解定理对历年第三产业产值比重的数据进行确定性影响和随机性影响的分解。
并对随机影响进行自相关检验以检验确定性影响是否提取充分。
在下面的分析中,我们分别对第三产业产值比重数据进行上述两种假设的建模,通过日本统计学家Akaike于1973年提出的AIC准则以及Schwartz在1978年根据Bayes理论提出的SBC准则来评价所得出拟和模型的优劣,AIC准则和SBC准则的使用,能有效弥
补根据自相关图和偏自相关图定阶的主观性,在所有通过检验的模型中使得AIC或SBC
函数值达到最小的模型为相对最优模型。
同时辅助用模型的拟合效果图以及预测结果的合理性来评价模型的优劣。
(二)模型构建的理论基础
在统计研究中,常用按时间顺序排列的一组随机变量XLX2-XL来表示一个随机事
件的时间序列,简记为・t,t•"或「xJ
自1952年以来第三产业每年的产值比重符合时间序列的定义,为了研究发现我国第三产业的发展规律、发展现状以及对未来发展趋势的预测,我们从时间序列分析的角度,运用时间序列分析方法进行统计建模。
同时,不同模型的建立对时间序列的拟合与预测会有不同的效果,此处我们用二个不同的统计模型对我们所获得的数据进行分析建模。
对一元时间序列分析常用的模型有如下二种:
1、具有下述结构的模型称为求和自回归移动平均模型,简记为ARIMA(p,d,q)模
型
BIdxt-3B;t
-"i.:
t=0,Vari:
t-;「;,Fi;t=0,s=t
卜xs;t=0,-s:
:
:
t
式中B=1—】B—…-'-pBp为平稳可逆ARMA(p,q)模型的自回归系数多项式;
Ob]=1一rB一…一gBq,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。
2、残差自回归(Auto-Regressiv®模型的构建思想是首先通过确定性因素分解法提取
序列中主要的确定性信息:
xt=TtSt;t
Tt为趋势效应拟合,St为季节效应拟合。
而因素分解法对确定性信息的提取可能不够充分,
需要进一步检验残差序列:
“泊勺自相关性。
若检验结果显示自相关性不显著,说明上述确定性回归模型对信息的提取比较充分,
可以停止分析了。
若检验结果显示残差序列自相关性显著,这说明信息
提取不够充分,考虑建立残差序列拟合自回归模型:
Xt=Tt+St十呂t
*鸟=4$丄+…+at
2
E(at}=0,Var(at)=▽,Cov(at,at」)=0,X/i1
实践中对趋势效应的拟合常用如下两种模型:
(1)残差自回归(Auto-Regressiv®模型,自变量为时间t的幕函数
U沆•、tk•;t
⑵残差自回归(Auto-Regressive)模型,自变量为历史观察值「.少心,…x」。
Tt工爲「必」•…\xt^■;t
四、ARIMA模型的构建
(一)时序图
首先,对我国1952年以来的第三产业产值占国内总产值的比重画出时序图,如图1
所示。
42
t
图1第三产业占总产值的比重时序图
(二)差分运算及纯随机检验
由时序图可以看出,该序列是非平稳的,因此不能使用ARMA(p,q)模型来建模。
又可以看出该序列蕴含着显著曲线趋势,我们可以用低阶(2或3阶)差分来提取曲线趋
势的影响,来实现序列趋势的平稳,在实际操作中,二阶差分比较理想,得到二阶差分的时序图如图2所示。
t
图2一阶差分后第三产业占总产值的比重时序图
可以看到二阶差分后序列在均值附近比较平稳的波动,比较充分的提取了原序列中蕴含的长期趋势,使得差分序序列不再呈现确定性趋势了。
序列平稳后,我们要对序列做纯随机性检验,检验结果如表1所示。
ToChi-Pr>
617.5260.0075-0.242-0.312-0.0020.257-0.204-0.163
1223.57120.02330.1150.1960.025-0.160-0.0740.073
我们取显著性水平为0.05,由于6阶、12阶延迟的p值小于分别为0.0075和0.0233,小于显著性水平,则可以拒绝该序列为随机的原假设,即该时间序列是非随机的,说明数据的继续研究是有意义的。
(三)确定差分后的模型结构
观察序列的自相关图(图3)以及偏自相关图(图4)来确定差分平稳后的模型的结
Lag
CovarianeeCorrelation
-198765432101234567891
0
525752
1.09000
1
-0.61&434
-.24163
r
2
-0.7SS455
-.31217
呼卓■卓車卓
■■
3
-0,0037986
--eoise
A
A
4
0*25743
A
耳章葺車骞
A
5
-0.514618
-,20375
ft
g
-0.410440
-*16250
***
■
7
0.291&1&
0,11522
■学
8
0.495766
0.19628
V
9
0.064405
0,^2550
*
«■
10
-6,404123
-*160&0
■
11
-0.1S6380
--07379
*
12
0.184888
0.07320
*
13
Q.21800S
0-0S631
**
A
irarkstwostandarderrors
图3序列自相关图
LagCorrelation-198765432101234567891
图4偏自相关图
自相关图中绝大部分的自相关系数都在二倍标准差之内,进一步说明了二阶差分后第
三产业产值占国民生产总值的比重序列平稳了。
自相关图显示除了延迟2阶的自相关系数
在2倍标准差范围之外,其余的自相关系数都在2倍标准差之内波动,根据自相关系数的这个特点可以判断该序列具有短期相关性,同时可以认为该序列自相关系数2阶截尾。
偏自相关图显示出序列有明显的拖尾性。
综合自相关和偏自相关的性质,为拟合模型定阶为MA
(2),即原始时间序列的模型为ARIMA(0,2,2)模型。
(四)显著性检验
模型确定后需要进行参数的估计以及参数的显著性检验,SAS运行得到的结果如表2
所示。
表2
条件最小二乘估计
Parameter
Estimate
StandardErro
rtValue
ApproxPr>|t|
Lag
MU
-0.01958
0.04663
-0.42
0.6763
0
MA1,1
0.48242
0.13320
3.62
0.0007
1
MA1,2
0.28748
0.13338
2.16
0.0358
2
结果显示常数项的p值为0.6765大于显著性水平(0.5),即MU不显著,其他参数得p值均小于显著性水平(0.5),即均显著。
则除去常数项,再次进行参数估计,结果如表3所示。
表3条件最小二乘估计
Parameter
Estimate
StandardError
tValue
ApproxPr>|t|
Lag
MA1,1
0.47993
0.13216
3.63
0.0006
1
MA1,2
0.28603
0.13234
2.16
0.0352
2
显然,二个参数的p值很小,二个参数均显著整个模型的显著性检验,结果如表4所示。
表4残差的自相关检验结果
ToLagChi-SquareDFPr>ChiSqAutocorrelations
6
4.71
4
0.3180
-0.014
-0.070
-0.008
0.188
-0.162
-0.096
12
10.17
10
0.4261
0.124
0.206
0.062
-0.113
-0.064
0.050
18
13.51
16
0.6351
0.071
-0.032
-0.057
0.098
0.149
-0.021
24
27.73
22
0.1848
-0.236
0.054
-0.030
-0.171
-0.197
0.156
可以看出延迟各阶LB统计量的P值显著大于0.05,所以该拟合模型显著立
(五)拟合模型的具体形式
拟合模型的具体形式为:
Factor1:
1-0.47993B**
(1)-0.28603B**
(2)
1「0.47993B-0.28603B
或等价记为:
xt=2.47993xt」-1.67383xt/-0.09213xt卫亠0.28603xt」亠:
t
利用拟合模型对序列xt作5预测,结果如表5所示
表5ARIMA模型的预测结果
Obs
Forecast
StdError
95%Confidenee
58
40.0642
1.3885
37.3428
42.78
59
40.2244
2.5264
35.2728
45.1760
60
40.3846
3.5092
33.5066
47.262
61
40.5447
4.4649
31.7937
49.2958
62
40.7049
5.4273
30.0676
51.3423
可以看出在未来五年内,第三产业的产值占国内生产总值的比重不会有太大的变化
五、残差自回归(Auto-Regressive模型的构建
(一)建立延迟因变量回归模型
模型参数估计结果如表6所示。
表6
模型参数估计结果
Variable
DF
Estimate
StandardError
TValue
ApproxPr>|t|
Intercept
1
0.1823
0.9188
0.20
0.8435
Lagx
1
1.0010
0.0302
33.10
<.0001
由上表可以看出,
在截距项的显著性检验中得
p值为0.8435不显著,所以去掉截距项
对模型重新进行拟合。
表7最小二乘估计结果
SSE
96.417743
DFE
55
MSE
1.75305
RootMSE
1.32403
SBC
193.373426
AIC
191.348074
RegressR-Square
0.9982
TotalR-Square
0.9982
Durbinh
2.0145
Pr>h
0.0220
由于带有延迟因变量,所以该模型中残差自相关检验的输出结果是Durbinh统计量。
由上表可以看出Durbinh统计量的分布函数值为2.0145,p值为0.0220<0.05,表示该残差序列存在自相关性,需要对残差序列继续拟合自回归模型。
(二)逐步回归结果
通过建立残差序列自相关图可以得到残差是一阶自相关的,又进行逐步回归向后消除,结果如表8所示。
显示除了延迟一阶的序列值显著自相关外,延迟其他阶数的均不具有显著的自相关性,延迟2到8阶的相关项均被消除。
表8自回归消除不显著项过程
Lag
Estimate
TValue
Pr>|t|
6
-0.028226
-0.18
0.8544
3
-0.044951
-0.30
0.7676
7
-0.090956
-0.67
0.5067
2
0.116159
0.86
0.3928
8
-0.161937
-1.24
0.2198
4
-0.193146
-1.45
0.1542
5
0.181332
1.38
0.1731
(三)修正后的最终拟合模型
收敛状况和极大似然估计结果如表
9所示。
表9
极大似然估计结果
SSE
89.1065072DFE
54
MSE
1.65012RootMSE
1.28457
SBC
193.062555AIC
189.011852
RegressR-Square
0.9968TotalR-Square
0.9983
回归系数估计结果如表
10所示。
表10
最终参数估计结果
Variable
DF
Estimate
Error
tValue
Pr>|t|
Lagx
1
1.0064
0.007774
129.47
<.0001
AR1
1
-0.2770
0.1313
-2.11
0.0396
我们可以得到最终的拟合模型为:
xt=1.0064xtV
i,i,d
|-\=0.2770"t4;t,;t〜N(0,1.65012)
为了得到直观的拟合效果,做拟合效果图,如图5所示。
x
50■
t
图5第三产业模型拟合图
由上图可以我们可以看到观察值与拟合值的拟合效果非常好(星号为原观测值,曲线是拟合曲线)。
六、模型比较选择
对已建立的两个模型的AIC和SBC进行比较,以得到最优模型。
比较结果如表11所示
表11模型比较
AIC
SBC
模型标准差
ARIMA模型
194.9506
200.9726
1.3866
Auto-regressive模型
189.0119
193.0626
1.2846
由上表综合比较AIC、SBC、标准差,可以看出Auto-regressive莫型整体优于ARIMA模型,所以Auto-regressive模型更适合第三产业占GDP比重的研究。
通过对第三产业数据做时序图和拟合模型可以看出,我国第三产业的发展趋势并不是一成不变的,从1962~1982年间我国的第三产业比重不增反减,这与当时的历史背景有关。
经过改革开放的产业调整,直到2000年,第三产业比重有了明显的增长。
但好景持续的并不久,2001年之后第三产业的比重虽然也在增加,但发展缓慢,我国的第三产业发展还不完善,可待发展的空间很大,目前第三产业的发展速度与总GDP发展的速度相比还有点缓
慢,所以加大第三产业比重还是当务之急。
通过已建立的模型对未来五年的第三产业比重做预测如表12所示。
表12模型预测值
年份
ARIMA模型
Auto-regressive模型(*)
2009
40.0642
40.3292
2010
40.7049
40.5873
2011
40.3846
40.8471
2012
40.5447
41.1015
2013
40.2244
41.3726
(*)代表Auto-regressive模型更适合第三产业产值的预测和拟合,在预测时更具有参考价值。
我们从上表中可以直观的看出第三产业的比重在最近一段时间并没有一个质的提高,
我们可以通过分析第三产业各行业的比重来优化第三产业结构,促进第三产业的发展
七、第三产业及其结构分析结论与对策建议
经过上述对各年第三产业占GDP比重的发展趋势的分析,我们发现在1978年改革开放之后第三产业所占的比重迅速增加,增长趋势越来越快。
第三产业是国民经济的重要组成部分,其发展水平是衡量经济社会发展程度的重要标志。
当前,我国正处于工业化的中期阶段,社会经济的发展正快速步入城市化、市场化、国际化的轨道。
加快发展
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 时间 序列 模型 我国 第三产业 及其 结构 实证 分析