计量经济学多重共线性异方差虚拟变量随机解释变量大作业DOC.docx
- 文档编号:10770167
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:24
- 大小:347.62KB
计量经济学多重共线性异方差虚拟变量随机解释变量大作业DOC.docx
《计量经济学多重共线性异方差虚拟变量随机解释变量大作业DOC.docx》由会员分享,可在线阅读,更多相关《计量经济学多重共线性异方差虚拟变量随机解释变量大作业DOC.docx(24页珍藏版)》请在冰豆网上搜索。
计量经济学多重共线性异方差虚拟变量随机解释变量大作业DOC
影响我国居民消费因素分析
班级:
组员:
一、提出问题:
1、原因:
居民消费水平是按国民收入或国内生产总值的使用总量中用于居民消费的总额除以年平均人口计算的,它反映一个国家或一个地区居民的一般消费水平。
居民消费水平是GDP中一个重要组成部分,是拉动经济增长的三驾马车之一,在拉动经济增长的三架马车中,最终消费对经济影响的最大,是拉动经济增长最重要最稳定的因素。
我国经济正逐渐由投资拉动型增长向消费拉动型增长转变,居民消费一直是经济学家关注的焦点和研究的热门领域。
居民消费对经济的发展和社会的进歩有着重要的引导作用,居民消费的结构、质量和增长趋势如何,在很大程度上决定着经济、社会的发展情况。
要充分发挥消费对经济的拉动作用,关键问题是如何保证居民的消费水平。
在人均国民生产总值为一千美元时,世界各国的居民消费率一般为60%左右。
而我国的人均国民生产总值早已超过了一千美元,但2013年全国居民的消费率仅36%,严重低于正常水平。
消费需求的偏低导致消费对经济增长的拉动作用也偏弱,因此提高居民消费率,增加居民消费对经济增长的贡献度,是一项重要工作。
通过对历年我国居民消费水平的分析,我们可以对消费水平发展有一个清晰的画面,并且能透过数据的表象来分析更深层次的国家调控手段和战略使用。
2、研究立场:
政策制定者
二、文献综述:
根据国外相关研究成果,主要有恩格尔的理论、绝对收入、相对收入、持久收入和生命周期消费理论等。
Caballero(1990)指出,当期劳动收入发生变化表明未来的收入发生变化的可能性比较大,为维持未来消费的稳定性,需要进行预防性储蓄,从而会降低当期消费,使得长期的消费得到"平滑"。
国内研究得出的消费率的影响因素主要包括:
居民收入占比,收入分配差距,不确定性,流动性约束和房价。
齐吴珍认为居民消费的主要影响因素有:
居民收入的增长率、收入分配差距、不确定性、流动性约束和房价等。
目前,多数学者通过建立消费与收入的模型或者消费分别与城乡居民收入建立模型进行分析,结果显示:
1、收入是决定居民消费水平的主要因素,收入增加的快慢是影响居民消费需求变化的重要原因。
2、农村居民收入、财政支出水平、城市化水平、农村社会保障制度均对农村居民消费需求起正向作用,城乡居民收入差距起负向作用,农村内部收入分配差距与消费需求不存在显著相关关系。
3、收入的不确定性、以及出于预防动机,我国居民储蓄率高,在一定程度上影响消费水平。
三、模型建立:
1、假设提出:
影响居民消费的因素主要有居民收入、物价水平、国家货币政策、利率水平、居民消费观念、商品供给、消费者心理、风俗习惯、人均国民生产总值等,其中,居民收入又可以分为城镇居民收入水平和农村居民收入水平。
所以。
我们选取人均居民消费作为被解释变量Y,人均国内生产总值X1、居民消费价格指数X2、活期利率X3、城镇居民可支配收入X4、农村居民可支配收入X5为解释变量。
由于国家的货币政策也可能对居民消费水平产生一定的影响,而货币政策为定性变量,于是以货币政策为虚拟变量D1引入模型。
其中,X1、X4、X5为正影响,而X2、X3为负影响。
2、理论基础:
有关居民消费与消费收入的关系。
现代西方宏观经济学的奠基人——凯恩斯的绝对收入消费理论对此做出了很好的解释。
凯恩斯消费理论可以用来有效地描述与分析消费与收入的关系,凯恩斯认为:
随着收入的增加。
消费也会随着增加,但是消费的增加不及收入增加多。
根据宏观经济学,不同消费阶层的消费倾向不同,因此城乡居民收入对消费的影响并不相同。
城乡收入差距,也会对居民消费产生影响。
同时,当收入一定,利率水平也会对消费水平产生影响。
当利率水平高,人们倾向于增加储蓄,导致消费减少;当利率水平低,人们倾向于减少储蓄,增加当期消费。
3、理论模型:
1、形式确定---散点图
通过OLS可得模型的散点图如下:
从散点图可以看出人均居民消费水平(Y)与人均国内生产总值(X1)、居民消费价格指数(X2)、活期利率(X3)、城镇居民可支配收入(X4)、农村居民可支配收入(X5)大体呈现为线性关系。
因此我们建立线性模型。
2、建立模型:
数据来源:
通过《中国统计年鉴》和国家统计总局收集的数据
年份
人均居民消费(元)
Y
人均国内生产总值(元)X1
居民消费价格指数(%)
X2
活期利率(%)X3
城镇居民可支配收入(元)X4
农村居民可支配收入(元)
X5
1978
184
381.2311068
100.7
2.16
343.4
133.6
1979
208
419.2504918
101.9
2.16
405
160.2
1980
238
463.2530241
107.5
2.88
477.6
191.3
1981
264
492.1632235
102.5
2.88
500.4
223.4
1982
288
527.780352
102
2.88
535.3
270.1
1983
316
582.6828203
102
2.88
564.6
309.8
1984
361
695.2009219
102.7
2.88
652.1
355.3
1985
446
857.8204998
111.9
2.88
739.1
397.6
1986
497
963.1866831
107
2.88
899.6
423.8
1987
565
1112.377322
108.8
2.88
1002.2
462.6
1988
714
1365.505933
120.7
2.88
1181.4
545
1989
788
1519.002289
116.3
2.88
1372.9
601.5
1990
833
1644
103.1
2.16
1510.2
686.3
1991
932
1892.759642
103.4
1.8
1700.6
708.6
1992
1116
2311.087535
106.4
1.8
2026.6
784
1993
1393
2998.364339
114.7
3.15
2577.4
921.6
1994
1833
4044.004115
124.1
3.15
3496.2
1221
1995
2355
5045.729919
117.1
3.15
4283
1577.7
1996
2789
5845.886547
108.3
1.98
4838.9
1926.1
1997
3002
6420.180477
102.8
1.71
5160.3
2090.1
1998
3159
6796.030369
99.2
1.44
5425.1
2162
1999
3346
7158.501579
98.6
0.99
5854.02
2210.3
2000
3632
7857.676093
100.4
0.99
6280
2253.4
2001
3887
8621.70622
100.7
0.99
6859.6
2366.4
2002
4144
9398.054458
99.2
0.72
7702.8
2475.6
2003
4475
10541.97114
101.2
0.72
8472.2
2622.2
2004
5032
12335.577
103.9
0.72
9421.6
2936.4
2005
5573
14185.35951
101.8
0.72
10493
3254.9
2006
6263
16499.704
101.5
0.72
11759.5
3587
2007
7255
20169.46136
104.8
0.72
13785.8
4140.4
2008
8349
23707.71462
105.9
0.36
15780.76
4760.62
2009
9098
25575.48313
99.3
0.36
17174.65
5153.17
建立时间序列数据的计量经济模型,并进行回归分析。
假设建立如下线性一元回归模型:
Y=C+β1X1+β2X2+β3X3+β4+X4+β5X5+μ
其中,Y表示人均居民消费水平,X1表示人均国内生产总值、X2表示居民消费价格指数、X3表示活期利率、X4表示城镇居民可支配收入、X5表示农村居民可支配收入、μ表示随机误差项。
四、实证研究:
1、参数估计:
假定所建模型及随机扰动项μ满足古典假定,可以用OLS法估计其参数,运用计算机软件EViews作计量经济分析。
通过OLS可得:
参数和估计结果为:
R2=0.999819F=28720.5
51.43143+0.010105X1-0.153435X2-34.23191X3+0.322822X4+0.631562X5
2、经济意义检验
所估计的参数β1>0,β2<0,β3<0,β4>0,β5>0这与经济理论——X1、X4、X5为正影响,而X2、X3为负影响相符。
3、统计学检验
(1)拟合优度检验:
从回归估计的结果看,模型拟合较好:
可决系数R2=0.999819说明所建模型整体上对样本数据拟合较好,即五个解释变量整体对被解释变量“人均居民消费”的绝大部分差异作出了解释。
(2)统计学检验:
C的Prob=0.7148>0.05,β1的Prob=0.5076>0.05,β2的Prob=0.9285>0.05,β3的Prob=0.1391>0.05,β4的Prob=0<0.05,β5的Prob=0<0.05因此,在置信度
=0.05时,Y与X4、X5之间存在显著的函数关系,Y与X1、X2、X3之间不存在显著性关系,有可能是由于序列相关或多重共线性导致。
F值=28720.5>F0.05(5,26)=2.59,因此拒绝原假设,认为Y与X1、X2、X3、X4、X5之间存在显著的函数关系。
4、序列相关性检验
为了保证回归参数估计量具有良好的统计性质,对模型进行序列相关性检验。
(1)DW检验
DW=1.371177,表明在5%的显著性水平下,n=32,k=6(包含常数项),查表得dL=1.11,dU=1.82,由于dL (2)拉格朗日乘数检验 假设随机干扰项存在P阶序列相关,建立辅助回归模型: et=β0+β1Xt1+…+βkXtk+ρ1et-1+ρpet-p+εt 假设约束条件 H0=ρ1=ρ2=…=ρp=0 则LM统计量服从如下分布: LM=nR2~X2(p) 通过OLS可得: 一阶滞后: et=-26.71645+0.006116X1+0.331876X2-3.37547X3-0.014957X4+0.19273X5+0.330864et-1 R2=0.100409 LM=31*0.100409=3.112679,该值小于显著性水平为5%、自由度为1的X2分布的临界值X20.05 (1)=3.84,并且C、X1、X2、X3、X4、X5的P值均大于0.05,由此判断原模型不存在1阶序列相关性。 二阶滞后: et=-28.62072-0.000698X1-0.233834X2-0.836444X3+0.003502X4-0.00893X5+0.399594et-1-0.326993et-2 R2=0.179172 LM=30*0.179172=5.37516,该值小于显著性水平为5%、自由度为2的X2分布的临界值X20.05 (2)=5.99,并且C、X1、X2、X3、X4、X5的P值均大于0.05,由此判断原模型不存在2阶序列相关性。 三阶滞后: et=44.91375-0.001751X1-0.309242X2-3.288791X3+0.007639X4-0.019222X5+0.358667et-1-0.296108et-2-0.130782et-3 R2=0.189971 LM=29*0.189971=5.509159,该值小于显著性水平为5%、自由度为3的X2分布的临界值X20.05(3)=7.81,并且C、X1、X2、X3、X4、X5的P值均大于0.05,由此判断原模型不存在3阶序列相关性。 因此,结合1阶、2阶和3阶滞后残差项的辅助回归情况,可判断原模型不存在序列相关性。 5、多重共线性检验 (1)检验简单相关系数 X1、X2、X3、X4、X5的相关系数如下: 由表中数据可粗略得出结论: X1、X4、X5间存在高度相关性,相关程度达到98%以上。 (2)综合统计检验法 在OLS法下,R2=0.999819较大,F=28720.5较大,各参数t值普遍较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立性作用不能分辨。 (3)判定系数检验法 如果回归: Xji=a1X1i+a2X2i+…aLXLi的判定系数较大,说明Xj与其他X间存在共线性。 建立X1与其余解释变量之间的关系: X1~X2、X3、X4、X5 X1=1893.87-37.86014X2+696.1210X3+2.130994X4-1.918884X5 (1.086)(-1.856)(2.742)(12.191)(-3.141) R2=0.995958F=1663.318 建立X2与其余解释变量之间的关系: X2~X1、X3、X4、X5 X2=77.84993-0.002987X1+10.20504X3+0.006291X4-0.001881X5 (15.276)(-1.856)(6.276)(1.668)(-0.769) R2=0.631553F=11.57012 建立X3与其余解释变量之间的关系: X3~X1、X2、X4、X5 X3=-3.311418+0.000313X1+0.058135X2-0.000638X4+0.000104X5 (-3.278)(2.742)(6.276)(-2.342)(0.217) R2=0.90731F=66.07369 建立X4与其余解释变量之间的关系: X4~X1、X2、X3、X5 X4=-866.8531+0.39712X1+14.85791X2-264.5762X3+1.284184X5 (-1.155)(12.191)(1.668)(-2.342)(6.974) R2=0.998386F=4175.417 建立X5与其余解释变量之间的关系: X5~X1、X2、X3、X4 X5=256.5322-0.139437X1-1.731949X2+16.78327X3+0.500744X4 (0.537)(-3.141)(-0.297)(0.217)(6.974) R2=0.992853F=937.6933 由上结果可知: X1、X4、X5作为被解释变量时,R2均较大且接近于1,F值均大于临界值F0.05(3,28)=2.95,可知拒绝原假设,即X1、X4、X5与其他解释变量之间存在显著的线性关系。 (4)逐步回归法 分别做Y对X1、X2、X3、X4、X5的一元线性回归,检验和解决多重共线的问题。 根据比较系数由大到小排序为: X4、X5、X1、X3、X2 建立Y与X4之间的关系: Y~X4 R2=0.998438,参数符号合理且通过t检验。 引入X5,R2=0.999775,拟合优度显著提高,且参数符号合理,变量也通过了t检验,X5应保留。 引入X1,R2=0.999775,拟合优度没有明显提高,且X1参数符号不合理,没有通过t检验,可知X1与其他变量存在明显共线性,应删去。 引入X3,R2=0.999815,拟合优度显著提高,且参数符号合理,变量也通过了t检验,X3应保留。 引入X2,R2=0.999816,拟合优度没有明显提高,且X1、X2没有通过t检验,可知X2与其他变量存在明显共线性,应删去。 因此,删去X1、X2,保留X3、X4、X5,最后修正多重共线性的模型为: Y=26.9384-31.11X3+0.34X4+0.61X5 6、内生性检验 (1)检验X3内生性: 引入X3(-1)作为工具变量,建立X3与X3(-1)的关系,做OLS估计,得出残差项。 X3=1.039965403+0.0002967850097*X4-0.001205628266*X5+0.7217887473*X3(-1) 将残差项带入原模型后,再进行OLS估计: 随机干扰项E3参数P值为0.0276<0.05,可知在显著性水平5%情况下,拒绝原假设,即X3为同期内生变量。 (2)检验X4内生性: 引入X4(-1)作为工具变量,建立X4与X4(-1)的关系,做OLS估计,得出残差项。 X4=-677.7898694+235.2705421*X3+0.2652176884*X5+1.074623124*X4(-1) 将残差项带入原模型后,再进行OLS估计: 随机干扰项E4参数P值为0.0628>0.05,可知在显著性水平5%情况下,接受原假设,即X4不为同期内生变量。 (3)检验X5内生性: 引入X5(-1)作为工具变量,建立X5与X5(-1)的关系,做OLS估计,得出残差项。 X5=-180.8796546+86.23070027*X3+0.09163039385*X4+0.8181998105*X5(-1) 将残差项带入原模型后,再进行OLS估计: 随机干扰项E5参数P值为0.0218<0.05,可知在显著性水平5%情况下,拒绝原假设,即X5为同期内生变量。 由此可知: 活期利率(X3)和农村居民可自支配收入(X5)为内生变量。 (4)内生性修正: 工具变量法 建立X3关于工具变量X3(-1)的回归X3=α0+α1X3(-1),进行OLS进行估计: X3=0.02511861828+0.9578026973*X3(-1) 建立X5关于工具变量X5(-1)的回归X5=α0+α1X5(-1),进行OLS进行估计: X5=16.78062047+1.096225071*X5(-1) 以第一步得到的X3、X5为解释变量,建立模型Y=β0+β1X3+β2X4+β3X5,进行OLS估计: 得出修正后的最终模型: Y=937.7947776-466.1761956*X3F+0.6007897253*X4-0.3291427588*X5F F=0.999095接近于1,可知修正模型效果良好。 且各参数均通过t检验,可知各解释变量显著。 7、引入虚拟变量 由于我国在不同时期根据经济形势不同而实行了不同的货币政策,比如1994~1997年间实行适度从紧的货币政策,1998至今实行稳健的货币政策。 因此,在修正多重共线性后的的模型: Y=26.9384-31.11X3+0.34X4+0.61X5基础上,引入货币政策这一虚拟变量,研究适度从紧的货币政策与稳健的货币政策对我国居民消费水平的影响。 设Di=1,稳健的货币政策 0,适度从紧的货币政策 其中,1978-1997时D1=0.1998-2009时D1=1. 由于货币政策通过影响利率(x3)影响居民消费所以采用乘法引入。 则全体居民的消费模型可建立如下: Y=β0+β1X3+β2X4+β3X5+β4D1X3+μ 在E(μ)=0的假定下,上述模型所表示的函数可化为: 稳健的货币政策E(Y|Xi,D1=1)=β0+β2X4+β3X5+(β1+β4)X3 适度从紧的货币政策: E(Y|Xi,D1=0)=β0+β2X4+β3X5+β1X3 对模型做OLS估计: 可知参数β4的P值为0.0819>0.05,可知未通过t检验,接受原假设,则可判定货币政策选择的差异对我国人均消费水平并未有影响。 8、模型预测检验 为预测2010年我国人均居民消费水平,取X1=10000,X2=26000,X3=100,X4=0.36,X5=18000,X6=6000,可知预测值为9430.937 五、结论及政策建议: 通过研究我们最后发现利率水平和城乡居民收入水平对居民消费产生很大影响。 通过模型Y=26.9384-31.11X3+0.34X4+0.61X5可以看出,在其他条件不变的情况下,利率每上升1个单位,居民消费减少31.11;城镇居民收入每增加1个单位,居民消费增加0.34;农村居民收入每增加1个单位,居民消费增加0.61。 由于利率水平虽然对居民消费会产生显著影响,但改变利率水平将对国民经济产生深重影响,因此政府在提高居民消费水平时,应主要关注提高城镇和农村居民水平,尤其是农村居民收入水平。 作为政府要1、改进初次分配,农民增收,重视提高家庭经营性收入。 2、重点加大财政在三农领域的投入。 3、支持加快发展农村公共事业,增加农民低保补贴。 六、研究局限性: 1、本文只针对以上几个因素进行了分析研究,在实际过程中,利率水平、收入分配状况、风俗习惯、消费信贷状况消费者年龄构成、消费者偏好等也会对我国消费水平产生影响。 2、研究结论显示货币政策的调整对居民消费没有显著影响,与经济常识有所背离,可能是数据选取或者样本容量太少造成的,模型构建仍有待解决的问题。 3、样本容量并未覆盖各阶段,只截取了一部分年份。 4、只有纵向比较,没有横向进行各地区比较。 5、并未深入研究,浮于表面。 七、参考文献: 《我国居民消费及其影响因素分析》--齐吴珍—安徽大学 《我国居民消费水平影响因素的实证分析》--刘慧敏--吉林财经大学 《我国农村居民消费需求影响因素的实证分析》--宋焕如—山东大学 《中国统计年鉴2010》---中国人民共和国国家统计局---中国统计出版社
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 多重 线性 方差 虚拟 变量 随机 解释 作业 DOC