完整word版计量经济学实验报告多元线性回归分析精品资料docx.docx
- 文档编号:9333141
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:22
- 大小:24.82KB
完整word版计量经济学实验报告多元线性回归分析精品资料docx.docx
《完整word版计量经济学实验报告多元线性回归分析精品资料docx.docx》由会员分享,可在线阅读,更多相关《完整word版计量经济学实验报告多元线性回归分析精品资料docx.docx(22页珍藏版)》请在冰豆网上搜索。
完整word版计量经济学实验报告多元线性回归分析精品资料docx
实验2:
多元线性回归分析
实验目的:
学习利用Eviews建立多元线性回归模型,研究
率之间的关系。
64国家婴儿死亡率与妇女文盲
一、实验内容:
1、先验的预期
CM和各个变量之间的关系。
2、做
CM对
FLR的回归,得到回归结果。
3、做
CM对
FLR和
PGNP的回归,得到回归结果。
4、做
CM对
FLR,PGNP和
TFR的回归结果,并给出
ANOVA。
5、根据各种回归结果,选择哪个模型?
为什么?
6、如果回归模型(
4)是正确的模型,但却估计了(
2)或(
3),会有什么后果?
7、假定做了(
2)的回归,如何决定增加变量
PGNP
和
TFR?
使用了哪种检验?
给出
必要的计算结果。
二、实验报告
----多元线性回归分析
1、问题提出
婴儿死亡率(CM)是指婴儿出生后不满周岁死亡人数同出生人数的比率。
一般以年度为计
算单位,以千分比表示。
婴儿死亡率是反映一个国家和民族的居民健康水平和社会经济发展
水平的重要指标,特别是妇幼保健工作水平的重要指标。
婴儿死亡率(CM)的高低是一个国家或地区社会经济多方面因素协调发展的结果。
由于世
界各国婴儿死亡率差别很大,所以就64个国家社会综合发展状况,针对性的研究婴儿死亡
率(CM)与女性识字率(FLR)、人均GNP(PGNP)、总生育率(TFR)之间的关系
2.指标选择
本次实验研究婴儿死亡率与妇女文盲率之间的关系,故应采用婴儿死亡率(CM)和女性识字率(FLR)作为指标。
但影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育
率等也会对其产生重要影响,考虑到实验的准确性,故引入人均GNP(PGNP)和总生育率(TFR)相关数据。
3.数据来源
数据来源:
教师提供
原始数据如下:
婴儿死亡率CM
女性识字率FLR
人均GNPPGNP
总生育率TFR
128
37
1870
6.66
204
22
130
6.15
202
16
310
7
197
65
570
6.25
96
76
2050
3.81
209
26
200
6.44
170
45
670
6.19
240
29
300
5.89
241
11
120
5.89
55
55
290
2.36
75
87
1180
3.93
129
55
900
5.99
24
93
1730
3.5
165
31
1150
7.41
94
77
1160
4.21
96
80
1270
5
148
30
580
5.27
98
69
660
5.21
161
43
420
6.5
118
47
1080
6.12
269
17
290
6.19
189
35
270
5.05
126
58
560
6.16
12
81
4240
1.8
167
29
240
4.75
135
65
430
4.1
107
87
3020
6.66
72
63
1420
7.28
128
49
420
8.12
27
63
19830
5.23
152
84
420
5.79
224
23
530
6.5
142
50
8640
7.17
104
62
350
6.6
287
31
230
7
41
66
1620
3.91
312
11
190
6.7
77
88
2090
4.2
142
22
900
5.43
262
22
230
6.5
215
12
140
6.25
246
9
330
7.1
191
31
1010
7.1
182
19
300
7
37
88
1730
3.46
103
35
780
5.66
67
85
1300
4.82
143
78
930
5
83
85
690
4.74
223
33
200
8.49
240
19
450
6.5
312
21
280
6.5
12
79
4430
1.69
52
83
270
3.25
79
43
1340
7.17
61
88
670
3.52
168
28
410
6.09
28
95
4370
2.86
121
41
1310
4.88
115
62
1470
3.89
186
45
300
6.9
47
85
3630
4.1
178
45
220
6.09
142
67
560
7.2
表1
4.数据处理
此次实验可直接使用数据,无需进行数据处理。
5.先验的预期CM和各个变量之间的关系【题1】
5-1预期CM与FLR存在负相关关系。
一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善
于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越
多,可以更好的保障自己和婴儿的生活。
因此,我们预期FLR的提高会导致CM降低。
5-2预期CM与PGNP存在负相关关系。
人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心
自己及其后代的身体健康,提高生活质量。
因此,我们预期PGNP的提高会导致CM降
低。
5-3预期CM与TFR存在正相关关系。
总生育率直接或间接地影响着婴儿死亡率,总生育率提高,人口数量上升,人均GNP,
人均受教育程度等一系列人均享受的权利和福利都会有所下降。
因此,我们预期TFR
的提高会导致CM降低。
6.数据分析
6-1对各个变量数据进行观察分析
观察数据可知0CM1000,0
FLR1000,PGNP0,TFR0,与经济社会现
实相符,不存在与经济意义相违背的数据,
所以可以保证我们所取的各项数据满足此次实验
要求。
6-2变量的相关性
①CM与FLR的相关性
FLRCM
FLR1.000000-0.818285
CM-0.8182851.000000
表2
图1
由散点图(图1)和相关系数(表2)知,这两组数据的相关性较高,满足实验要求,
且CM与FLR之间存在负相关关系,与预期相反。
②CM与PGNP的相关性
PGNP
PGNPCM
1.000000-0.407697
CM-0.4076971.000000
图2表3
由散点图(图2)和相关系数(表3)知,这两组数据有一定的相关性,满足实验要求,且CM与PGNP之间存在负相关关系,与预期相同。
③CM与TFR的相关性
TFRCM
TFR1.0000000.671135
CM0.6711351.000000
图3表3
由散点图(图3)和相关系数(表3)知,这两组数据的相关性较高,满足实验要求,
且CM与TFR之间存在正相关关系,与预期相同。
总结:
CM与FLR之间存在负相关关系,与PGNP之间存在负相关关系,与TFR之间存
在正相关关系。
7.建立模型及模型检验
7-1CM对FLR的回归模型建立及检验
【题2】
(1)建立回归模型
根据图1,建立如下线性模型:
CMi
01FLRii
得出回归结果:
图4
回归方程式:
CM2.390496*FLR263.8635【回归模型
(2)】
其中:
Se(0.213263)(12.22499)
t(11.20917)(21.58395)p(0.0000)(0.0000)
R2
0.669590
F125.6455
(2)模型检验
①经济意义检验
^
所估计的参数
1=-2.390496,说明女性识字率
(FLR)与婴儿死亡率(CM)负
相关,且在其他条件不变的情况下女性识字率
(FLR)增加1%,可导致婴儿死亡率(CM)
减少2.390496%。
②统计检验
A、拟合优度检验:
可决系数R20.669590,说明所建模型整体上对样本数据还不算很好,即解释
变量CM对FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。
B、t检验:
对回归系数的
t
检验:
针对H0:
0=0H1:
0≠0和H0:
1=0
H1:
1≠0,
4
^
^
由图
可知:
估计的回归系数
0
的标准误差和
t值分别为
Se(
0
)=12.22499,
t(
^
^
^
0
)=21.58395;
1的标准误差和t
值分别为
Se(
1
)=0.213263,
^
的临界值t0.025(62)
t(
1)=-11.20917.
取α=0.05,
查t分布表得自由度为
n-2=64-2=62
^
)=21.58395>t0.025(62)=2.000
H0:
=2.000,因为t(
0
所以拒绝原假设
0=0;因为
^
t0.025(62)=-2.000,所以拒绝原假设H0:
t(
1)=-11.20917<-
1=0。
这说明在95%
的置信水平下,解释变量女性识字率(FLR)通过了显著性检验,即解释变量女性识字率(FLR)对婴儿死亡率(CM)有显著影响。
7-2CM对FLR和PGNP的回归模型建立及模型检验【题3】
(1)建立回归模型
根据图2,建立如下线性模型:
CMi01FLRi2PGNPii
得出回归结果:
图5
回归方程式:
CM2.231586*FLR0.005647*PGNP263.6416【回归模型
(3)】
其中:
Se(0.209947)(0.002003)(11.59318)
t(10.62927)(2.818703)(22.74109)p(0.0000)(0.0065)(0.0000)
R20.707665F73.83254
(2)模型检验
①经济意义检验
^
^
所估计的参数
1,2
均为负数,说明女性识字率
(FLR)和人均GNP(PGNP)与婴儿
的死亡率(CM)负相关,与预期假设相同。
^
1=-2.231586表示,在其他变量保持不
^
变的情况下,女性识字率每增加
1%,婴儿死亡率减少
2.231586%。
2=-0.005647表
明,在其他变量保持不变的条件下,人均
GNP每增加1%,婴儿死亡率减少0.005647%。
②统计检验
A、拟合优度检验:
可决系数R2=0.707665,说明所做模型对样本数据大体上拟合不是很好,可能还
有其他因素对婴儿死亡率产生影响。
B、t检验:
对回归系数的t检验:
在显著性水平α=0.05,查t
分布表得自由度为
n-3=64–
^
3=61的临界值t0.025(61)=2.000,由图5知t(1
)=-10.62927<-
t0.025(61)
^
=-2.00t
(2)=-2.818703<-t0.025(61)=-2.0000,
。
说明在95%的置信水平下,
解释变量女性识字率(FLR)和人均GNP(PGNP)均通过了显著性检验,即解释变量女性识字率(FLR)和人均GNP(PGNP)对婴儿死亡率(CM)有显著影响。
7-3CM对FLR、PGNP和TFR的回归模型建立及模型检验,并给出ANOVA。
【题4】
(1)建立回归模型
根据图2,建立如下线性模型:
CMi01FLRi2PGNPi3TFRi
得出回归结果:
图5
回归方程式:
1.768029
0.005511
12.86864
168.3067
CM
FLR
PGNP
TFP
【回归模型(4)】
其中:
Se(0.248017)(0.001878)(4.190533)(32.89165)
t(7.128663)(2.934275)(3.070883)(5.117003)
p(0.0000)(0.0047)(0.0032)(0.0000)
R20.747372F59.16767
(2)模型检验
①经济意义检验
^
^
^
所估计的参数
1,
2均为负数,
3为正数,说明女性的文化率
(FLR)和人均
GNP(PGNP)与婴儿的死亡率
(CM)负相关,总生育率(TFR)和婴儿的死亡率(CM)正相关,
^
与预期假设相同。
1=–1.768029表示,在其他变量保持不变的情况下,女性识字率
每增加1%,婴儿死亡率减少
1.768029%。
^
2=-0.005511表明,在其他变量保持不变的条
^
件下,人均GNP每增加1%,婴儿死亡率减少
-0.005511%。
3=12.86864表明,总生育率增
加1%,婴儿死亡率增加12.86864%。
②统计检验
A、拟合优度检验:
可决系数R2=0.747372,说明所做模型整体对样本数据拟合较好,即解释变量
FLR、PGNP和TFR对CM的大多数差异作了解释,但该模型仍有进一步改良的空间。
B、t检验:
在显著性水平α=0.05,
查t分布表得自由度为n-4=64–4
=60的临界值t0.025
^
t0.
^
(60)=2.000,由图6知t(
1)=-7.128663<-
025(60)=-2.000,
t
(2)=-2.934275
<-t0.025(60)=-2.0000,t(
^
t0.
3)=3.070883>
025(60)=2.000.
说明在95%的置信
水平下,解释变量女性识字率
(FLR),
人均GNP(PGNP)和总生育率(TFR)均通过了显著性
检验,即解释变量女性识字率
(FLR)
、人均GNP(PGNP)、总生育率(TFR)对婴儿死亡率
(CM)均有显著影响。
(3)给出ANOVA:
四变量回归模型的方差分析表:
(检验联合假设b2=b3=b4=0或R2=0)
变异来源
平方和
自由度
MSS=ss/d.f
k1
jyixij
来自回归ESS
jyixij
k-1
j1
k
1
来自残差RSS
ei2
n-k
n
ei
2
k
总计TSS
yi2
n-1
表4
由于ESS=R2*TSS,RSS=(1-R2)*TSS,可知:
ESS/d.f
(2
yixi23
yixi3
4yixi4)/3
F
ei2/60
RSS/d.f
F服从分子自由度为
3,分母自由度为
n-4的F分布;F分布用于联合统计检验。
H0:
R2=0,H1:
R2≠0,得
ESS/3
R2/3
0.747372/3
F
(1
R2)/61
60.15
RSS/(n4)
(10.747372)/61
又当α=5%,d.f=3.60时F分布的临界值约为
2.76
∵F=60.15>2.76,
∴拒绝H0:
R2=0。
从上述方差分析以及
F检验所得出的结果显示实验所得出的结果拒绝零假设:
妇女文
盲率、人均国民生产总值和总生育率联合对婴儿死亡率没有影响;
实验结果不仅拒绝零假设:
FLR(妇女文盲率)、PGNP(人均国民生产总值)和TFR(总生育率)各自是统计不显著的,而且拒绝零假设:
FLR(妇女文盲率)、PGNP(人均国民生产总值)和TFR(总生育率)是联合不显著的。
因此F联合检验通过。
8、结果解释
8—1根据各种回归结果,选择哪个模型?
为什么?
【题5】
根据各种回归结果,应选择CM对FLR,PGNP和TFR的回归模型。
因为从各个回归结果中的可决系数看,CM对FLR的回归模型中=0.669590,CM对FLR和PGNP回归模型中=0.707665,CM对FLR,PGNP和TFR的回归模型中=0.747372,因为CM对FLR,PGNP和TFR的回归模型中最大,对样本数据的拟合程度最高
8—2、如果回归模型(4)是正确的模型,但却估计了
(2)或(3),会有什么
后果?
【题6】
如果回归模型CM对FLR,PGNP和TFR是正确的模型,但却估计了前两种回归模型,就忽略了影响婴儿死亡率的其他重要因素,而且根据上面各模型的分析可知正确回归模型中
FLR,PGNP和TFR这三个解释变量的系数的绝对值都小于其他模型,采用前两种回归模型
会使模型中仅有的解释变量对被解释变量的影响增大,使回归模型的误差可能很大,失去其意义,甚至得出与实际相反的结论。
8—3、假定做了
(2)的回归,如何决定增加变量PGNP和TFR?
使用了哪种检验?
给出必要的计算结果。
【题7】
在实际中,为了解释某个现象,往往面临着在若干解释变量间进行取舍的问题。
通常的做法
2
于1,修正判定系数就会增加,这里的t值是在零假设:
总体系数为零下计算得到的。
①增加变量PGNP
CMi
0
1FLRi
i
*
CMi
0
1FLRi
2PGNPi
i
**
**可以看做*的受约束回归,此时
H0:
2=0,H1:
2≠0,F[(21),(643)]。
(RSSR
RSSU)
(KU
KR)
F
RSSU
(nku
1)
=(120163.0106315.6)1
106315.661
=7.945
显著性水平为
5%的情况下,自由度为(1,61)的F统计量的临界值为
F0.05=4.00<7.945,所
以拒绝原假设H0:
2=0,接受
2≠0,PGNP对CM有显著影响,因此加入
PGNP这一变量。
②增加变量TFR
CMi0
1FLRi
2PGNPi
3TFR
i
***
***可以看做**的受约束回归,此时
H0:
3=0,H1:
3≠0,F[(3
2),(644)]。
(RSSR
RSSU)
(KU
KR)
F
RSSU
(n
ku1)
=(106315.691875.38)1
91875.3860
=9.43
显著性水平为5%的情况下,自由度为(1,60)的F统计量的临界值为F0.05=4.00<9.43,
所以
拒绝原假设H0:
3=0,接受
3≠0,TFR对CM有显著影响,因此加入解释变量
TFR.
9、实验总结
(1)现实生活中的大多数经济现象并不只受一种因素制约,多元线性回归模型某种意义上
比一元线性回归模型更具普适性。
由于存在多个解释变量,需要考虑变量选择等问题,
只有
经过不断的调试才会找到合适的模型。
在模型建立并得出参数后还要对模型进行经济检验和
统计检验,以确定模型的适用性。
(2)在实验之前先判断了先验的预期
CM对各个变量间的关系,但是在具体的实验过程中得
到的数据显示结果与预期有部分冲突,
说明该实验所得到的模型不是一个设定型模型,
实验
存在着设定误差。
这是因为解释变量(妇女识字率
FLR)与被解释变量(婴儿死亡率
CM)之
间的因果关系并不确定,只是我们从理论上进行的预测。
(3)进行多元线性回归分析时,解释变量多少的界定标准主要来自于校正判定系数
R2
是
否随着解释变量的逐渐增多而逐渐增大,
同时考虑校正后的模型是否通过了统计检验,
特别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 计量 经济学 实验 报告 多元 线性 回归 分析 精品 资料 docx