实验四多重共线性模型的检验和处理.docx
- 文档编号:8772151
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:12
- 大小:177.61KB
实验四多重共线性模型的检验和处理.docx
《实验四多重共线性模型的检验和处理.docx》由会员分享,可在线阅读,更多相关《实验四多重共线性模型的检验和处理.docx(12页珍藏版)》请在冰豆网上搜索。
实验四多重共线性模型的检验和处理
实验四-多重共线性模型的检验和处理
实验报告
课程名称:
计量经济学
实验项目:
实验四多重共线性模型的
检验和处理
实验类型:
综合性□设计性□验证性☑
专业班别:
11本国贸五班
姓名:
学号:
实验课室:
厚德楼A207
指导教师:
实验日期:
2014/5/20
广东商学院华商学院教务处制
一、实验项目训练方案
小组合作:
是□否☑
小组成员:
无
实验目的:
掌握多重共线性模型的检验和处理方法:
实验场地及仪器、设备和材料
实验室:
普通配置的计算机,Eviews软件及常用办公软件。
实验训练内容(包括实验原理和操作步骤):
【实验原理】
多重共线性的检验:
直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)
多重共线性的处理:
先验信息法、变量变换法、逐步回归法
【实验步骤】
(一)多重共线性的检验
1.直观判断法(R2值、t值检验)
根据广东数据(见附件1),先分别建立以下模型:
【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;
(请对得到的图表进行处理,以上在一页内)
【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。
观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。
【模型1】从上图可以得到,估计方程的判定系数R
很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。
所以,出现了严重的多重共线性。
【模型2】1】从上图可以得到,估计方程的判定系数R
很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
2.简单相关系数检验法
分别计算【模型1】和【模型2】的自变量的简单相关系数。
【模型1】
【模型2】
(请对得到的图表进行处理,以上在一页内)
根据计算的简单相关系数,判断模型是否存在多重共线性。
【模型1】可看出三个解释变量GDP1、GDP2和GDP3之间高度相关,存在严重的多重共线性。
【模型2】可以看出三个解释变量ZJ、YY和CZ之间也高度相关,特别是ZJ和CZ之间高度相关,必然也存在严重的多重共线性。
3.方差扩大因子法(辅助回归检验)
分别建立【模型1】和【模型2】的辅助回归。
计算各模型各个自变量的方差扩大因子(只需将计算的结果以表格形式列出即可)。
【模型1】根据广东数据,CS对GDP1、GDP2和GDP3的回归中,解释变量GDP1、GDP2和GDP3之间的辅助回归分别为:
【模型2】根据广东数据,TZG对ZJ、YY和CZ的回归中,解释变量ZJ、YY和CZ之间的辅助回归分别为:
根据以上结果,确定模型是否存在严重的多重共线性。
【模型1】三个回归方程均高度显著,特别是第二、三个方程,显示存在严重的多重共线性,特别是GDP2和GDP3之间存在严重的多重共线性,解释变量之间的相关系数检验也证实了这一点。
【模型2】三个回归方程均高度显著,特别是第一、三个方程,显示存在严重的多重共线性,特别是ZJ和CZ之间存在严重的多重共线性,解释变量之间的相关系数检验也证实了这一点。
(请对得到的图表进行处理,以上在一页内)
(二)多重共线性的处理
1.先验信息法、变量变换法
①已知【模型1】有一先验信息:
GDP3对CS的贡献是GDP1贡献的3倍。
根据该先验信息,我们可以将变量CS和GDP2作变量取对数变换,作出回归模型,判断是否消除了多重共线性。
根据该先验信息,请提出一个对模型变量变换的方法,消除模型多重共线性。
DependentVariable:
LOG(CS)
Method:
LeastSquares
Date:
05/20/14Time:
20:
00
Sample:
19782005
Includedobservations:
28
Coefficient
Std.Error
t-Statistic
Prob.
LOG(GDP2)
0.693037
0.030257
22.90493
0.0000
GDP1+3*GDP3
2.38E-05
5.55E-06
4.282605
0.0002
C
0.432967
0.174594
2.479844
0.0202
R-squared
0.991675
Meandependentvar
5.369302
AdjustedR-squared
0.991009
S.D.dependentvar
1.319281
S.E.ofregression
0.125097
Akaikeinfocriterion
-1.218493
Sumsquaredresid
0.391233
Schwarzcriterion
-1.075757
Loglikelihood
20.05890
Hannan-Quinncriter.
-1.174857
F-statistic
1488.955
Durbin-Watsonstat
1.002599
Prob(F-statistic)
0.000000
得回归方程为LOG(CS)=0.693037*LOG(GDP2)+2.38E-05*(GDP1+3*GDP3)+0.432967
基本消除了多重共线性。
(请对得到的图表进行处理,以上在一页内)
②已知【模型2】有一先验信息:
在企业折旧资金和营业盈余资金主要是会计账面对区别,资金常常是混在一起用的,不区分折旧资金和营业盈余资金的使用,因此我们可以将ZJ和YY加起来作为一个大的变量使用。
使用该先验信息,作回归模型,根据模型结果,判断是否消除了多重共线性。
DependentVariable:
TZG
Method:
LeastSquares
Date:
05/20/14Time:
20:
07
Sample:
19782005
Includedobservations:
28
Coefficient
Std.Error
t-Statistic
Prob.
ZJ+YY
0.461208
0.057748
7.986604
0.0000
CZ
1.069667
0.250413
4.271616
0.0002
C
30.63063
31.23066
0.980787
0.3361
R-squared
0.996815
Meandependentvar
1628.997
AdjustedR-squared
0.996561
S.D.dependentvar
2003.852
S.E.ofregression
117.5195
Akaikeinfocriterion
12.47204
Sumsquaredresid
345270.5
Schwarzcriterion
12.61478
Loglikelihood
-171.6086
Hannan-Quinncriter.
12.51568
F-statistic
3912.553
Durbin-Watsonstat
0.908575
Prob(F-statistic)
0.000000
得回归方程为TZG=0.461208*(ZJ+YY)+1.069667*CZ+30.63063
基本消除了多重共线性。
(请对得到的图表进行处理,以上在一页内)
2.逐步回归方法
现研究中国的能源消费需求问题:
理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。
为此,收集了中国能源消费总量Y(万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计数据(见附件2:
中国的能源消费需求相关数据)。
①建立中国能源消费需求的多元回归模型。
Y=-80155.52+36.84232X
-28.2335X
-10.32637X
-17.52643X
-34.49995X
+336.4866X
+1952.573
②根据建立的模型,判断是否有多重共线性的问题。
并使用直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)对模型多重共线性问题进行检验。
③如果存在多重共线性的问题,使用逐步回归法处理模型的多重共线性问题。
(请对得到的图表进行处理,以上在两页内)
二、实验总结与评价
实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):
见实验步骤中。
1、经典线性回归模型的假定之一是各个解释变量X之间不存在多重共线性。
一般来说,多重共线性是指各个解释变量X之间有准确或近似准确的线性关系。
2、多重共线性的后果:
如果各个解释变量X之间有完全的共线性,则它们的回归系数是不确定的,并且它们的方差会无穷大。
如果共线性是高度的但不完全的,则回归系数的估计是可能的,但有较大的标准误差的趋势。
结果回归系数不能准确地加以估计。
不过,如果目的是估计这些系数的线性组合用于预测,多重共线性不是严重问题。
3、诊断共线性的经验方法主要有:
①多重共线性的明显表现是可决系数R2异常高,而回归系数在通常的t检验中在统计上不显著。
②在仅有两个解释变量的模型中,检查两个变量之间的零阶或简单相关系数,一般来说高的相关系数通常可认为有多重共线性。
③当模型中涉及多于两个解释变量的情形时,较低的零阶相关也可能出现多重共线性,这时需要检查偏相关系数。
④在建模时,首先可以将每一个解释变量Xi对其余所有解释变量进行辅助回归,并计算出相应的可决系数Ri2,。
较高的Ri2可能表明Xi和其余的解释变量高度相关,在不会引起严重的设定偏误的前提下,可考虑把Xi从模型中剔除。
4、降低多重共线性的经验方法有:
①利用外部或先验信息;②横截面与时间序列数据并用;③用逐步回归等方法剔除高度共线性的变量;④变量或模型变换;⑤获取补充数据或新数据;⑥用岭回归等方法选择有偏估计量。
经验方法的效果取决于数据的性质和共线性的严重程度。
对实验的自我评价:
根据以上实验操作的实践,谈谈自己的感受;(50字左右)
这次实验主要是进行了模型多重共线性的检验,通过这次实验,使我对Eview的操作更加了解,也更加熟练了。
此次过后,我能够熟练的运用数据分析和对数据的采集来分析变量之前的关系了。
指导教师评语:
该生能熟练完成实验,并很好的完成实验的各项要求,能从实验中思考和发现问题,很好的达到了实验的目的,建议课后能继续练习。
学生实验成绩评定:
86
指导教师签名:
石立日期2014年5月21日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 多重 线性 模型 检验 处理