计量经济学课件第四章多重共线性.docx
- 文档编号:2899165
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:38
- 大小:106.97KB
计量经济学课件第四章多重共线性.docx
《计量经济学课件第四章多重共线性.docx》由会员分享,可在线阅读,更多相关《计量经济学课件第四章多重共线性.docx(38页珍藏版)》请在冰豆网上搜索。
计量经济学课件第四章多重共线性
第四章多重共线性
引子:
发展农业会减少财政收入吗?
为了分析各主要因素对财政收入的影响,建立财政收
入模型:
CSi=β0+β1NZi+β2GZi+β3JZZi
+β4TPOPi+β5CUMi+β6SZMi+ui
其中:
CS财政收入(亿元);
NZ农业增加值(亿元);GZ工业增加值(亿元);
JZZ建筑业增加值(亿元);TPOP总人口(万人);
CUM最终消费(亿元);SZM受灾面积(万公顷)
数据样本时期1978年-2007年(资料来源:
《中国统计年鉴
2008》,中国统计出版社2008年版)
采用普通最小二乘法得到以下估计结果
财政收入模型的EViews估计结果
Variable
农业增加值
工业增加值建
筑业增加值
总人口
最终消费
受灾面积
截距
Coefficient
-1.907548
Std.Error
0.342045
0.042746
0.765767
0.091660
0.042807
0.048904
8607.753
t-Statistic
-5.576888
1.074892
8.433867
1.047591
0.072609
-0.564916
-0.631118
Prob.
0.0000
0.2936
0.0000
0.3057
0.9427
0.5776
0.5342
0.045947
6.458374
0.096022
0.003108
-0.027627
-5432.507
R-squared
AdjustedR-squared
S.E.ofregression
Sumsquaredresid
Loglikelihood
Durbin-Watsonstat
0.989654
0.986955
1437.448
47523916
-256.7013
1.654140
Meandependentvar10049.04
S.D.dependentvar12585.51
Akaikeinfocriterion17.58009
Schwarzcriterion17.90704
F-statistic366.6801
Prob(F-statistic)0.000000
模型估计与检验结果分析
●可决系数为0.9897,校正的可决系数为0.9870,模
型拟合很好。
模型对财政收入的解释程度高达98.9%。
●F统计量为366.68,说明0.05水平下回归方程整体
上显著。
●t检验结果表明,除了农业增加值、建筑业增加
值以外,其他因素对财政收入的影响均不显著。
●农业增加值的回归系数是负数。
农业的发展反而会使财政收入减少吗?
!
这样的异常结果显然与理论分析和实践经验不相符。
若模型设定和数据真实性没问题,问题出在哪里呢?
第四章多重共线性
本章讨论四个问题:
●什么是多重共线性
●多重共线性产生的后果
●多重共线性的检验
●多重共线性的补救措施
第一节什么是多重共线性
本节基本内容:
●多重共线性的含义
●产生多重共线性的背景
一、多重共线性的含义
在计量经济学中所谓的多重共线性(Multi-Collinearity),
不仅包括完全的多重共线性,还包括不完全的多重共线性。
在有截距项的模型中,截距项可以视为其对应的解释变量总
是为1。
对于解释变量1,X2,X3,,Xk,如果存在不全为0的
λ数λ1,2,...λk,使得
12X2i3X3ikXki0(i1,2,,n)
则称解释变量1,X2,X3,
线性。
或者说,当Rank(X)k
重共线性。
Xk之间存在着完全的多重共
时,表明在数据矩阵
X中,至少有
一个列向量可以用其余的列向量线性表示,则说明存在完全的多
不完全的多重共线性
实际中,常见的情形是解释变量之间存在不完
全的多重共线性。
对于解释变量1,X2,X3,
λ1,λ2,λk,使得
Xk,存在不全为0的数
λ1+λ2X2i+λ3X3i+...+λkXki+ui=0
i=1,2,...,n
其中,ui为随机变量。
这表明解释变量
1,X2,X3,Xk只是一种近似的线性关系。
回归模型中解释变量的关系
可能表现为三种情形:
(1)rxixj=0,解释变量间毫无线性关系,变量间相
互正交。
这时已不需要作多元回归,每个参数j都可
以通过Y对Xj的一元回归来估计。
(2)rxixj=1,解释变量间完全共线性。
此时模型参
数将无法确定。
1
(3)0<rxixj<,解释变量间存在一定程度的线性关
系。
实际中常遇到的情形。
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形:
1.经济变量之间具有共同变化趋势。
2.模型中包含滞后变量。
3.利用截面数据建立模型也可能出现多重共线性。
4.样本数据自身的原因。
第二节多重共线性产生的后果
本节基本内容:
●完全多重共线性产生的后果
●不完全多重共线性产生的后果
一、完全多重共线性产生的后果
1.参数的估计值不确定
当解释变量完全线性相关时——OLS估计式不确定
▲从偏回归系数意义看:
在X2和X3完全共线性时,无法保
持X3不变,去单独考虑X2对Y的影响(X2和X3的影响
不可区分)
ˆ=0
▲从OLS估计式看:
可以证明此时β2
0
2.参数估计值的方差无限大
ˆ
OLS估计式的方差成为无穷大:
Var
(2)
二、不完全多重共线性产生的后果
如果模型中存在不完全的多重共线性,可以得到
参数的估计值,但是对计量经济分析可能会产生
一系列的影响。
1.参数估计值的方差增大
ˆ)=σ2
Var(β2
1σ1
=
2222
∑x2i(1-r23)∑x2i(1-r23)
2
当
r23
增大时Var(β2)也增大
^
2.对参数区间估计时,置信区间趋于变大
3.假设检验容易作出错误的判断
4.可能造成可决系数较高,但对各个参数单独的
t检验却可能不显著,甚至可能使估计的回归系
数符号相反,得出完全错误的结论。
第三节多重共线性的检验
本节基本内容:
●简单相关系数检验法
●方差扩大(膨胀)因子法
●直观判断法
●逐步回归法
一、简单相关系数检验法
含义:
简单相关系数检验法是利用解释变量之间
的线性相关程度去判断是否存在严重多重共线性
的一种简便方法。
判断规则:
一般而言,如果每两个解释变量的简
单相关系数(零阶相关系数)比较高,例如大于0.8,
则可认为存在着较严重的多重共线性。
注意:
较高的简单相关系数只是多重共线性存在的充分
条件,而不是必要条件。
特别是在多于两个解释
变量的回归模型中,有时较低的简单相关系数也
可能存在多重共线性。
因此并不能简单地依据相
关系数进行多重共线性的准确判断。
二、辅助回归模型检验
当模型的解释变量个数多于两个,并且呈现出较
为复杂的相关关系时,可以通过每个解释变量对其它
解释变量的辅助回归模型来检验多重共线性,即依次
建立k个辅助回归模型:
xi=a0+a1x1++ai-1xi-1+ai+1xi+1++akxk+ε
(i=1,2,…,k)
若其中某些方程显著,则表明存在多重共线性。
三、方差扩大(膨胀)因子法
统计上可以证明,解释变量Xj的参数估计式βj
的方差可表示为
1σ
Var(βj)=
⋅=
⋅VIFj
222
∑xj1-Rj∑xj
2
2
σ
其中的VIFj是变量Xj的方差扩大因子
1
(VarianceInflationFactor),即VIFj=2
(1-Rj)
其中R
2
j
是多个解释变量辅助回归的可决系数
经验规则
●方差膨胀因子越大,表明解释变量之间的多重共
性越严重。
反过来,方差膨胀因子越接近于1,
多重共线性越弱。
●经验表明,方差膨胀因子≥10时,说明解释变量
与其余解释变量之间有严重的多重共线性,且这
种多重共线性可能会过度地影响最小二乘估计。
另一个与VIF等价的指标是“容许度”(Tolerance)
,其定义为:
TOLi=(1-R)=1VIFi
2
i
显然,0≤TOL≤1;当xi与其它解释变量高度相关时,
TOL→0。
因此,一般当TOL<0.1时,认为模型存在较
严重的多重共线性
四、直观判断法
1.当增加或剔除一个解释变量,或者改变一个观
测值时,回归参数的估计值发生较大变化,回归
方程可能存在严重的多重共线性。
2.从定性分析认为,一些重要的解释变量的回归
系数的标准误差较大,在回归方程中没有通过显
著性检验时,可初步判断可能存在严重的多重共
线性。
3.有些解释变量的回归系数所带正负号与定性分
析结果违背时,很可能存在多重共线性。
4.解释变量的相关矩阵中,自变量之间的相关系
数较大时,可能会存在多重共线性问题。
五、逐步回归检测法
逐步回归的基本思想
将变量逐个的引入模型,每引入一个解释变量后,
都要进行F检验,并对已经选入的解释变量逐个进行
t检验,当原来引入的解释变量由于后面解释变量的
引入而变得不再显著时,则将其剔除。
以确保每次引
入新的变量之前回归方程中只包含显著的变量。
在逐步回归中,高度相关的解释变量,在引入时会
被剔除。
因而也是一种检测多重共线性的有效方法。
第四节多重共线性的补救措施
本节基本内容:
●修正多重共线性的经验方法
●逐步回归法
岭回归法在本科教学中只是供选择使用
的内容。
一、修正多重共线性的经验方法
1.剔除变量法
把方差扩大因子最大者所对应的自变量首先
剔除再重新建立回归方程,直至回归方程中
不再存在严重的多重共线性。
注意:
需注意产生新的问题:
①模型的经济意义不合理;
②是否使模型产生异方差性或自相关性;
③若剔除不当,可能会产生模型设定误差,造成
参数估计严重有偏
2.增大样本容量
如果样本容量增加,会减小回归参数的方差,
标准误差也同样会减小。
因此尽可能地收集足
够多的样本数据可以改进模型参数的估计。
问题:
增加样本数据在实际计量分析中常面临
许多困难。
3.变换模型形式
一般而言,差分后变量之间的相关性要比差分前
弱得多,所以差分后的模型可能降低出现共线性
的可能性,此时可直接估计差分方程。
问题:
差分会丢失一些信息,差分模型的误差项
可能存在序列相关,可能会违背经典线性回归模
型的相关假设,在具体运用时要慎重。
4.利用非样本先验信息
通过经济理论分析能够得到某些参数之间的关
系,可以将这种关系作为约束条件,将此约束
条件和样本信息结合起来进行约束最小二乘估
计。
【例】
生产函数
Y=AL
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 课件 第四 多重 线性
