第六章计量经济学.docx
- 文档编号:27249331
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:23
- 大小:56.90KB
第六章计量经济学.docx
《第六章计量经济学.docx》由会员分享,可在线阅读,更多相关《第六章计量经济学.docx(23页珍藏版)》请在冰豆网上搜索。
第六章计量经济学
第六章虚拟变量的回归模型
第一部分学习目标和要求
本章主要介绍虚拟变量的基本概念及其应用。
需要掌握并理解以下内容:
(1)虚拟变量的基本概念、虚拟变量分别作为解释变量和被解释变量的情形、虚拟变量回归模型的类型和解释变量个数选取规则;
(2)定量变量与不同数量定性变量(一对一、一对多和多对多)虚拟变量模型;
(3)应用虚拟变量改变回归直线的截距或斜率;
(4)分段线性回归;
(5)应用虚拟变量检验回归模型的结构稳定性、传统判别结构稳定性的方法及存在的缺陷、虚拟变量法比较两个回归方程的结构方法。
第二部分练习题
一、解释下列概念:
1.虚拟变量
2.方差分析模型(ANOVA)
3.协方差模型(ANOCVA)
4.基底
5.级差截距系数
6.虚拟变量陷阱
二、简要回答下列问题:
1.虚拟变量在线性回归模型中的作用是什么?
举例说明。
2.回归模型中虚拟变量个数的选取原则是什么?
为什么?
3.如果现在有月度数据,在对下面的假设进行检验时,你将引入几个虚拟变量?
A)一年中的每月均呈现季节性波动趋势;
B)只有双数月份呈现季节性波动趋势。
4.如果现在让你着手检验上海和深圳两个股票市场在过去5年内的收益率是否有显著差异,如何使用虚拟变量进行?
三、考虑如下模型:
Yi=:
15'2Di•ui
2
其中,Di对前20个观察值取0,对后30个观察值取1。
已知Var(ui)=300。
(1)如何解释-1和-2?
(2)这两组的均值分别是多少?
(3)已知Cov(m-2^-15。
如何计算(“「2)的方差?
四、考虑如下模型:
Yi-—亠二2Dil-:
'Xi-Ui
其中丫代表一位大学教授的年薪;
X为从教年限;
D为性别虚拟变量。
考虑定义虚拟变量的三种方式:
(1)D对男性取值1,对女性取值0;
(2)D对女性取值1,对男性取值2;
(3)D对女性取值1,对男性取值—1;
对每种虚拟变量定义解释上述回归模型。
是否有某个方法比另外的更好?
说明你的理由。
五、下表给出了1983年至1986年期间服装季度销售额的原始数据(单位:
百万元)
年度季度
1
2
3
4
1983
4190
4927
6843
6912
1984
4521
5522
5350
7204
1985
4902
5912
5972
7987
1986
5458
6359
6501
8607
考虑如下两个模型:
(A)St=:
15'2D2t5'3D3t5'4D4t•Ut
(B)
St=:
1D1t!
■'2D2tl''3D3tI-'4D4t-Ut
其中,D1-1:
第一季度
D2=2:
第二季度
D3=3:
第三季度
D4=4:
第四季度
S=Sales
回答以下问题:
(1)估计模型(A);
(2)解释:
1,:
2,:
3,:
4;
(3)
如何消除模型(A)中的季节性?
(4)
模型(B)与模型(A)有什么区别?
(5)
估计模型(B);
(6)比较两个模型的结果。
六、考虑如下关于期望工作时间的对1543对夫妇调查后的回归结果(t比率放在括号内):
Yt=1286104.97X2—0.026X3i1.20X4i0.69X5i_19.47X6i266.06X7i—118.64X8i—110.61X9i
t=(4.67)(3.70)(-3.80)(0.24)(0.08)(-0.40)(6.94)(-3.04)(-6.14)
R2=0.383n=1543
其中丫为妻子希望每年花在工作上的小时数,以每年工作的小时数加上花在找工作上的
时间之和计算;
X2:
妻子税后真实时薪;
X3:
丈夫在上一年度税后真实收入;
X4:
妻子的年龄;
X5:
妻子的受教育年数;
X6:
态度变量。
若被调查者愿意工作而且其丈夫也同意其工作则取值1,否则为0;
X7:
态度变量。
若被调查者的丈夫支持其工作则取值1,否则为0;
X8:
年龄低于6岁的子女数;
X9:
年龄在6〜13岁的子女数;
回答以下问题:
(1)各非虚拟回归元系数的符号有经济含义吗?
说明你的观点。
(2)如何解释虚拟变量X6和X7?
这些虚拟变量统计显著吗?
(3)在这项研究中,一位妇女的年龄和受教育程度不是影响其劳动力参与决策的显
著因素,你认为这是为什么?
七、设有n1个高中毕业生和n2个大学毕业生构成总数为n=n1•m的总样本。
考虑如下回
归模型:
其中,Y表示以美元度量的小时工资;D为虚拟变量,对大学毕业生取值为1,对高中
毕业生取值为0。
试利用OLS公式,证明:
1=Yi和:
2=Yc—Yh。
其中下标具有如下含义:
h表示高中(highschool)毕业生,c表示大学(college)毕业生。
八、在51个学生(其中男生36人,女生15人)的体重(W)对身高(H)的回归分析中,得到下面的结果:
A
1.wi--232.065515.5662Hi
t=(-5.2066)(8.6246)
2.wi二-122.962123.8238SD3.7402H
t=(-2.5884)(4.0149)(5.1613)
3.wi--107.95083.5105Hi2.0073SiD0.3263HiD
t=(-1.2266)(2.6087)(0.0187)(0.2035)
其中体重的单位为磅,身高的单位为英寸,D为乘积或差别斜率虚拟变量,S为性别虚拟
变量:
刁男生
S(性别)-'男丄[0,女生
参考下面的相关矩阵,回答问题
(1)-(6)。
解释:
例如,身高和性别的相关系数是0.6276,
性别和交互虚拟变量的相关系数是0.9971
H
S
D
H
1
0.6276
0.6752
S
0.6276
1
0.9971
D
0.6752
0.9971
1
(1)你将选择哪个回归?
1还是2,为什么?
在模型2与3中呢?
(2)如果实际较为理想的回归是2,那么选择1说明犯了什么错误?
(3)回归2中的性别虚拟变量说明了什么?
(4)回归模型2中差别截距是统计显著的,但在模型3中差别斜率却是统计不显著的。
如何解释这种变化?
(5)在模型2与3中,变量身高的系数几乎相等,但性别虚拟变量的系数相差很大。
对此你有什么想法?
九、PaulW.Bauer和ThomasJ.Zlatoper在研究决定开往Cleveland的直接机票的因素中得到
下面的回归结果(表的形式)用以解释单程头等舱、二等舱和经济舱机票(因变量是单程机票)的价格。
解释变量
头等舱
二等舱
经济舱
Carriers
—19.50
—23.00
—17.50
t=(—0.878)
(—1.99)
(—3.67)
Carriers
2.79
4.00
2.19
(0.632)
(1.83)
(2.42)
Miles
0.223
0.277
0.0791
(5.13)
(12.00)
(8.24)
Miles
—0.
—0.
—0.
(—0.495)
(—4.98)
(—3.23)
POP
—0.00598
—0.00114
—0.
(—1.67)
(—4.98)
(—1.05)
INC
—0.00195
—0.00187
—0.00411
(—0.686)
(—1.06)
(—6.05)
Corp
3.62
1.22
—1.06
(3.45)
(2.51)
(—5.22)
Pass
—0.
—0.
0.853
(—0.771)
(—0.527)
(3.93)
Stop
12.50
7.64
—3.58
(1.36)
(2.13)
(—2.60)
Slot
7.13
0.746
17.70
(0.299)
(—0.067)
(3.82)
Hub
11.30
4.18
—3.50
0.90
(1.81)
(—1.62)
Meal
11.20
0.945
1.80
(1.07)
(0.177)
(0.813)
EA
—18.30
5.80
—10.60
(—1.60)
(0.775)
(—3.49)
CO
—66.40
—56.50
—4.17
(—5.72)
(—7.61)
(—1.35)
常数项
212.00
126.00
113.00
(5.21)
(5.75)
(12.40)
R2
0.863
0.871
0.799
观察值个数
163
323
323
数据来源:
PaulW.Bauer和ThomasJ.Zlatoper《经济评论》(EconomicReview),Cleveland联邦储备银行,
第25卷,第一期,1989年,表2、3、4,第6〜7页
解释变量定义如下:
Carriers
飞机数量
Pass
总乘客人数
Miles
从出发地到Cleveland的距离
Pop
出发地人口
INC
出发地人均收入
Corp
潜在商业交通代理
1,虚拟变量
Slot
0,其他
Stop
中转站数
1,供餐
Meal
0,其他
1,若出发地有中转站
Hub
0,其他
‘1,向东航线
EA
[o,其他
1洲际航线
CO
o,其他
(1)在这个模型中,引入变量载客人数和载客人数的平方为解释变量的理论依据是什么?
载客人数符号为负和载客人数平方符号为正表明了什么?
(2)引入距离和距离的平方为解释变量的理论依据是什么?
观察到的这些变量的符号有经济意义吗?
(3)观察到的人口变量符号为负,这有什么含义?
(4)为什么在所有的回归结果中人均收入变量符号都是负的?
(5)为什么“Stop”变量在“头等舱”和“二等舱”回归方程中的符号为正?
而在
“经济舱”回归方程中符号为负?
(6)虚拟变量“洲际航线”的符号始终为负。
这表明了什么?
(7)估计每个回归系数的显著性,分别用单边和双边检验。
(8)为什么虚拟变量“Slot”仅仅在“经济舱”回归方程中是统计显著的?
(9)由于“头等舱”和“经济舱”的观察值的个数相同,能否将他们加总起来(646
个)作一个回归方程?
如果可以,如何区别“二等舱”和“经济舱”的观察值?
(10)对上表中的回归结果进行评价。
十、1966年的第四季度,当时的英国劳工党政府放松了国民保险法案的原则,以统一收费率和救济金与先前收入相关相结合的混合体系取代原来短期失业救济金的统一收费率体系,从而提高了失业救济金水平。
根据以下数据:
年份和
季度
失业率
UN,%
岗位空缺
率V,%
D
DV
年份和
季度
失业率
UN,%
岗位空缺
率V,%
D
DV
1958-W
1.195
0.510
0
0
1965-I
1.201
0.997
0
0
1959-I
1.876
0.541
0
0
n
1.192
1.035
0
0
n
1.842
0.541
0
0
出
1.259
1.040
0
0
出
1.750
0.690
0
0
V
1.192
1.086
0
0
IV
1.648
0.771
0
0
1966-I
1.089
1.101
0
0
1960-I
1.450
0.836
0
0
n
1.101
1.058
0
0
n
1.393
0.908
0
0
出
1.243
0.987
0
0
出
1.322
0.968
0
0
V
1.623
0.819
0
0.819
V
1.260
0.998
0
0
1967-I
1.821
0.740
1
0.740
1961-I
1.171
0.968
0
0
n
1.990
0.661
1
0.661
n
1.182
0.964
0
0
出
2.114
0.660
1
0.660
出
1.221
0.952
0
0
V
2.115
0.698
1
0.698
V
1.340
0.849
0
0
1968-I
2.150
0.695
1
0.695
1962—I
1.411
0.748
0
0
n
2.141
0.732
1
0.732
n
1.600
0.658
0
0
出
2.167
0.749
1
0.749
出
1.780
0.562
0
0
V
2.107
0.800
1
0.800
IV
1.941
0.510
0
0
1969—I
2.104
0.783
1
0.783
1963—I
2.178
0.510
0
0
n
2.056
0.800
1
0.800
n
2.067
0.544
0
0
出
2.170
0.794
1
0.794
出
1.942
0.568
0
0
V
2.161
0.790
1
0.790
V
1.764
0.677
0
0
1970—I
2.225
0.757
1
0.757
1964—I
1.532
0.794
0
0
n
2.241
0.746
1
0.746
n
1.455
0.838
0
0
出
2.366
0.739
1
0.739
出
1.409
0.885
0
0
V
2.324
0.707
1
0.707
V
1.296
0.978
0
0
1971—I
2.516
0.583
1
0.583
n
2.909
0.524
1
0.524
说明:
上表中1971年数据为初步估计值。
资料来源:
DamodarGujarati,TheBehaviorofUnemploymentandUnfilledVacancies:
GreatBritain,1958-1971,"TheEconomicJournal,vol.82,March1972,p.202.
考虑如下的回归结果:
UNt=2.74911.1507Dt-1.5294Vt-0.8511(DVt)
t=(26.896)(3.6288)(-12.5552)(-1.9819)
R2=0.9128
其中UN=失业率,%
V工岗位空缺率,%
1,对1966年第四季度之后的期间
D=
10,对1966年第四季度之前的期间
t=时间,以季度度量
(1)失业率和岗位空缺率的关系有何先验预期?
(2)保持岗位空缺率不变,在从1966年第4季度开始的期间内,平均失业率为多少?
它与1966年第4季度之前的期间有显著差异吗?
(3)1966年第4季度之前和之后的斜率在统计上不同吗?
(4)根据这项研究,能断定慷慨的失业救济金导致更高的失业率吗?
经济上是否讲
得通?
(5)根据表中得数据,检验1958—W至1966—川和1966—W至1971—H两个子区间误差方差相同的假设。
F表是美国1985年第1季度至1991年第4季度给出的税后公司利润和净利润(亿美
元)的季度数据。
年份和季度
红利
税后利润
年份和季度
红利
税后利润
1985-I
87.2
125.3
1988—川
117.5
213.4
1985—n
90.8
124.8
1988—W
121.0
226.0
1985—川
94.1
129.8
1989—I
124.6
221.3
1985—W
97.4
134.2
1989—n
127.1
206.2
1986—I
105.1
109.2
1989—川
129.1
195.7
1986—n
110.7
106.0
1989—W
130.7
203.0
1986—川
112.3
110.0
1990—I
132.3
199.1
1986—W
111.0
119.2
1990—n
132.5
193.7
1987—I
108.0
140.2
1990—川
133.8
196.3
1987—n
105.5
157.9
1990—W
136.2
199.0
1987—川
105.1
169.1
1991—I
137.8
189.7
1987—W
106.3
176.0
1991—n
136.7
182.7
1988—I
109.6
195.5
1991—川
138.1
189.6
1988—n
113.3
207.2
1991—W
138.5
190.3
资料来源:
U.S.DepartmentofCommerce,BureauofEconomicAnalysis,BusinessStatistics,1963-1991,dividendandafter-taxprofitsareinbillionsofdollarsandareobtainedfromp.A-110.
(1)做红利Y对税后利润X的回归。
二者之间是否相关?
(2)如果红利支付呈现出季节变动的趋势,引入一个适当的虚拟变量并对其进行估计。
在建立的模型当中,如何考虑截距和斜率会随季节的不同而变化?
(3)在不考虑季节因素时,何时作Y对X的回归?
第三部分参考答案
一、解释概念:
1.虚拟变量:
虚拟变量、定性变量、指标变量、名义变量和二分变量都指的是一种取值为0或1的变量。
在现实经济生活中,有一类变量如季节、民族、性别等都可能成为影响某个因变量的重要因素,但这些变量反映的并不是数量,而是某种性质或属性,要纳入定量
性质的回归模型,必须先定量化。
因此我们可以构造一种特殊变量,只有1和0两种取值,
并且规定当变量值取1是,表明具有某种性质或属性,取0时则表明不存在。
由于这种变量
是人为虚构出来的,所以称为虚拟变量。
2.方差分析模型(ANOVA):
一个只含有虚拟变量或定性解释变量的回归模型称为方
差分析模型(Analysis-of-Varianee,简记为ANOVA)。
例如,在研究性别与收入关系Y时,
可以定义虚拟变量
n表示男性^n2
Di,线性回归模型Y-「•-Di•;i(;i~N(0,;「))就是一个
[0表示女性
方差分析模型。
3•协方差模型(ANOCVA):
同时包含定量和定性解释变量的回归模型叫做协方差分
析模型(Analysis-of-co-Varianee,简记为ANCOVA)。
例如,将上例更改为如下形式:
Yi=:
•1亠’:
:
2Di亠,Xi亠7.i
其中Xi表示工龄,其他含义不变。
该协方差模型含有一个定量变量和一个定性变量。
4•基底:
虚拟变量被富裕0值的那个类别通常被称为基底,主要是因为它是用以和其他类别做比较的基础。
例如,上述模型中,女性就是被用来做基底的,截距项:
i就是基底
类的截距。
这是因为对Di=0进行回归时,截距是:
-。
需要注意的是,不管用哪一类作为基底,都不过是一种选择的结果,这种选择有时是根据某种事先考虑而做出的。
5•级差截距系数:
附着于虚拟变量Di的系数:
2,称为级差截距系数,表示取值为1
的类别的截距值和基底类的截距值相比有多少差别。
6.虚拟变量陷阱:
引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多
重共线,就是通常说的虚拟变量陷阱。
二、简答题:
1.考虑到回归分析中定性变量的作用,引入虚拟变量后可以让线性回归模型成为一种
极其灵活的工具。
例如,在研究性别与收入关系Yi时,可以定义虚拟变量
Y=:
:
D亠和(i〜N(0,;「2))若假设H。
:
1=0成立,则说明收入与性别关系不大,否则说明收入与性别相关。
虚拟变量
不仅可以作为解释变量,也可以作为被解释变量。
例如,银行在研究是否给企业贷款时,结果只有贷或者不贷。
这种情况就可以用一个虚拟变量作为被解释变量来表示。
2•虚拟变量个数的选取的一般原则是:
如果一个定性变量有m个类别,则只需引入
m-1个变量。
例如:
为了区分两个类别(如男和女),我们只需要引入一个虚拟变量D。
这是由于性别只有两种可能,如果D=1指男性,则我们可以知道D=0指女性。
如果不遵从这个原则,就将掉进虚拟变量陷阱,并陷入完全多重共线性的境地。
3•在一年中每月均呈现季节性波动趋势的情况下,引入11个虚拟变量;在只有双数
月份呈现季节性波动趋势的情况下,引入5个虚拟变量。
4•分别建立如下回归方程:
上海:
斤一;i;深圳:
斤一;i。
问题转化为检
验6是否显著不为0。
建立如下含有虚拟变量的回归方程:
*=卩+气其中
D二0,上海是一个解释变量,也是虚拟变量。
对复合方程进行回归,直接对解释变量i1,深圳
实施t检验即可。
(1)和
(2)'-1给出了前20次观测中Y的期望值,一:
2给出了后30次观测中Y的期望
值的变化量,而后30次观测中Y的实际期望值为(^'-2)。
(3)根据随机变量之和的方差计算公式,我们有
Var(:
i:
2)=Var(:
i)Var(:
2)2Cov(:
1,:
2)
首先计算得a(Di-D)2=12,然后利用有关双变量模型的公式,可以得到:
四、
(1)男教授:
E(Yi)=(♦*2)「Xi
女教授:
E(Y)八1「Xi
保持X不变,男性平均薪水高出>2
(2)男教授:
E(YiHC-2■-Xi
女教授:
E(Y)=(「•>2)「Xi
保持X不变,男性平均薪水高出>2
(3)男教授:
E(Yi)=(「1-厂)「Xi
女教授:
E(Y)=(:
j6)「Xi
保持X不变,男性平均薪水高出-2〉2
对于给定的数
由于虚拟变量的度量是任意的,所以没有哪一种方法会比其他方法更好。
据,答案不会随着虚拟变量尺度的变化而变化。
五、
A
(1)S=4767.8912.25D2t1398.8D3t2909.8D4t
t=(14.714)(1.9907)(3.0523)(6.34
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 计量 经济学