应用回归分析课后习题答案.docx
- 文档编号:4804285
- 上传时间:2022-12-09
- 格式:DOCX
- 页数:17
- 大小:59.51KB
应用回归分析课后习题答案.docx
《应用回归分析课后习题答案.docx》由会员分享,可在线阅读,更多相关《应用回归分析课后习题答案.docx(17页珍藏版)》请在冰豆网上搜索。
应用回归分析课后习题答案
第9章含定性变量的回归模型
思考与练习参考答案
9.1一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。
出现这种情况的原因是什么?
答:
假如这个含有季节定性自变量的回归模型为:
Z=0o+X”+…Xkl+axDh+a2D2t+a3D3t+“
其中含有k个定量变量,记为出。
对春夏秋冬四个季节引入4个0-1型自变量,记为〃,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样木设计矩阵为:
X"
…xk\
1
0
0
O'
1
X|2
…Xk2
0
1
0
0
A
a2
(X,D)=
1
X|3
…Xk3
0
0
1
0
B=
•
a=
…Xk4
0
0
0
-
a.
1
X]4
1
3
1
X】5
…Xk5
0
1
0
0
丿
J
…x
1
0
0
0.
显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷井”,应避免。
当某自变量Xj对其余p-1个自变量的复判定系数R;超过一定界限时,SPSS软件将拒绝这个自变量&进入回归模型。
称Tol尸1-/?
;为自变量%的容忍度(Tolerance),SPSS软件的默认容忍度为0.OOOlo也就是说,当厅>0.9999时,自变量瓦将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。
而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。
9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?
答:
原因有两个,以例9.1说明。
一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。
9.3研究者想研究采取某项保险革新措施的速度y对保险公司的规模&和保险公司类型的关系(参见参考文献【3】)。
因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。
第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。
数据资料见表9.8,试建立y对公司规模和公司类型的回归。
表9.8
•
1
y
X1
公司类型
1
17
151
互助
2
26
92
互助
3
21
175
互助
4
30
31
互助
5
22
104
互助
6
0
277
互助
7
12
210
互助
8
19
120
互助
9
4
290
互助
10
16
238
互助
11
28
164
股份
12
15
272
股份
13
11
295
股份
14
38
68
股份
15
31
85
股份
16
21
224
股份
17
20
166
股份
18
13
305
股份
19
30
124
股份
20
14
246
股份
解:
对定型变量“公司类型”进行数量化处理:
引入虚拟变量4公司类型为“互助”时,x:
=l,为“股份”
时,x:
=0o
则表9.5中数据转换成以下数据:
•
1
y
X1
公司类型
1
17
151
1
2
26
92
1
3
21
175
1
4
30
31
1
5
22
104
1
6
0
277
1
7
12
210
1
8
19
120
1
9
4
290
1
10
16
238
1
11
28
164
0
12
15
272
0
13
11
295
0
14
38
68
0
15
31
85
0
16
21
224
0
17
20
166
0
18
13
305
0
19
30
124
0
20
14
246
0
建立回归方程y=bo+biXi+bzX2+e
用SPSS软件作线性回归,得到输出结果如下:
ModelSummary
Model
R
RSquare
AdjustedRSquare
Std.&roroftheEstimate
1
・946a
.895
.883
3.221
a.Predictors:
(Constant),公司类型,x1
R检验:
拟合优度R-0.883,接近1,说明回归拟合的效果较好。
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1Ftegression
FtesidualTotal
1504.413
176.387
1680.800
2
17
19
752.207
10.376
72.497
・00()a
a.Predictors:
(Constant),公司类型,x1b・DependentVariable:
y
F检验:
F值二72.497,Sig.值为0,说明回归方程通过F检验。
Coefficient^
Model
Unstand
Coeffh
ardized:
ients
StandardizedCoefficients
t
Sig.
B
Std.&ror
Beta
1(Constant)
X1
公司类型
41.930
-.102
-8.055
2.010
.009
1.459
-.911
-.439
20.859
-11.443
-5.521
.000
.000
.000
a.DependentVariable:
y
T检验:
回归系数通过t检验,回归方程为:
y=41.930-0.102x】一&055x2
说明:
若引入虚拟变量X:
当公司类型为“互助”时,X2=0,为“股
份”时,X2=lo
则回归方程为:
y=33.874-0.102X1+8.055x结果分析:
(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承担风险上,所以更愿意革新;
(2)公司规模越大,采取保险革新措施的倾向越大:
大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比较更新措施和现有政策带来的效益,最终表现在采纳革新措施的时间间隔较短。
9.4.表9.9的数据是我国历年铁路里程数据,根据散点图观察在某时间点有折点,用折线回归拟合这个数据。
解:
由散点图9(见下图)可看出在1995年(t=16)有折点,考虑由两段构成的分段线性回归,这可以通过引入一个0-1型虚拟自变量实现。
由散点图可知该折点为t=16,则引入虚拟自变量;v,
'0,r<16
t-16j>16
■
由SPSS输岀的调整后的决定系数用=0.980,说明拟合优度较好。
由输出的系数表可以得出回归方程为:
y=5.183+0.055/+0.106^由SPSS输出方程分析表可知,F值为594.524,且P值约为零,说明回归方程非常显著;
系数表中回归参数对应的t检验P值都约等于零,说明回归参数均通过了显著性检验。
因此,折线方程成立。
5.00-
散点图
方差分析表
AN0VAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1Regression
ResidualTotal
11.113
.206
11.319
2
22
24
5.557
.009
594.524
.(JOO*
a.FYedictors:
(Constant),x,tb・DependentVariable:
y
系数表
Coefficient^
Model
Lkistand
Coeffh
ardized:
ients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1(Constant)
t
X
5.183
.055
.106
.049
.005
.012
.589
.450
106.303
11.859
9.065
.000
.000
.000
a・DependentVariable:
y
9.5某省统计局1990年9月在全省范围内进行了一次公众安全感问卷调查,参考文献【10】选取了调查表中的一个问题进行分析。
木题对其中的数据做了适当的合并。
对1391人填写的问卷设计:
“一人在家是否害怕生人来”。
因变量y=l表示害怕,尸2表示不害怕。
2个自变量:
xl是年龄,x2是文化程度。
各变量的取值含义如表9.10所示。
表9.10
是否害怕y
年龄X1
文化程度x2
害怕1
16-
28岁
22
文盲0
不害怕0
29-
—45岁
37
小学1
46-
—60岁
53
中学2
61岁以上
68
中专以上3
现在的问题是:
公民一人在家害怕生人来这个事件,与公民的年龄
xl、文化程度x2有没有关系呢?
调查数据见表9.Uo
表9.11
号
X1
X2
y=i
y二0
Pi
1
22
0
3
0
9
0.1250
2
22
1
11
3
8
0
3
22
2
389
146
243
0.2916
4
22
3
83
26
57
7
5
37
0
4
3
1
0.3756
6
37
1
27
18
9
4
7
37
2
487
196
291
0.3154
8
37
3
103
27
76
8
9
535
0
9
4
5
0.7000
10
3
1
6
3
3
0
11
53
2
188
73
115
0.6607
12
53
3
47
18
29
1
13
68
0
2
0
2
0.4026
14
68
1
10
3
7
6
15
68
2
18
7
11
0.2644
16
68
3
4
0
4
2
0.4500
0
0.5000
0
0.3888
9
0.3854
2
0.1666
7
0.3181
8
0.3947
4
0.1000
0
其中,“是根据(9.44)式计算的。
(1)把公民的年龄xl、文化程度x2作为数值型变量,建立y对xl、x2的logistic回归。
(2)把公民的年龄xl、文化程度x2作为定性型变量,用0-1变量将其数量化,建立y对公民的年龄和文化程度的logistic回归。
(3)你对回归的效果是否满意,你认为主要的问题是什么?
解:
(1)先对巳进行逻辑变换,令於=山(宀,贝U
1-门
£=几+0丙+02兀2+勺
直接用SPSS进行y与xl、x2的logistic回归,输出结果如下:
ANOV炉
Model
SumofSquares
df
MeanSquare
F
Sig.
1Regression
ResidualTotal
.562
9.459
10.020
2
13
15
.281
.728
.386
.687*
a.Predictors:
(Constant),x2;x1b・DependentVariable:
ppi
Coefficients
Model
Lhstand
Coeffh
ardized:
ients
StandardizedCoefficients
t
Siq.
B
Std.Error
Beta
1(Constant)
X1
x2
-.144
-.006
-.136
.662
.012
.191
-.137
-.193
-.218
-.510
-.715
.831
.619
.487
a.DependentVariable:
ppi
由SPSS输出系数表结果得到回归方程:
i/=-0.144-0.006a--0.136心则还原后logistic回归方程为:
A_exp(-0」44-0.006Xj一0.136心)p=—
l+exp(-0.144-0.006^-0.136x2)
由方差分析表知F值=0.386,P值=0.687,大于5%,说明回归方程不显著;
由系数表知回归参数的t检验均没有通过,因为P值都大于5%,说明回归参数未通过显著性检验。
由于logistic回归模型存在异方差,所以采用加权最小二乘法重新拟
合,权重:
①=也(1-门)
SPSS输出结果如下:
ANOV妙
Model
SumofSquares
df
MeanSquare
F
Sig.
1Ftegression
ResidualTotal
8.393
12.676
21.069
2
13
15
4.197
.975
4.304
.037*
a.Predictors:
(Constant),x2;x1
b・DependentVariable:
ppi
c.WeightedLeastSquaresFtegression・Weightedbywi
Coefficient肿
Model
Unstand
Coeffh
ardized:
ients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1(Constant)
X1
x2
.146
.002
-.331
.309
.005
.116
.086
-.617
.472
.398
-2.858
.645
.697
.013
a.DependentVariable:
ppi
b・WeightedLeastSquaresFtegression・Weightedbywi
由输出结果得到回归方程:
戸=0.146+0.002“-0.331x2
还原后的回归方程:
迁冈(0」46+().002匸().331仝_
1+exp(0.146+0.002X]-0.331x2)
由方差分析表结果知:
F值二4.304,P值二0.037,小于5%,说明回归方程显著;
由系数表知“对应的回归系数相应的P值二0.697,大于5%,说明“对应的回归系数没有通过检验,不显著;
心对应的回归系数相应的P值=0.013,小于5%,说明心对应的回归系数通过检显著性验,且该回归系数为-0.331,,表明文化程度越高越不害怕。
(2)把公民的年龄xl、文化程度x2作为定性型变量,引入6个0-1
变量表示年龄小
22川二22_137,^=37
0/严22,X,2=[0,Xj/37
1)直接进行y与6个虚拟变量的未加权的logistic回归,SPSS输岀结果如下:
由方差分析表知F二2.472,P值二0.106,大于5%,说明回归方程不显著;且除了心外,其它自变量对应的回归系数都没通过检验。
ANOVAb
Model
SumofSquares
df
MeanSquare
F
Sig.
1Regression
FtesidualTotal
4.743
5.277
10.020
4
11
15
1.186.480
2.472
.1063
a.Predictors:
(Constant),x13,x2,x12,x11b・DependentVariable:
ppi
Coefficients
Model
Unstand
Coeffh
ardized:
ients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1(Constant)
x2
X11
x12
x13
-1.044
-.136
.220
1.273
.969
.417
.155
.490
.490
.490
-.193
.120
.697
.530
-2.505
-.881
.449
2.600
1.979
.029
.397
.662
.025
.073
a.DependentVariable:
ppi
下而通过后退法选择变量对上述模型改进。
SPSS输出结果如下表:
anovN
Model
SumofSquares
df
MeanSquare
F
Sig.
1
FtegressionResidual
Total
4.743
5.277
10.020
4
11
15
1.186
.480
2.472
・106a
2
RegressionResidualTotal
4.647
5.374
10.020
3
12
15
1.549
.448
3.459
.051b
3
FtegressionResidual
Total
4.274
5.746
10.020
2
13
15
2.137
.442
4.835
.027°
a・FYedictors:
(Constant),x13,x2,x12,x11b・Predictors:
(Constant),x13,x2,x12
c.Predictors:
(Constant),x13,x12
d・DependentVariable:
ppi
Coefficients
Model
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
1
(Constant)
-1.044
.417
・2.505
.029
x2
-.136
.155
-.193
-.881
.397
X11
.220
.490
.120
.449
.662
x12
1.273
.490
.697
2.600
.025
x13
.969
.490
.530
1.979
.073
2
(Constant)
・・934
.326
-2.865
.014
x2
-.136
.150
-.193
-.912
.380
X12
1.163
.410
.636
2.838
.015
x13
.859
.410
.470
2.097
.058
3
(Constant)
-1.139
.235
・4.846
.000
x12
1.163
.407
.636
2.857
.013
x13
.859
.407
.470
2.110
.055
a.DependentVariable:
ppi
后退法的过程中剔除了心宀,留下了巾,但是知对应的回归系数
未通过检验,将其剔除,最后留下了巾;而且回归方程显著,
2)加权回归:
用后退法选择变量,由输出结果(如下)可知最后只
ANOV斛
Model
SumofSquares
df
MeanSquare
F
Siq.
1
RegressionResidual
Total
9.979
11.090
21.069
4
11
15
2.495
1.008
2.475
・106*
2
RegressionResidual
Total
9.526
11.543
21.069
3
12
15
3.175
.962
3.301
•058&
3
Regression
Residual
Total
8.870
12.199
21.069
2
13
15
4.435
.938
4.726
.029°
4
RegressionResidualTotal
8.238
12.831
21.069
1
14
15
8.238
.916
8.989
•010。
a.FYedictors:
(Constant),x13,x2,x11,x12
b.FVedictors:
(Constant),x13?
x2tx12
c・Redictors:
(Constant),x2?
x12
d.FVedictors:
(Constant),x2
e・DependentVariable:
ppi
f-WeightedLeastSquaresRegression・Weightedbywi
Coefficients
Model
UhstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Bror
Beta
1
(Constant)
-.092
.425
-.217
.832
x2
・・344
.118
-.641
-2.901
.014
X11
.263
.392
.490
.671
.516
X12
.379
.389
.737
.975
.351
X13
.376
.402
.570
.936
.370
2
(Constant)
.131
.258
.510
.619
x2
.332
.115
-.620
-2.902
.013
X12
.132
.122
.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 课后 习题 答案