虚拟变量及logistic回归练习题.docx
- 文档编号:23766307
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:13
- 大小:19.93KB
虚拟变量及logistic回归练习题.docx
《虚拟变量及logistic回归练习题.docx》由会员分享,可在线阅读,更多相关《虚拟变量及logistic回归练习题.docx(13页珍藏版)》请在冰豆网上搜索。
虚拟变量及logistic回归练习题
虚拟变量回归练习题
1、请根据下表数据建立回归模型来分析食品支出与税后收入和性别的关系
(1)请建立性别对食品支出影响的回归模型
横型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.435°
.189
.108
570.84045
1.582
a.预测变量:
(常量),性别。
b.因变量:
食品支出
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
759530.083
1
759530.083
2.331
.158°
残差
3258588.167
10
325858.817
总计
4018118.250
11
a•预测变量:
(常量),性别。
b•因变量:
食品支出
系数。
模型
非标准化系数
标准系数
t
sig-
B
标准误差
试用版
1
(常量)
2170.500
521.104
4.165
.002
性别
503.167
329.575
.435
1.527
.158
a•因变量:
食品支出
通过上述模型统计分析,我们可以得到如下结论:
得到的P二0・158>0・05,所
以接受原假设,所以性别对食品支出无显著差异。
(2)请建立考虑了税后收入和性别两个自变量对食品支出影响的回归模型,并
进行解释。
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.964°
.928
.913
178.76928
1.926
a•预测变量:
(常量),
性别,税后收入。
b.因变量:
食品支出
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3730492.144
2
1865246.072
58.365
.000°
残差
287626.106
9
31958.456
总计
4018118.250
11
a•预测变量:
(常量),性别,税后收入。
b.因变量:
食品支出
系数。
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
1048.271
200.448
5.230
.001
税后收入
.059
.006
.892
9.642
.000
性别
228.987
107.058
.198
2.139
.061
a•因变量:
食品支出
通过上述统计分析我们可以得到如下结论:
在同时考虑税后收入和性别对食
品支出的影响时,税后收入P=0<0.05,随意拒绝原假设,所以税后收入对食品
支出有显著影响,性别P=0Q61>0.05,接受原假设,所以性别对食品支岀无显者影响。
年龄
女性食品支出
女性税后收入
男性食品支出
男性税后收入
<25
1983
11557
2230
11589
25-34
2987
29387
3757
33328
3544
2993
31463
3821
36151
45-54
3156
29554
3291
35448
55-64
2706
25137
3429
32988
>65
2217
14952
2533
20437
2、考察1990年前后的中国居民的总储蓄■收入关系是否已发生变化。
下表中给
出了中国1979〜2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。
为年前
储蓄
GNP
90年后
储蓄
GNP
1979
281
4038.2
1991
9107
21662.5
1930
399.5
4517.8
1992
11545.4
26651.9
1931
523.7
4860.3
1993
14762.4
34560.5
1932
675.4
5301.8
1994
21518.8
46670.0
1933
892.5
5957.4
1995
29662.3
07494.9
1934
1214.7
7206.7
1996
38520.8
66850.5
1935
1622.6
8939.1
1997
46279.8
73142.7
1A6
2237.6
10201.4
1998
53407.5
76967.2
1937
3073.3
11954.5
1999
59621.8
80579.4
1938
3801.O
14922.3
2000
64332.4
88228.1
1939
5146.9
16917.8
2001
73762.4
94346.4
1990
7034.2
18598.4
(1)不考虑时间变量的影响建立回归模型。
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.9860
.972
.970
5413.22314
a•预测变量:
(常量),储蓄。
b.
Anova0
模型
平方和
df
均方
F
Sig.
回归
.581
1
.581
717.603
.000°
1
残差
615362679.617
21
29302984.744
总计
.198
22
a•因变量:
GNP
b•预测变量:
(常量),储蓄。
系数。
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
1
(常量)
8814.745
1467.565
6.006
.000
储蓄
1.286
.048
.986
26.788
.000
a•因变量:
GNP
通过上述建立的回归模型统计分析,我们可以得到:
F分布值P二OvO.05,所
以拒绝原假设,所以说明储蓄和收入之间关系没有发生变化。
⑵弓I进时间变量,建立回归模型
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.993°
.986
.984
3921.19231
a•预测变量:
(常量),是否90,储蓄。
b.因变量:
GNP
Anovaa
模型
平方和
df
均方
F
Sig.
回归
.151
2
.076
693.812
.000°
1
残差
307514983.047
20
15375749.152
总计
.198
22
a•因变量:
GNP
b•预测变量:
(常量),是否90,储蓄。
系数。
模型
非标准化系数
标准系数
t
Sig.
B
标准误差
试用版
(常量)
6991.461
1138.483
6.141
.000
1
储蓄
1.099
.054
.843
20.232
.000
是否90
11442.578
2557.255
.186
4.475
.000
a•因变量:
GNP
残整统计彳。
极小值
极大值
均值
标准偏差
N
预测值
7300.2998
99504.0703
33939.9913
31141.71765
23
残差
■6780.76807
6459.91992
.00000
3738.71018
23
标准预测值
-.855
2.105
.000
1.000
23
标准残差
-1.729
1.647
.000
.953
23
a•因变量:
GNP
通过上述建立的回归模型统计分析,我们可以得到:
F分布值P二OOQ5,所
以拒绝原假设,所以说明90年前后储蓄和收入之间关系没有发生变化。
Logistic回归分析练习题
研究问题
在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y=l表示居民主要乘坐公共汽车上下班;y二0表示主要骑自行车上下班;自变量xl表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=l为男性,x3=0为女性)。
表1使用交通工具上下班情况
序号
XI
X2(月收入:
元)
X3
Y
1
18
850
0
0
2
21
1200
0
0
3
23
850
0
1
4
23
950
0
1
5
28
1200
0
1
6
31
850
0
0
7
36
1500
0
1
8
42
1000
0
1
9
46
950
0
1
10
48
1200
0
0
11
55
1800
0
1
12
56
2100
0
1
13
58
1800
0
1
14
18
850
1
0
15
20
1000
1
0
16
25
1200
1
0
17
27
1300
1
0
18
28
1500
1
0
19
30
950
1
1
20
32
1000
1
0
21
33
1800
1
0
22
33
1000
1
0
23
38
1200
1
0
24
41
1500
1
0
25
45
1800
1
1
26
48
1000
1
0
27
52
1500
1
1
28
56
1800
1
1
要求:
(1)模型拟合情况说明。
(包括拟合优度、整个模型的统计学意义)
分类变量编码
频率
参数编码⑴
女性性
13
1.000
别
男性
15
.000
分类表db
己观测
已预测
上下班方式
百分比校正
主要骑自行车
主要乘坐公交汽车
主要骑自行车
15
0
100.0
上下班方式
.0
♦F八
主要乘坐公交汽车
13
0
步骤0
总计百分比
53.6
a•模型中包括常量。
b・切割值为.500
模型汇总
步骤
-2对数似然值
Cox&SnellR
方
NagelkerkeR方
1
25.971°
.365
.487
a因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。
=Hosmer和Lemeshow检验=
步骤
卡方
df
Sig.
1
11.513
7
.118
从Hosmer和Lemeshow检验表中,可以看出:
经过1次迭代后,卡方统
计量为:
11.513,从SIG角度来看:
0.118>0.05,说明模型能够很好的拟合整
体,不存在显著的差异。
(2)各自变量的显著性情况。
方程中的变量
B
S.E,
Wais
df
Sig.
步骤0常量-.143
.379
.143
1
.706
.867|
不在方程中的变量
得分
df
Sig.
XI
6.038
1
.014
步骤0
变量X2
2.946
1
.086
X3(l)
5.073
1
.024
总统计量
10.414
3
.015
模型系数的综合检验
卡方
df
Sig.
步骤
12.703
3
.005
步骤1块
12.703
3
.005
模型
12.703
3
.005
分类铲
已观测
已预测
上下班方式
百分比校正
主要骑自行车
卜浚乘坐公交汽车
主要骑自行车上下班方式
主要乘坐公交汽车
步骤1
总计百分比
13
3
2
10
86.7
76.9
82.1
a•切割值为.500
通过上述模型分析我们可以得到:
XI(年龄)P=0.014<0.05,所以拒绝原假设,则年龄与上下班关系具有显著性。
X2(月收入)P二0.086>0・05,所以接受原假设,则月收入与上下班关系不具有显著性。
X3(性别)P二0.024<0Q5,所以拒绝原假设,则年龄与上下班关系具有显著性。
(3)自变量中有显著性的变量对因变量的影响程度,即优势比的意义。
方程中的变M
B
S.E,
Wais
df
Sig.
Exp(B)
EXP(B)的95%C・L
下限
上限
XI
.082
.052
2.486
1
.115
1.086
.980
1.202
X2
.002
.002
.661
1
.416
1.002
.998
1.005
步骤1°X3
(1)
2.502
1.158
4.669
1
.03)
12.205
1.262
118.052
常量
-6.157
2.687
5.251
1
.022
.002
a・在步骤1中输入的变量:
XLX2,X3・
通过上述Logistic回归模型分析,对上下班有显著性影响的是XI(年龄)和
X3(性别),从方程中的变•这个表格我们可以很清晰的得到:
X3(性别)相比XI(年龄)更具有显著性影响。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 logistic 回归 练习题