SPSS操纵方法逻辑回归.docx
- 文档编号:5821753
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:12
- 大小:88.79KB
SPSS操纵方法逻辑回归.docx
《SPSS操纵方法逻辑回归.docx》由会员分享,可在线阅读,更多相关《SPSS操纵方法逻辑回归.docx(12页珍藏版)》请在冰豆网上搜索。
SPSS操纵方法逻辑回归
SPSS操作方法之五
SPSS操作方法:
逻辑回归
例证8.3:
在一次关于公共交通的社会调查中,一个调查项目是“乘公交车上下班,还是骑自行车上下班”因变量Y=1表示乘车,Y=0表示骑车。
自变量X1表示年龄;X2表示表示月收入;X3表示性别,取1时为男性,取0时为女性。
调查对象为工薪族群体。
数据见下表:
试建立Y与自变量之间的Logistic回归。
表8-4
序号
性别
年龄
月收入
y
序号
性别
年龄
月收入
y
1
0
18
850
0
15
1
20
1000
0
2
0
21
1200
0
16
1
25
1200
0
3
0
23
850
1
17
1
27
1300
0
4
0
23
950
1
18
1
28
1500
0
5
0
28
1200
1
19
1
30
950
1
6
0
31
850
0
20
1
32
1000
0
7
0
36
1500
1
21
1
33
1800
0
8
0
42
1000
1
22
1
33
1000
0
9
0
46
950
1
23
1
38
1200
0
10
0
48
1200
0
24
1
41
1500
0
11
0
55
1800
1
25
1
45
1800
1
12
0
56
2100
1
26
1
48
1000
0
13
0
58
1800
1
27
1
52
1500
1
14
1
18
850
0
28
1
56
1800
1
逻辑回归SPSS操作方法的具体步骤:
1.选择Analyze→Regreessin→BinaryLogistic,打开对话框如图1所示:
图1主对话框Logistic回归。
2.选择因变量Y进入Dependent框内,将自变量选择进入Convariates框。
也可以将不同的自变量组放在不同的块(block)中,可以分析不同的自变量组对因变量的贡献。
3.在Mothed框内选择自变量的筛选策略:
Enter表示强行进入法;(本例选择)
Forword和Bacword都表示逐步筛选策略;Forword为自变量逐步进入,Bacword是自变量逐步剔出。
Conditional;LR;Wald分别表示不同的检验统计量,如ForwordWald表示自变量进入方程的依据是Wald统计量。
4.在Selection中选择一个变量作为条件变量,只有满足条件的变量数据才能参与回归分析。
5.单击Categorical打开Categorical对话框如图2所示:
对定性变量的自变量选择参照类。
常用的方法是Indicator,即以某个特定的类为参照类,Last表示以最大值对应的类为参照类(系统默认),First表示以最小值对应的类为参照类。
选择后点击Continue按钮返回主对话框。
(本例不作选择性)
图2Categorical对话框
6.单击Option按钮,打开Option对话框如图3所示
图3:
Option对话框
(1)从StatisticsandPlots框中选择输出图和分析结果。
ClassificationPlots:
表示绘制因变量实际值与预测分类值的关系图(本例选择)。
Hosmer-lemeshowgoodness-of-fit:
表示拟合优度指标(本例选择)。
CasewiseListingofresiduals:
表示输出各样本数据残差列表,有因变量的观察值,预测值,相应的预测概率,残差(非标准化残差,标准化残差)等。
Correlationsofestimations:
表示输出估计参数的相关矩阵(本例选择)。
Iterationhistory:
表示输出估计参数迭代过程中的参数与对数似然值(本例选择)。
CIforexp(B):
表示输出发生比N%的置信区间(默认95%)。
(2)从Display框中选择输出方式。
Ateachstep表示输出模型建立过程中的每一步结果(系统默认),Atlaststep表示只输出最终结果。
(3)从PropbabilityforStepwise框中指定自变量进入方程或剔除方程的显著性水平α。
Entry表示回归系数Score检验的概率p值小于0.05时相应变量可进入方程;Removal表示回归系数Score检验的概率p值大于0.1时相应变量应当剔除出回归方程.。
(4)ClassificationCutoff设置概率分界值,预测概率大于分界值(默认0.5)时,分类预测值为1,否则为预测值为0。
(本例选择系统默认项)
(5)从MaximumIterations框内指定极大似然估计的最大迭代次数(默认值是20)
7.单击Save按钮,打开Save对话框如图4所示:
从中选择需要保存预测结果到数据窗口。
图4:
Save对话框
(1)从PredietedValues框中,Probalities表示保存因变量取1的预测概率值,Croupmembership
表示保存分类预测值。
(本例选择)
(2)Residuals和Influence表示保存残差及影响点,具体含义与线性回归相同。
选择结束,后可以从输出窗口观看输出结果如下:
表1案例处理摘要
未加权的案例a
N
百分比
已选定的案例
包括在分析中
28
100.0
缺失案例
0
.0
总计
28
100.0
未选定的案例
0
.0
总计
28
100.0
a.如果权重有效,请参见分类表以获得案例总数。
表2因变量编码
初始值
内部值
0
0
1
1
以上两个表是数据个数,分类,及因变量的概况。
表3迭代历史记录a,b,c
迭代
-2对数似然值
系数
Constant
步骤0
1
38.673
-.143
2
38.673
-.143
a.模型中包括常量。
b.初始-2对数似然值:
38.673
c.因为参数估计的更改范围小于.001,所以估计在迭代次数2处终止。
表4分类表a,b
观察值
预测值
出行方式
百分比校正
0
1
步骤0
出行方式
0
15
0
100.0
1
13
0
.0
总百分比
53.6
a.模型中包括常量。
b.切割值为.500
表5方程中的变量
B
S.E.
Wald
df
显著性
Exp(B)
步骤0
常量
-.143
.379
.143
1
.706
.867
表6不在方程中的变量
得分
df
显著性
步骤0
变量
x3
5.073
1
.024
x1
6.038
1
.014
x2
2.946
1
.086
总统计量
10.414
3
.015
注意:
表3至表6表示只有常数项的模型,没有实际意义,可以不考虑。
表7迭代历史记录a,b,c,d
迭代
-2对数似然值
系数
Constant
x1
(1)
x2
x3
步骤1
1
27.128
-3.744
1.604
.056
.001
2
26.051
-5.464
2.241
.075
.001
3
25.971
-6.093
2.477
.082
.001
4
25.971
-6.156
2.502
.082
.002
5
25.971
-6.157
2.502
.082
.002
a.方法:
输入
b.模型中包括常量。
c.初始-2对数似然值:
38.673
d.因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。
表7表示的是迭代历史,表示每一次迭代中-2LL值和系数值。
表8模型系数的综合检验
卡方
df
显著性
步骤1
步骤
12.703
3
.005
块
12.703
3
.005
模型
12.703
3
.005
表8模型综合检验是模型拟合优度检验的,用-2LL度量。
最好的模型有-2LL=0,步骤1中的“步骤”中的卡方值是当前-2LL与下一步-2LL的差值,“块”中的卡方值为当前值-2LL与后一组变量进入模型后的-2LL的差值,“模型”中的卡方统计量是当前模型中的-2LL与只含常数项模型的-2LL的差值,因所有自变量是强行进入,只有一个步骤,一个块和一个模型,所以三者的卡方值相等。
本例中假设检验的P值等于0.005,小于0.05,故模型中至少有一个回归系数不为0。
表9模型摘要
步骤
-2对数似然值
Cox&SnellR方
NagelkerkeR方
1
25.971a
.365
.487
a.因为参数估计的更改范围小于.001,所以估计在迭代次数5处终止。
从表9中看出-22LN值不算太大,模型拟合程度一般。
Cox&SnellR2和NagelkerkeR2类似于线性模型中的拟合优度检验。
其中:
Cox&SnellR2=
NagelkerkeR2=
从表中得出Cox&SnellR2和NagelkerkeR2类不是太高,似合优度一般。
表10Hosmer和Lemeshow检验
步骤
卡方
df
显著性
1
11.513
7
.118
表11Hosmer和Lemeshow检验的随机性表
出行方式=0
出行方式=1
总计
观察值
期望值
观察值
期望值
步骤1
1
3
2.827
0
.173
3
2
2
2.664
1
.336
3
3
3
2.473
0
.527
3
4
3
2.047
0
.953
3
5
1
1.822
2
1.178
3
6
2
1.414
1
1.586
3
7
0
1.025
3
1.975
3
8
0
.556
3
2.444
3
9
1
.172
3
3.828
4
表10和表11是逻辑方程的拟合程度的检验,由于观察值和理论频数的差异不大,检验通过。
但是理论频数都小于5,原因是数据个数太少造成的,所以检验结果有待进一步检验。
表12分类表a
观察值
预测值
出行方式
百分比校正
0
1
步骤1
出行方式
0
13
2
86.7
1
3
10
76.9
总百分比
82.1
a.切割值为.500
表12也称错判矩阵。
从表10中看出,如出行方式为坐公交车15人中,预测值为13人,正确率为86.7%。
表13方程中的变量
B
S.E.
Wald
df
显著性
Exp(B)
步骤1a
x3
-2.502
1.158
4.669
1
.031
.082
x1
.082
.052
2.486
1
.115
1.086
x2
.002
.002
.661
1
.416
1.002
常量
-3.655
2.091
3.055
1
.081
.026
a.在步骤1中输入的变量:
x3,x1,x2.
从表13中可以得到回归系数、回归系数的标准误、Wald检验统计量、P值、发生比等。
其中第二个与第三个变量的回归系数没有通过检验。
为回归系数
的标准误。
表示一个自变量的发生比,指当其它自变量不变时,该自变量每增加一个单位,将引起发生比扩大
。
表14相关矩阵
Constant
x3
x1
x2
步骤1
Constant
1.000
.311
-.372
-.644
x3
.311
1.000
-.197
-.388
x1
-.372
-.197
1.000
-.400
x2
-.644
-.388
-.400
1.000
表14中表示的是回归系数的相关矩阵。
Step number:
1
Observed Groups and Predicted Probabilities
4 ┼ ┼
│ │
│ │
F │ │
R 3 ┼ ┼
E │ │
Q │ │
U │ │
E 2 ┼ 1 0 1 1 ┼
N │ 1 0 1 1 │
C │ 1 0 1 1 │
Y │ 1 0 1 1 │
1 ┼ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 ┼
│ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │
│ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │
│ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │
Predicted ─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼──────────
Prob:
0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1
Group:
0000000000000000000000000000000000000000000000000011111111111111111111111111111111111111111111111111
Predicted Probability is of Membership for 1
The Cut Value is .50
Symbols:
0 - 0
1 - 1
Each Symbol Represents .25 Cases.
图5预测分类图
预测分类图中显示预测值的分布,横坐标表示预测概率值,大于0.5的预测值将预测为1,小于0.5的预测值为0。
图中0表示实际观察值为Y=0,1表示观察值Y=1,纵向四个同样的数字表示一个样本观察值。
实验题:
为研究某商品消费特点和趋势,收集以往的消费数据,数据包括:
因变量Y为是否购买,购买取值为1,否则Y取值为0。
自变量有性别,年龄和收入水平。
数据见表。
试采用逻辑回归的方法进行分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 操纵 方法 逻辑 回归