SPSS二元Logistic回归结果分析报告.docx
- 文档编号:5545799
- 上传时间:2022-12-19
- 格式:DOCX
- 页数:20
- 大小:28.32KB
SPSS二元Logistic回归结果分析报告.docx
《SPSS二元Logistic回归结果分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS二元Logistic回归结果分析报告.docx(20页珍藏版)》请在冰豆网上搜索。
SPSS二元Logistic回归结果分析报告
SPSS-二元Logistic回归结果分析
2011-12-0216:
48
身心疲惫,睡意连连,头不断往下掉,拿出耳机,听下歌曲,缓
解我这严重的睡意吧!
今天来分析二元Logistic回归的结果
分析结果如下:
案例处理汇总
未加^的案例*
N
百分比
选定案例包括在分析中
489
57.5
駛失案例
0
.0
总计
469
57.5
未选定的案例
361
42.5
总计
350
100.0
商部値
否
0
是
1
分奘娈量塩码
频军
参敎縞晞
(D
(2)
⑶
(4)
敦盲水平来完战高中
209
1000
.000
.000
.000
髙中
134
.000
toao
000
.000
68
.000
oao
1.000
.000
大学
药
000
.000
.000
1.000
硏究生
3
.000
.050
X0D
.000
1:
在“案例处理汇总”中可以看出:
选定的案例489个,未选定的案例361个,这个结果是根据设定的validate=1得到的,在“因变量编码”中可以看出“违约”的两种结果“是”或者“否”分别用值“1“和“0”代替,在“分
类变量编码”中教育水平分为5类,如果选中“为完成高中,高中,大专,大学等,其中的任何一个,那么就取值为1,未选中的为0,如果四个都未被选中,那么就是”研究生“频率分别代表了处在某个教育水平的个数,总和应该为
489个
己观测
选理案刮'
未谨压的案例山冲
是否曾经茬约
百分比桢正
是否冒经违约
百分比檢正
B
否
曰
歩骤D是否曾经违妁否
3B0
0
100.0
157
0
WO.O
是
123
0
.0
54
0
0
73.B
74.4
a已选走的案MvalidaleEQI
b,未选定的案例validateNE1
c由于目娈量中有摭生値‘或分类麦鱼中的値国出连定黨例的范圉:
所収未时某些来谨建的累例遇行分类夕山撲型中包括常呈。
e切剖値知万E
方程中的娈量
B
S-E.
Wais
df
Sig.
拠(B)
齿骤B常量
■1.026
.103
100.029
1
000
.353
1:
在“分类表”中可以看出:
预测有360个是“否”(未违约)有129个是
“是”(违约)
2:
在“方程中的变量”表中可以看出:
最初是对“常数项”记性赋值,B为
-1.026,标准误差为:
0.103
那么wald=(B/S.E)2=(-1.026/0.103)2=99.2248,跟表中的“100.029几乎
接近,是因为我对数据进行的向下舍入的关系,所以数据会稍微偏小,
B和Exp(B)是对数关系,将B进行对数抓换后,可以得到:
Exp(B)=eA-1.026
=0.358,其中自由度为1,sig为0.000,非常显著
不在方程中的娈量
導分
i1J
歩叢0芟量年饋
7.46C
1
.006
教育
3,994
4
.061
敎育⑴
E.O0G
1
.014
敎育⑵
1.145
1
.2E5
教育⑶
2.224
1
.13S
敎育⑷
2.516
1
.113
工禎
36746
1
.000
地址
S.433
1
002
1.107
1
7B.41S
1
.000
信用卡母債
35.323
1
OOD
其他员儀
11531
1
.000
总计虽
U7.557
11
.000
1:
从“不在方程中的变量”可以看出,最初模型,只有“常数项”被纳入了模型,其它变量都不在最初模型表中分别给出了,得分,df,Sig三个值,而其中得分(Score)计算公式如下:
[\>心厂刃F
——.
J”
讯1—刃工(兀-补
(公式中(Xi-X")少了一个平方)
下面来举例说明这个计算过程:
(“年龄”自变量的得分为例)
则违约
从“分类表”中可以看出:
有129人违约,违约记为“T总和为129,选定案例总和为489
那么:
y-=129/489=0.16
x-=16951/489=34.2
所以:
刀(Xi-x")2=30074.9979
y"1-y")=0.16*(1-0.16)=0.216
则:
y—(1-y—)*刀(Xi-x-)2=0.216*30074.9979=5840.9044060372
则:
[刀Xi(yi-y")]A2=43570.8
所以:
«■
.--一.
J”
亍(1-刃工(兀-对
=43570.8/5840.9044060372=7.76
=7.46(四舍五入)
计算过程采用的是在EXCEL里面计算出来的,截图如下所示:
〒A
=(A486-AV2RAGE@$1;A$483)
2
ra
B
C
D
G
23
136.0633999
0
-6.06748
27
5出74^2545
0
-7.1227
34
0.4=41721973
0
-3.96S38
35
0,11247862
1
25.766S7
24
113.7341555
0
-6.33129
48
177.832315
0
-12.6626
26
75.0756688
0
-氐8589
30
2E75869539
1
22.03589
36
1.783235266
0
-9.49693
21
136.7218856
0
53^88
34
0.44L721973
0
-9.96933
35
0・11247862
1
25.76687
35
61124=7862
0
-9.23313
34
L441721973
1
25,03067
S3
2.770965327
0
-8.70552
30
21.75869539
0
-7.91411
昭
113.7341555
0
-6.33129
47
152.1615584
0
-12.3988
53
336.1860993
1
39*0184
22
ISO.39Z6122
0
-5.80368
3£
1.783235266
1
26.50307
29
32.03793874;
0
-7.65031
33
2.770965327
0
-8.70552
45
106.82004=51
0
-*11,8712
16951
3007k99?
%
0.263804
43570,3
从“不在方程的变量中”可以看出,年龄的“得分”为7.46,刚好跟计算结果
吻合!
!
答案得到验证~!
!
!
!
块化方法=向前步进(似然比)
模型系敷的综合检脸
卡方
df
Sig.
歩骡1步霊
74.052
1
.000
块
74C52
1
.000
74.C52
1
.DOO
曲糠2歩骤
44.543
1
.000
块
11B.595
2
.000
模璽
11&£95
2
.□00
曲黔3歩驟
40B19
1
.000
块
108.414
3
.000
模型
169.414
3
.000
步骤4歩骤
0677
1
.002
块
178.091
4
.DOO
卿
T7B.091
4
.000
撲型汇总
步躱
-2蹲数似熱値
Gok&SrielIF?
Nacel^rkeR
1
.141
.205
2
145709**
215
.315
3
355.35^
4
3S6213e
305
.446
a因対帥估计的更改范圉小于001,所以估计在送代突散4处烫止=
b因母毎数估计的更改范圉小于001、所以估计在迭
代迟散£蟲終征0
c盘事hZ-韦丄册古at/rpmnhTnn
1:
从“块T中可以看出:
采用的是:
向前步进的方法,在“模型系数的综合检验”表中可以看出:
所有的SIG几乎都为“0”而且随着模型的逐渐
步进,卡方值越来越大,说明模型越来越显著,在第4步后,终止,
根据设定的显著性值和
=CHIINV(显著性值,自由度)
自由度,可以算出卡方临界值,公式为:
,放入excel就可以得到结果
2:
在“模型汇总“中可以看出:
Cox&SnellR方和NagelkerkeR方拟合效
果都不太理想,最终理想模型也才:
0.305和0.446,最大似然平方的对数值都比较大,明显是显著的
lnL=yrKlnP+f1K)ln(l£)1
似然数对数计算公式为:
计算过程太费时间了,我就不举例说明计算过程了
Cox&SnellR方的计算值是根据:
1:
先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0(指只包含“常数项”的检验)
2:
再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InLB(包含自变量的检验)
R&三L-q"
再根据公式:
方的值!
即可算出:
Cox&SnellR
=Hosmer和Lemeshow捡验=
歩骡
卡方
df
Sig.
1
7.567
8
.477
2
5.311
S
.721
3
3.312
e
.S13
4
11.919
9
155
是否曾经违约二昙
总计
已观测
期望値
己观测
期望値
歩骤1
1
44
44.308
5
4.612
49
2
45
43.344
4
49
3
41
41.107
T
0.513
4B
4
37
4C.52G
11
7.4S0
48
5
45
4C.201
4
S.799
49
&
39
37.607
g
10.393
48
T
33
35.142
15
1Z653
43
g
馆
32.590
16
16.410
43
9
27.217
25
21.783
49
10
19
17.506
33
34.494
52
步骡2
1
48
47.541
1
1.459
斗3
2
46
46.044
3
2帧
49
3
45
44.258
4
4J42
49
4
42
*2.494
7
6.506
49
5
39
40.385
11
Q.E15
49
应
35
37.955
U
11J46
49
T
38
34.330
11
14.170
49
35
3C.562
U
1B.43S
4S
9
3
23.564
28
25.436
48
10
12
12.165
36
35535
48
需俱*
1
1Rfi1d
n
3
提示:
将Hosmer和Lemeshow检验和“随机性表”结合一起来分析
1从Hosmer和Lemeshow检验表中,可以看出:
经过4次迭代后,最终的卡
方统计量为:
11.919,而临界值为:
CHINV(0.05,8)=15.507
卡方统计量<临界值,从SIG角度来看:
0.155>0.05,说明模型能够很好
的拟合整体,不存在显著的差异。
2:
从Hosmer和Lemeshow检验随即表中可以看出:
”观测值“和”期望值
“几乎是接近的,不存在很大差异,说明模型拟合效果比较理想,印证了“Hosmer和Lemeshow检验”中的结果
而“Hosmer和Lemeshow检验”表中的“卡方”统计量,是通过“Hosmer和Lemeshow检验随即表”中的数据得到的(即通过“观测值和”预测值“)得到的,计算公式如下所示:
x2(卡方统计量)
刀(观测值频率-预测值频率)A2/预测值的频率
举例说明一下计算过程:
以计算"步骤1的卡方统计量为例"
1:
将“Hosmer和Lemeshow检验随即表”中“步骤1”的数据,复制到
excel中,得到如下所示结果:
C21-1A=SUliKCL:
C
20)
AB
C|D
E
44
44.369
0.003335
1
45
45.344
0.063249
*
41
41.487
0.00S714
E
37
40.520
0.30&729
1
45
40.201
0.572B74
1
3S
37.607
0.051608
*
羽
35.142
0.130517
¥
1
33
32.550
0,005166
1
24
27.217
0.38C177
L
15
17.506
0.127566
5
4.619
0.032576
2
4
5.656
0.484724
3
7
6.513
ij.036396
4
11
7.ISO
1.656082
5
4
8禅
2.C17364
5
5
10.393
0.186741
7
15
12.958
0.3567
3
16
16.410
0.010258
d
25
21.7E3
0.47S004
34.494
0.^64739
1
7.5^6569
从“Hosmer和Lemeshow检验”表中可以看出,步骤1的卡方统计量为:
7.567,在上图中,通过excel计算得到,结果为7.566569~~7.567(四
舍五入),结果是一致的,答案得到验证!
!
己观测
已预测
选定案例*
耒选定的案例Z
是香曾经违妁
百分讯校正
是否曾经违约
否
旱
是
歩骤1墨否曾经违釣習
是总计百井比
340
95
20
3斗
54.4
26.4
76.5
150
42
7
12
95.5
222
76;8
歩骤2是否曾经曲否是总计百分比
335
74
25
55
S3.1
42.6
79.0
r14T
39
10
15
93.6
27S
?
e.c
歩骤3是否曾经违妁沓
是
总计百分上匕
333
S4
27
65
S2.5
50.4
61.4
142
=33
15
21
90.4
36.5
773
歩骤4是否曾墟违妁否
是
总计百分上匕
337
56
23
71
33.6
55.0
€3.4
141
34
16
89.S
37C
76.3
a-已选定的案例validateEO1
b未选定的案例validateNE1
c由于自娈量中有缺矢値・戴分类变量中師値超出谨定案例朗范国・所収未肘某些未违定的案例进行分类*d切割値对.500
1:
从“分类表”一“步骤T中可以看出:
选定的案例中,“是否曾今违约”总计:
489个,其中没有违约的360个,并且对360个“没有违约”的客户进行了预测,有340个预测成功,20个预测失败,预测成功率为:
340/360=94.4%
其中“违约”的有189个,也对189个“违约”的客户进行了预测,有95个预测失败,34个预测成功,预测成功率:
34/129=26.4%
总计预测成功率:
(340+34)/489=76.5%
步骤1的总体预测成功率为:
76.5%,在步骤4终止后,总体预测成功率为:
83.4,预测准确率逐渐提升76.5%—79.8%—81.4%—83.4。
83.4的预测准确率,不能够算太高,只能够说还行。
如果務去项则龍蟆
畫量
模酣数似然性
在-2对敵似然中的夏改
cff
夏改的显薯性
步膘1負债率
-282.152
74.052
1
.000
浚骤2工龄
-345.126
44543
1
.000
费债率
-260995
76292
1
.000
步转3工龄
-242996
90.102
1
.000
员债率
-205804
15877
1
ooa
信用卡员债
-222955
49819
1
.000
歩礫4工龄
-2347?
6
83.338
1
.000
地址
-197.945
9677
1
.00?
負债率
-200.672
15.130
1
.Q0&
信用卡负债
-221.194
56V4
1
000
岛程中的娈量
e
S.E.
Wais
df
Sig,
Exp
歩骤1a员债率
.129
cie
61777
1
.000
1.133
竜量
-2500
.228
111Q4S
1
DGO
082
歩寢2b工龄
-.131
022
34.S50
1
.000
877
罚備率
.140
.016
61.974
1
.000
1.15D
-1655
.25C
43.051
1
.DOO
.1S4
歩疆屮工聒
■252
033
57744
1
.DOD
777
罚债率
0€3
021
1572S
1
.000
1.0S6
信用卡彷债
.544
31r090
1
OGD
1723
寓量
-1.161
.275
13.505
1
.DOO
.307
垢骤4d工龄
-249
.034
54.S77
1
JOO
790
地址
-.069
.023
9,027
1
003
.933
E债率
081
.021
14.E93
1
.000
1.085
信用咔罚债
.594
.102
33650
1
JOD
1811
常量
-.766
.304
6375
1
.012
4B5
包在出骡1中输入的吏呈:
负债率.工在歩碟上中输入的麦量:
工騒
C.在歩骤2中输入的生呈.信用卡氏I伍.止在歩骡4中输入的妾量:
地址.
从“如果移去项则建模”表中可以看出:
“在-2对数似然中的更改”中的数值是不是很眼熟?
?
?
,跟在“模型系数总和检验”表中“卡方统计量"量的值是一样的!
!
!
将“如果移去项则建模”和“方程中的变量”两个表结合一起来看
1:
在“方程中的变量”表中可以看出:
在步骤1中输入的变量为“负债
率”,在”如果移去项则建模“表中可以看出,当移去“负债率”这个变量
时,引起了74.052的数值更改,此时模型中只剩下“常数项”-282.152为常数
项的对数似然值
在步骤2中,当移去“工龄”这个自变量时,引起了44.543的数值变化(简称:
似然比统计量),在步骤2中,移去“工龄”这个自变量后,还剩下“负债率”和“常量”,此时对数似然值变成了:
-245.126,此时我们可以通过公式算出“负债率”的似然比统计量:
计算过程如下:
答案得到验证!
!
!
似然比统计量=2(-245.126+282.152)=74.052
2:
在“如果移去项则建模”表中可以看出:
不管移去那一个自变量,“更改的显著性”都非常小,几乎都小于0.05,所以这些自变量系数跟模型显著相关,不能够剔去!
!
3:
根据"方程中的变量“这个表,我们可以得出logistic回归模型表达式:
1/1+eA-(a+Epl*Xi)
们假设Z=
+£窪1旳力那么可以得到简洁表达式:
P(Y)=1/1+eA(-z)
将”方程中的变量
步骤4中的参数代入
模型表达式中,可以得
到logistic回归模型如下所示:
P(Y)=1/1+ea-址-0.249*功龄)
(-0.766+0.594*信用卡负债率+0.081*负债率-0.069*地
收入
.430
1
.512
奏他们债
.012
1
.9U
12.707
S
122
步藥4娈蚤年豔
2.023
1
.155
1.233
4
373
載育⑴
.347
1
.556
.050
1
.913
772
1
380
報育(4)
J36
1
.712
收入
.005
1
.946
.131
1
718
总锁计量
3613
7
.323
从”不在方程中的变量“表中可以看出:
年龄,教育,收入,其它负债,都没有纳入模型中,其中:
sig值都大于0.05,所以说明这些自变量跟模型显著不相关。
Stepnumber:
4
ObservedGroupsandPredictedProtoatiltti^s
80++
F
R
&Q+
+
E
1
1
Q
1
1
U
1
1
E
40+0
十
N
10
1
c
10
1
Y
1000
1
20+0000
十
1000001
1
1000000100101100001
1011
ioooooooooooooaoooooooOOOOIO0011001100000011111111111111
rreaiCLeu~-十——
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 二元 Logistic 回归 结果 分析 报告