书签分享收藏举报版权申诉 / 20

立即下载加入VIP,免费下载

当前位置：首页 > 法律文书 > 判决书 > SPSS二元Logistic回归结果分析报告.docx

SPSS二元Logistic回归结果分析报告.docx

文档编号：5545799
上传时间：2022-12-19
格式：DOCX
页数：20
大小：28.32KB

《SPSS二元Logistic回归结果分析报告.docx》由会员分享，可在线阅读，更多相关《SPSS二元Logistic回归结果分析报告.docx（20页珍藏版）》请在冰豆网上搜索。

SPSS二元Logistic回归结果分析报告.docx

SPSS二元Logistic回归结果分析报告

SPSS-二元Logistic回归结果分析

2011-12-0216:

48

身心疲惫，睡意连连，头不断往下掉，拿出耳机，听下歌曲，缓

解我这严重的睡意吧！

今天来分析二元Logistic回归的结果

分析结果如下：

案例处理汇总

未加^的案例*

N

百分比

选定案例包括在分析中

489

57.5

駛失案例

0

.0

总计

469

57.5

未选定的案例

361

42.5

总计

350

100.0

商部値

否

0

是

1

分奘娈量塩码

频军

参敎縞晞

（D

（2）

⑶

（4）

敦盲水平来完战高中

209

1000

.000

髙中

134

.000

toao

000

.000

68

.000

oao

1.000

.000

大学

药

000

.000

1.000

硏究生

3

.000

.050

X0D

.000

1：

在“案例处理汇总”中可以看出：

选定的案例489个，未选定的案例361个，这个结果是根据设定的validate=1得到的，在“因变量编码”中可以看出“违约”的两种结果“是”或者“否”分别用值“1“和“0”代替，在“分

类变量编码”中教育水平分为5类，如果选中“为完成高中，高中，大专，大学等，其中的任何一个，那么就取值为1，未选中的为0,如果四个都未被选中，那么就是”研究生“频率分别代表了处在某个教育水平的个数，总和应该为

489个

己观测

选理案刮'

未谨压的案例山冲

是否曾经茬约

百分比桢正

是否冒经违约

百分比檢正

B

否

曰

歩骤D是否曾经违妁否

3B0

0

100.0

157

0

WO.O

是

123

0

.0

54

0

73.B

74.4

a已选走的案MvalidaleEQI

b,未选定的案例validateNE1

c由于目娈量中有摭生値‘或分类麦鱼中的値国出连定黨例的范圉：

所収未时某些来谨建的累例遇行分类夕山撲型中包括常呈。

e切剖値知万E

方程中的娈量

B

S-E.

Wais

df

Sig.

拠（B）

齿骤B常量

■1.026

.103

100.029

1

000

.353

1:

在“分类表”中可以看出：

预测有360个是“否”（未违约）有129个是

“是”（违约）

2:

在“方程中的变量”表中可以看出：

最初是对“常数项”记性赋值，B为

-1.026，标准误差为：

0.103

那么wald=（B/S.E）2=（-1.026/0.103）2=99.2248,跟表中的“100.029几乎

接近，是因为我对数据进行的向下舍入的关系，所以数据会稍微偏小，

B和Exp（B）是对数关系，将B进行对数抓换后，可以得到：

Exp（B）=eA-1.026

=0.358,其中自由度为1，sig为0.000,非常显著

不在方程中的娈量

導分

i1J

歩叢0芟量年饋

7.46C

1

.006

教育

3,994

4

.061

敎育⑴

E.O0G

1

.014

敎育⑵

1.145

1

.2E5

教育⑶

2.224

1

.13S

敎育⑷

2.516

1

.113

工禎

36746

1

.000

地址

S.433

1

002

1.107

1

7B.41S

1

.000

信用卡母債

35.323

1

OOD

其他员儀

11531

1

.000

总计虽

U7.557

11

.000

1:

从“不在方程中的变量”可以看出，最初模型，只有“常数项”被纳入了模型，其它变量都不在最初模型表中分别给出了，得分，df,Sig三个值,而其中得分（Score）计算公式如下：

[\＞心厂刃F

——.

J”

讯1—刃工（兀-补

（公式中（Xi-X"）少了一个平方）

下面来举例说明这个计算过程：

（“年龄”自变量的得分为例）

则违约

从“分类表”中可以看出：

有129人违约，违约记为“T总和为129，选定案例总和为489

那么：

y-=129/489=0.16

x-=16951/489=34.2

所以：

刀（Xi-x"）2=30074.9979

y"1-y"）=0.16*（1-0.16）=0.216

则：

y—（1-y—）*刀（Xi-x-）2=0.216*30074.9979=5840.9044060372

则：

[刀Xi（yi-y"）]A2=43570.8

所以：

«■

.--一.

J”

亍（1-刃工（兀-对

=43570.8/5840.9044060372=7.76

=7.46（四舍五入）

计算过程采用的是在EXCEL里面计算出来的，截图如下所示:

〒A

=（A486-AV2RAGE@$1;A$483）

2

ra

B

C

D

G

23

136.0633999

0

-6.06748

27

5出74^2545

0

-7.1227

34

0.4=41721973

0

-3.96S38

35

0,11247862

1

25.766S7

24

113.7341555

0

-6.33129

48

177.832315

0

-12.6626

26

75.0756688

0

-氐8589

30

2E75869539

1

22.03589

36

1.783235266

0

-9.49693

21

136.7218856

0

53^88

34

0.44L721973

0

-9.96933

35

0・11247862

1

25.76687

35

61124=7862

0

-9.23313

34

L441721973

1

25,03067

S3

2.770965327

0

-8.70552

30

21.75869539

0

-7.91411

昭

113.7341555

0

-6.33129

47

152.1615584

0

-12.3988

53

336.1860993

1

39*0184

22

ISO.39Z6122

0

-5.80368

3£

1.783235266

1

26.50307

29

32.03793874；

0

-7.65031

33

2.770965327

0

-8.70552

45

106.82004=51

0

-*11,8712

16951

3007k99?

%

0.263804

43570,3

从“不在方程的变量中”可以看出，年龄的“得分”为7.46，刚好跟计算结果

吻合！

！

答案得到验证~!

!

块化方法=向前步进（似然比）

模型系敷的综合检脸

卡方

df

Sig.

歩骡1步霊

74.052

1

.000

块

74C52

1

.000

74.C52

1

.DOO

曲糠2歩骤

44.543

1

.000

块

11B.595

2

.000

模璽

11&£95

2

.□00

曲黔3歩驟

40B19

1

.000

块

108.414

3

.000

模型

169.414

3

.000

步骤4歩骤

0677

1

.002

块

178.091

4

.DOO

卿

T7B.091

4

.000

撲型汇总

步躱

-2蹲数似熱値

Gok&SrielIF?

Nacel^rkeR

1

.141

.205

2

145709**

215

.315

3

355.35^

4

3S6213e

305

.446

a因対帥估计的更改范圉小于001，所以估计在送代突散4处烫止=

b因母毎数估计的更改范圉小于001、所以估计在迭

代迟散£蟲終征0

c盘事hZ-韦丄册古at/rpmnhTnn

1：

从“块T中可以看出：

采用的是：

向前步进的方法，在“模型系数的综合检验”表中可以看出：

所有的SIG几乎都为“0”而且随着模型的逐渐

步进，卡方值越来越大，说明模型越来越显著，在第4步后，终止，

根据设定的显著性值和

=CHIINV（显著性值,自由度）

自由度，可以算出卡方临界值，公式为:

，放入excel就可以得到结果

2：

在“模型汇总“中可以看出：

Cox&SnellR方和NagelkerkeR方拟合效

果都不太理想，最终理想模型也才：

0.305和0.446，最大似然平方的对数值都比较大，明显是显著的

lnL=yrKlnP+f1K）ln（l£）1

似然数对数计算公式为：

计算过程太费时间了，我就不举例说明计算过程了

Cox&SnellR方的计算值是根据：

1:

先拟合不包含待检验因素的Logistic模型，求对数似然函数值INL0（指只包含“常数项”的检验）

2:

再拟合包含待检验因素的Logistic模型，求新的对数似然函数值InLB（包含自变量的检验）

R&三L-q"

再根据公式：

方的值！

即可算出：

Cox&SnellR

=Hosmer和Lemeshow捡验=

歩骡

卡方

df

Sig.

1

7.567

8

.477

2

5.311

S

.721

3

3.312

e

.S13

4

11.919

9

155

是否曾经违约二昙

总计

已观测

期望値

己观测

期望値

歩骤1

1

44

44.308

5

4.612

49

2

45

43.344

4

49

3

41

41.107

T

0.513

4B

4

37

4C.52G

11

7.4S0

48

5

45

4C.201

4

S.799

49

&

39

37.607

g

10.393

48

T

33

35.142

15

1Z653

43

g

馆

32.590

16

16.410

43

9

27.217

25

21.783

49

10

19

17.506

33

34.494

52

步骡2

1

48

47.541

1

1.459

斗3

2

46

46.044

3

2帧

49

3

45

44.258

4

4J42

49

4

42

*2.494

7

6.506

49

5

39

40.385

11

Q.E15

49

应

35

37.955

U

11J46

49

T

38

34.330

11

14.170

49

35

3C.562

U

1B.43S

4S

9

3

23.564

28

25.436

48

10

12

12.165

36

35535

48

需俱*

1

1Rfi1d

n

3

提示：

将Hosmer和Lemeshow检验和“随机性表”结合一起来分析

1从Hosmer和Lemeshow检验表中，可以看出：

经过4次迭代后，最终的卡

方统计量为：

11.919，而临界值为：

CHINV（0.05,8）=15.507

卡方统计量<临界值，从SIG角度来看：

0.155>0.05,说明模型能够很好

的拟合整体，不存在显著的差异。

2：

从Hosmer和Lemeshow检验随即表中可以看出：

”观测值“和”期望值

“几乎是接近的，不存在很大差异，说明模型拟合效果比较理想，印证了“Hosmer和Lemeshow检验”中的结果

而“Hosmer和Lemeshow检验”表中的“卡方”统计量，是通过“Hosmer和Lemeshow检验随即表”中的数据得到的（即通过“观测值和”预测值“）得到的，计算公式如下所示：

x2（卡方统计量）

刀（观测值频率-预测值频率）A2/预测值的频率

举例说明一下计算过程：

以计算"步骤1的卡方统计量为例"

1:

将“Hosmer和Lemeshow检验随即表”中“步骤1”的数据，复制到

excel中，得到如下所示结果：

C21-1A=SUliKCL:

C

20）

AB

C|D

E

44

44.369

0.003335

1

45

45.344

0.063249

*

41

41.487

0.00S714

E

37

40.520

0.30&729

1

45

40.201

0.572B74

1

3S

37.607

0.051608

*

羽

35.142

0.130517

¥

1

33

32.550

0,005166

1

24

27.217

0.38C177

L

15

17.506

0.127566

5

4.619

0.032576

2

4

5.656

0.484724

3

7

6.513

ij.036396

4

11

7.ISO

1.656082

5

4

8禅

2.C17364

5

10.393

0.186741

7

15

12.958

0.3567

3

16

16.410

0.010258

d

25

21.7E3

0.47S004

34.494

0.^64739

1

7.5^6569

从“Hosmer和Lemeshow检验”表中可以看出，步骤1的卡方统计量为：

7.567,在上图中，通过excel计算得到，结果为7.566569~~7.567（四

舍五入），结果是一致的，答案得到验证！

！

己观测

已预测

选定案例*

耒选定的案例Z

是香曾经违妁

百分讯校正

是否曾经违约

否

旱

是

歩骤1墨否曾经违釣習

是总计百井比

340

95

20

3斗

54.4

26.4

76.5

150

42

7

12

95.5

222

76；8

歩骤2是否曾经曲否是总计百分比

335

74

25

55

S3.1

42.6

79.0

r14T

39

10

15

93.6

27S

?

e.c

歩骤3是否曾经违妁沓

是

总计百分上匕

333

S4

27

65

S2.5

50.4

61.4

142

=33

15

21

90.4

36.5

773

歩骤4是否曾墟违妁否

是

总计百分上匕

337

56

23

71

33.6

55.0

€3.4

141

34

16

89.S

37C

76.3

a-已选定的案例validateEO1

b未选定的案例validateNE1

c由于自娈量中有缺矢値・戴分类变量中師値超出谨定案例朗范国・所収未肘某些未违定的案例进行分类*d切割値对.500

1：

从“分类表”一“步骤T中可以看出：

选定的案例中，“是否曾今违约”总计：

489个，其中没有违约的360个，并且对360个“没有违约”的客户进行了预测，有340个预测成功，20个预测失败，预测成功率为：

340/360=94.4%

其中“违约”的有189个，也对189个“违约”的客户进行了预测，有95个预测失败，34个预测成功，预测成功率：

34/129=26.4%

总计预测成功率：

（340+34）/489=76.5%

步骤1的总体预测成功率为：

76.5%,在步骤4终止后，总体预测成功率为：

83.4，预测准确率逐渐提升76.5%—79.8%—81.4%—83.4。

83.4的预测准确率，不能够算太高，只能够说还行。

如果務去项则龍蟆

畫量

模酣数似然性

在-2对敵似然中的夏改

cff

夏改的显薯性

步膘1負债率

-282.152

74.052

1

.000

浚骤2工龄

-345.126

44543

1

.000

费债率

-260995

76292

1

.000

步转3工龄

-242996

90.102

1

.000

员债率

-205804

15877

1

ooa

信用卡员债

-222955

49819

1

.000

歩礫4工龄

-2347?

6

83.338

1

.000

地址

-197.945

9677

1

.00?

負债率

-200.672

15.130

1

.Q0&

信用卡负债

-221.194

56V4

1

000

岛程中的娈量

e

S.E.

Wais

df

Sig,

Exp

歩骤1a员债率

.129

cie

61777

1

.000

1.133

竜量

-2500

.228

111Q4S

1

DGO

082

歩寢2b工龄

-.131

022

34.S50

1

.000

877

罚備率

.140

.016

61.974

1

.000

1.15D

-1655

.25C

43.051

1

.DOO

.1S4

歩疆屮工聒

■252

033

57744

1

.DOD

777

罚债率

0€3

021

1572S

1

.000

1.0S6

信用卡彷债

.544

31r090

1

OGD

1723

寓量

-1.161

.275

13.505

1

.DOO

.307

垢骤4d工龄

-249

.034

54.S77

1

JOO

790

地址

-.069

.023

9,027

1

003

.933

E债率

081

.021

14.E93

1

.000

1.085

信用咔罚债

.594

.102

33650

1

JOD

1811

常量

-.766

.304

6375

1

.012

4B5

包在出骡1中输入的吏呈:

负债率.工在歩碟上中输入的麦量:

工騒

C.在歩骤2中输入的生呈.信用卡氏I伍.止在歩骡4中输入的妾量:

地址.

从“如果移去项则建模”表中可以看出：

“在-2对数似然中的更改”中的数值是不是很眼熟？

？

，跟在“模型系数总和检验”表中“卡方统计量"量的值是一样的！

！

将“如果移去项则建模”和“方程中的变量”两个表结合一起来看

1:

在“方程中的变量”表中可以看出：

在步骤1中输入的变量为“负债

率”，在”如果移去项则建模“表中可以看出，当移去“负债率”这个变量

时，引起了74.052的数值更改，此时模型中只剩下“常数项”-282.152为常数

项的对数似然值

在步骤2中，当移去“工龄”这个自变量时，引起了44.543的数值变化（简称：

似然比统计量），在步骤2中，移去“工龄”这个自变量后，还剩下“负债率”和“常量”，此时对数似然值变成了：

-245.126，此时我们可以通过公式算出“负债率”的似然比统计量：

计算过程如下：

答案得到验证！

！

似然比统计量=2（-245.126+282.152）=74.052

2:

在“如果移去项则建模”表中可以看出：

不管移去那一个自变量，“更改的显著性”都非常小，几乎都小于0.05，所以这些自变量系数跟模型显著相关,不能够剔去！

！

3：

根据"方程中的变量“这个表，我们可以得出logistic回归模型表达式:

1/1+eA-（a+Epl*Xi）

们假设Z=

+£窪1旳力那么可以得到简洁表达式:

P（Y）=1/1+eA（-z）

将”方程中的变量

步骤4中的参数代入

模型表达式中，可以得

到logistic回归模型如下所示:

P（Y）=1/1+ea-址-0.249*功龄）

（-0.766+0.594*信用卡负债率+0.081*负债率-0.069*地

收入

.430

1

.512

奏他们债

.012

1

.9U

12.707

S

122

步藥4娈蚤年豔

2.023

1

.155

1.233

4

373

載育⑴

.347

1

.556

.050

1

.913

772

1

380

報育（4）

J36

1

.712

收入

.005

1

.946

.131

1

718

总锁计量

3613

7

.323

从”不在方程中的变量“表中可以看出：

年龄，教育，收入，其它负债，都没有纳入模型中，其中：

sig值都大于0.05，所以说明这些自变量跟模型显著不相关。

Stepnumber:

4

ObservedGroupsandPredictedProtoatiltti^s

80++

F

R

&Q+

+

E

1

Q

1

U

1

E

40+0

十

N

10

1

c

10

1

Y

1000

1

20+0000

十

1000001

1

1000000100101100001

1011

ioooooooooooooaoooooooOOOOIO0011001100000011111111111111

rreaiCLeu~-十——

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: SPSS 二元 Logistic 回归结果分析报告

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：SPSS二元Logistic回归结果分析报告.docx
链接地址：https://www.bdocx.com/doc/5545799.html

SPSS二元Logistic回归结果分析报告.docx

热门标签