书签分享收藏举报版权申诉 / 12

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 军事政治 > SPSS操纵方法逻辑回归.docx

SPSS操纵方法逻辑回归.docx

文档编号：5821753
上传时间：2023-01-01
格式：DOCX
页数：12
大小：88.79KB

SPSS操纵方法逻辑回归.docx

《SPSS操纵方法逻辑回归.docx》由会员分享，可在线阅读，更多相关《SPSS操纵方法逻辑回归.docx（12页珍藏版）》请在冰豆网上搜索。

SPSS操纵方法逻辑回归.docx

SPSS操纵方法逻辑回归

SPSS操作方法之五

SPSS操作方法：

逻辑回归

例证8.3:

在一次关于公共交通的社会调查中,一个调查项目是“乘公交车上下班,还是骑自行车上下班”因变量Y=1表示乘车，Y=0表示骑车。

自变量X1表示年龄；X2表示表示月收入；X3表示性别，取1时为男性，取0时为女性。

调查对象为工薪族群体。

数据见下表：

试建立Y与自变量之间的Logistic回归。

表8-4

序号

性别

年龄

月收入

y

序号

性别

年龄

月收入

y

1

0

18

850

0

15

1

20

1000

0

2

0

21

1200

0

16

1

25

1200

0

3

0

23

850

1

17

1

27

1300

0

4

0

23

950

1

18

1

28

1500

0

5

0

28

1200

1

19

1

30

950

1

6

0

31

850

0

20

1

32

1000

0

7

0

36

1500

1

21

1

33

1800

0

8

0

42

1000

1

22

1

33

1000

0

9

0

46

950

1

23

1

38

1200

0

10

0

48

1200

0

24

1

41

1500

0

11

0

55

1800

1

25

1

45

1800

1

12

0

56

2100

1

26

1

48

1000

0

13

0

58

1800

1

27

1

52

1500

1

14

1

18

850

0

28

1

56

1800

1

逻辑回归SPSS操作方法的具体步骤：

1．选择Analyze→Regreessin→BinaryLogistic,打开对话框如图1所示：

图1主对话框Logistic回归。

2．选择因变量Y进入Dependent框内，将自变量选择进入Convariates框。

也可以将不同的自变量组放在不同的块（block）中，可以分析不同的自变量组对因变量的贡献。

3．在Mothed框内选择自变量的筛选策略：

Enter表示强行进入法；（本例选择）

Forword和Bacword都表示逐步筛选策略；Forword为自变量逐步进入，Bacword是自变量逐步剔出。

Conditional;LR;Wald分别表示不同的检验统计量，如ForwordWald表示自变量进入方程的依据是Wald统计量。

4．在Selection中选择一个变量作为条件变量，只有满足条件的变量数据才能参与回归分析。

5．单击Categorical打开Categorical对话框如图2所示：

对定性变量的自变量选择参照类。

常用的方法是Indicator，即以某个特定的类为参照类，Last表示以最大值对应的类为参照类（系统默认），First表示以最小值对应的类为参照类。

选择后点击Continue按钮返回主对话框。

（本例不作选择性）

图2Categorical对话框

6．单击Option按钮，打开Option对话框如图3所示

图3：

Option对话框

（1）从StatisticsandPlots框中选择输出图和分析结果。

ClassificationPlots：

表示绘制因变量实际值与预测分类值的关系图（本例选择）。

Hosmer-lemeshowgoodness-of-fit：

表示拟合优度指标（本例选择）。

CasewiseListingofresiduals：

表示输出各样本数据残差列表，有因变量的观察值，预测值，相应的预测概率，残差（非标准化残差，标准化残差）等。

Correlationsofestimations：

表示输出估计参数的相关矩阵（本例选择）。

Iterationhistory：

表示输出估计参数迭代过程中的参数与对数似然值（本例选择）。

CIforexp（B）：

表示输出发生比N%的置信区间（默认95%）。

（2）从Display框中选择输出方式。

Ateachstep表示输出模型建立过程中的每一步结果（系统默认），Atlaststep表示只输出最终结果。

（3）从PropbabilityforStepwise框中指定自变量进入方程或剔除方程的显著性水平α。

Entry表示回归系数Score检验的概率p值小于0.05时相应变量可进入方程；Removal表示回归系数Score检验的概率p值大于0.1时相应变量应当剔除出回归方程.。

（4）ClassificationCutoff设置概率分界值，预测概率大于分界值（默认0.5）时,分类预测值为1,否则为预测值为0。

（本例选择系统默认项）

（5）从MaximumIterations框内指定极大似然估计的最大迭代次数（默认值是20）

7．单击Save按钮，打开Save对话框如图4所示：

从中选择需要保存预测结果到数据窗口。

图4：

Save对话框

（1）从PredietedValues框中，Probalities表示保存因变量取1的预测概率值，Croupmembership

表示保存分类预测值。

（本例选择）

（2）Residuals和Influence表示保存残差及影响点，具体含义与线性回归相同。

选择结束，后可以从输出窗口观看输出结果如下：

表1案例处理摘要

未加权的案例a

N

百分比

已选定的案例

包括在分析中

28

100.0

缺失案例

0

.0

总计

28

100.0

未选定的案例

0

.0

总计

28

100.0

a.如果权重有效，请参见分类表以获得案例总数。

表2因变量编码

初始值

内部值

0

1

以上两个表是数据个数，分类，及因变量的概况。

表3迭代历史记录a,b,c

迭代

-2对数似然值

系数

Constant

步骤0

1

38.673

-.143

2

38.673

-.143

a.模型中包括常量。

b.初始-2对数似然值:

38.673

c.因为参数估计的更改范围小于.001，所以估计在迭代次数2处终止。

表4分类表a,b

观察值

预测值

出行方式

百分比校正

0

1

步骤0

出行方式

0

15

0

100.0

1

13

0

.0

总百分比

53.6

a.模型中包括常量。

b.切割值为.500

表5方程中的变量

B

S.E.

Wald

df

显著性

Exp（B）

步骤0

常量

-.143

.379

.143

1

.706

.867

表6不在方程中的变量

得分

df

显著性

步骤0

变量

x3

5.073

1

.024

x1

6.038

1

.014

x2

2.946

1

.086

总统计量

10.414

3

.015

注意：

表3至表6表示只有常数项的模型，没有实际意义，可以不考虑。

表7迭代历史记录a,b,c,d

迭代

-2对数似然值

系数

Constant

x1

（1）

x2

x3

步骤1

1

27.128

-3.744

1.604

.056

.001

2

26.051

-5.464

2.241

.075

.001

3

25.971

-6.093

2.477

.082

.001

4

25.971

-6.156

2.502

.082

.002

5

25.971

-6.157

2.502

.082

.002

a.方法：

输入

b.模型中包括常量。

c.初始-2对数似然值:

38.673

d.因为参数估计的更改范围小于.001，所以估计在迭代次数5处终止。

表7表示的是迭代历史，表示每一次迭代中-2LL值和系数值。

表8模型系数的综合检验

卡方

df

显著性

步骤1

步骤

12.703

3

.005

块

12.703

3

.005

模型

12.703

3

.005

表8模型综合检验是模型拟合优度检验的，用-2LL度量。

最好的模型有-2LL=0，步骤1中的“步骤”中的卡方值是当前-2LL与下一步-2LL的差值，“块”中的卡方值为当前值-2LL与后一组变量进入模型后的-2LL的差值，“模型”中的卡方统计量是当前模型中的-2LL与只含常数项模型的-2LL的差值，因所有自变量是强行进入，只有一个步骤，一个块和一个模型，所以三者的卡方值相等。

本例中假设检验的P值等于0.005，小于0.05，故模型中至少有一个回归系数不为0。

表9模型摘要

步骤

-2对数似然值

Cox&SnellR方

NagelkerkeR方

1

25.971a

.365

.487

a.因为参数估计的更改范围小于.001，所以估计在迭代次数5处终止。

从表9中看出-22LN值不算太大，模型拟合程度一般。

Cox&SnellR2和NagelkerkeR2类似于线性模型中的拟合优度检验。

其中：

Cox&SnellR2=

NagelkerkeR2=

从表中得出Cox&SnellR2和NagelkerkeR2类不是太高，似合优度一般。

表10Hosmer和Lemeshow检验

步骤

卡方

df

显著性

1

11.513

7

.118

表11Hosmer和Lemeshow检验的随机性表

出行方式=0

出行方式=1

总计

观察值

期望值

观察值

期望值

步骤1

1

3

2.827

0

.173

3

2

2.664

1

.336

3

2.473

0

.527

3

4

3

2.047

0

.953

3

5

1

1.822

2

1.178

3

6

2

1.414

1

1.586

3

7

0

1.025

3

1.975

3

8

0

.556

3

2.444

3

9

1

.172

3

3.828

4

表10和表11是逻辑方程的拟合程度的检验，由于观察值和理论频数的差异不大，检验通过。

但是理论频数都小于5，原因是数据个数太少造成的，所以检验结果有待进一步检验。

表12分类表a

观察值

预测值

出行方式

百分比校正

0

1

步骤1

出行方式

0

13

2

86.7

1

3

10

76.9

总百分比

82.1

a.切割值为.500

表12也称错判矩阵。

从表10中看出，如出行方式为坐公交车15人中，预测值为13人，正确率为86.7%。

表13方程中的变量

B

S.E.

Wald

df

显著性

Exp（B）

步骤1a

x3

-2.502

1.158

4.669

1

.031

.082

x1

.082

.052

2.486

1

.115

1.086

x2

.002

.661

1

.416

1.002

常量

-3.655

2.091

3.055

1

.081

.026

a.在步骤1中输入的变量:

x3,x1,x2.

从表13中可以得到回归系数、回归系数的标准误、Wald检验统计量、P值、发生比等。

其中第二个与第三个变量的回归系数没有通过检验。

为回归系数

的标准误。

表示一个自变量的发生比，指当其它自变量不变时，该自变量每增加一个单位，将引起发生比扩大

。

表14相关矩阵

Constant

x3

x1

x2

步骤1

Constant

1.000

.311

-.372

-.644

x3

.311

1.000

-.197

-.388

x1

-.372

-.197

1.000

-.400

x2

-.644

-.388

-.400

1.000

表14中表示的是回归系数的相关矩阵。

Step number:

1

Observed Groups and Predicted Probabilities

4 ┼ ┼

│ │

F │ │

R 3 ┼ ┼

E │ │

Q │ │

U │ │

E 2 ┼ 1 0 1 1 ┼

N │ 1 0 1 1 │

C │ 1 0 1 1 │

Y │ 1 0 1 1 │

1 ┼ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 ┼

│ 00 0 00 0 0 0 00 01 1 0 0 1 1 1 1 1 1 0 11 │

Predicted ─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼─────────┼──────────

Prob:

0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1

Group:

0000000000000000000000000000000000000000000000000011111111111111111111111111111111111111111111111111

Predicted Probability is of Membership for 1

The Cut Value is .50

Symbols:

0 - 0

1 - 1

Each Symbol Represents .25 Cases.

图5预测分类图

预测分类图中显示预测值的分布，横坐标表示预测概率值,大于0.5的预测值将预测为1，小于0.5的预测值为0。

图中0表示实际观察值为Y=0，1表示观察值Y=1，纵向四个同样的数字表示一个样本观察值。

实验题：

为研究某商品消费特点和趋势，收集以往的消费数据，数据包括：

因变量Y为是否购买，购买取值为1，否则Y取值为0。

自变量有性别，年龄和收入水平。

数据见表。

试采用逻辑回归的方法进行分析。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: SPSS 操纵方法逻辑回归

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：SPSS操纵方法逻辑回归.docx
链接地址：https://www.bdocx.com/doc/5821753.html

SPSS操纵方法逻辑回归.docx

热门标签