SPSS分析作业.docx
- 文档编号:6817562
- 上传时间:2023-01-10
- 格式:DOCX
- 页数:17
- 大小:839.31KB
SPSS分析作业.docx
《SPSS分析作业.docx》由会员分享,可在线阅读,更多相关《SPSS分析作业.docx(17页珍藏版)》请在冰豆网上搜索。
SPSS分析作业
SPSS分析作业
1.研究目的
第一步,通过选取A1量表中的引领潮流、追随潮流、中国制造、欧美品牌、保修条款、优惠券、昂贵商品、四处打听、便宜货、羡慕眼光等变量,即消费者的购物频度、多少和购物风格,分析出消费者可以分为几个类别和这些类别的特点,相当于市场营销市场细分的第一步:
Segmentation。
好!
第二步,选取人口学变量,如年龄、职业、家庭收入、个人可支配收入、文化程度等,来了解各个类别消费者的主要特征,从而通过对消费者个人特征的了解,来判断他们属于那一个类别。
好!
这个判别模型将有利于Targeting.
2.模型选取
在整个问卷中,没有连续型变量的存在(有两个即消费次数和餐饮次数)。
进行市场细分时,因为我事先不知道消费者可以分为几类,而我依据的变量是分类变量(消费次数、餐饮次数、追随潮流、中国制造、欧美品牌、保修条款、优惠券、昂贵商品、四处打听、便宜货、羡慕眼光),而且是对样本聚类,样本数据也比较大,因此我选取了两步骤聚类(Two-StepCluster)的方法。
好.不过注意两步法既可以用于分类也可以用于连续变量!
在市场细分的基础上,我将消费者的分类情况作为一个新的变量TSC_7449,因为这个变量是一个三水平的分类变量,所以用了多峰逻辑回归的模型,来看人口学特征对消费者分类情况的预测准确度。
好!
3.描述性分析
事前,可靠度分析的结果表明,A1量表中,“产地品牌”和“投诉”两个变量会影响分析结果,删除更好,所以,只对剩下的10个变量进行分析。
好,交待很清楚
根据变量的特点,我进行了两种描述性分析:
Frequency和CrossTables。
分析的结果如下:
交叉表格可以不要.用频率分布就可以.另外最好用一两句话总结每个表格比较好
4.输出结果的说明
(1)两步骤聚类:
ClusterDistribution
N
%ofCombined
%ofTotal
Cluster
1
199
40.0%
39.3%
2
164
33.0%
32.3%
3
134
27.0%
26.4%
Combined
497
100.0%
98.0%
ExcludedCases
10
2.0%
Total
507
100.0%
从表中可以看出,消费者可以分为三类,每一类的人数差别不是很大,但是第一类的人数最多,占到40%。
因为变量都是分类型,所以没有Centroids表格,选取几个重要的变量的Frequencies表格:
好!
从以上的图表可以看出,第一类是倾向于喜欢引领潮流,对中国制造的品牌没有“歧视性”眼光,购物后不喜欢四处打听价格,也不在意别人的羡慕眼光;第二类喜欢引领潮流,不喜欢中国制造品牌,购物后喜欢四处打听商品价格,比较在意别人的羡慕眼光;第三类对潮流不太敏感,对中国品牌也没有“歧视”,购物后不喜欢四处打听价格,很不在意别人羡慕的眼光。
因此,我将第一类消费者命名为时尚理性型、第二类为虚荣敏感型、第三类为购物冷感型。
你的第一类是指第一丛吗?
如果是的话第一丛并没有第二丛那样喜欢引领潮流啊!
把非常同意和比较同意两类综合起来看可以知道!
从CategoricalVariablewiseImportance图表中可以看出,所有的变量的teststatistic都超过了CriticalValue,说明变量比较显著,对聚类的贡献比较大。
然而,变量的teststatistic值从第一个开始递减,说明前面的变量的贡献大于后面的变量。
不错.但是可以引用一两个图在此比较好.
(2)多峰逻辑回归
ModelFittingInformation
Model
-2LogLikelihood
Chi-Square
df
Sig.
InterceptOnly
602.180
Final
508.592
93.588
36
.000
显著程度为0,说明无效假设不成立,样本比较适合作多峰逻辑回归。
什么无效假设啊?
这里是测验所有自变量是否都为0.不是检验是否适合作多峰逻辑回归问题.
Goodness-of-Fit
Chi-Square
df
Sig.
Pearson
293.446
276
.225
Deviance
302.541
276
.131
同样,表中的显著度都远远大于0.05,说明模型的适合度很好。
说明观察频率和模型预测频率无显著差异.
LikelihoodRatioTests
Effect
-2LogLikelihoodofReducedModel
Chi-Square
df
Sig.
Intercept
508.592(a)
.000
0
.
b6
517.092
8.500
2
.014
inc
558.305
49.713
18
.000
b4
546.425
37.833
16
.002
Thechi-squarestatisticisthedifferencein-2log-likelihoodsbetweenthefinalmodelandareducedmodel.Thereducedmodelisformedbyomittinganeffectfromthefinalmodel.Thenullhypothesisisthatallparametersofthateffectare0.
aThisreducedmodelisequivalenttothefinalmodelbecauseomittingtheeffectdoesnotincreasethedegreesoffreedom.
上表说明b6(文化程度)、inc(可支配收入)、b4(家庭收入),这三个变量都比较显著,对模型的贡献明显。
Classification
Observed
Predicted
1
2
3
PercentCorrect
1
126
49
24
63.3%
2
66
83
14
50.9%
3
69
25
40
29.9%
OverallPercentage
52.6%
31.7%
15.7%
50.2%
从表中看出,对第一类消费者(时尚理性型)的预测准确度最高,达到63.3%;对第三类(购物冷感型)的预测准确度稍差,只有29.2%。
但是总的准确度为50.2%,还比较能令人满意。
用第三类做标准,第一类和第二类消费者的参数估计表如下:
ParameterEstimates
TwoStepClusterNumber(a)
B
Std.Error
Wald
df
Sig.
Exp(B)
95%ConfidenceIntervalforExp(B)
LowerBound
UpperBound
1
Intercept
-1.702
.676
6.338
1
.012
b6
.287
.113
6.417
1
.011
1.333
1.067
1.665
[inc=1]
.062
1.043
.004
1
.952
1.064
.138
8.218
[inc=2]
-.612
.899
.464
1
.496
.542
.093
3.156
[inc=3]
-.722
.935
.596
1
.440
.486
.078
3.035
[inc=4]
.430
.853
.254
1
.614
1.537
.289
8.171
[inc=5]
-.177
.821
.047
1
.829
.838
.168
4.184
[inc=6]
.531
.808
.432
1
.511
1.701
.349
8.291
[inc=7]
-.212
.745
.081
1
.776
.809
.188
3.483
[inc=8]
-.524
.764
.470
1
.493
.592
.133
2.646
[inc=9]
-.067
.649
.011
1
.917
.935
.262
3.336
[inc=10]
0(b)
.
.
0
.
.
.
.
[b4=1]
.774
1.326
.340
1
.560
2.167
.161
29.169
[b4=2]
-.620
1.420
.191
1
.662
.538
.033
8.700
[b4=3]
1.468
.907
2.616
1
.106
4.338
.733
25.682
[b4=4]
1.079
.829
1.694
1
.193
2.943
.579
14.956
[b4=5]
1.239
.794
2.439
1
.118
3.453
.729
16.357
[b4=6]
.940
.775
1.470
1
.225
2.559
.560
11.696
[b4=7]
1.081
.740
2.134
1
.144
2.947
.691
12.566
[b4=8]
.548
.608
.813
1
.367
1.730
.525
5.697
[b4=9]
0(b)
.
.
0
.
.
.
.
2
Intercept
-2.681
.805
11.103
1
.001
b6
.307
.119
6.646
1
.010
1.360
1.076
1.717
[inc=1]
3.921
1.206
10.576
1
.001
50.447
4.748
535.939
[inc=2]
2.787
1.060
6.910
1
.009
16.237
2.032
129.752
[inc=3]
3.181
1.068
8.866
1
.003
24.066
2.965
195.314
[inc=4]
2.907
1.035
7.885
1
.005
18.307
2.406
139.283
[inc=5]
2.241
1.002
5.004
1
.025
9.407
1.320
67.051
[inc=6]
2.288
.999
5.246
1
.022
9.855
1.391
69.809
[inc=7]
1.257
.932
1.819
1
.177
3.513
.566
21.819
[inc=8]
.194
1.021
.036
1
.849
1.214
.164
8.980
[inc=9]
.410
.889
.213
1
.645
1.506
.264
8.597
[inc=10]
0(b)
.
.
0
.
.
.
.
[b4=1]
-1.485
1.401
1.123
1
.289
.227
.015
3.528
[b4=2]
-3.466
1.499
5.346
1
.021
.031
.002
.590
[b4=3]
-2.025
1.066
3.610
1
.057
.132
.016
1.066
[b4=4]
-1.385
.944
2.151
1
.142
.250
.039
1.593
[b4=5]
-.177
.903
.038
1
.844
.838
.143
4.913
[b4=6]
-.017
.882
.000
1
.984
.983
.175
5.535
[b4=7]
-.036
.860
.002
1
.967
.965
.179
5.207
[b4=8]
-.301
.781
.149
1
.700
.740
.160
3.422
[b4=9]
0(b)
.
.
0
.
.
.
.
a.Thereferencecategoryis:
3.
b.Thisparameterissettozerobecauseitisredundant.
参数估计值表示自变量的某一类别和其参考组相比可以使得因变量某一类别出现的概率大于该因变量参考组的概率。
在这里,参考组为第三类消费者(购物冷感型),从实际研究的角度,该参数就表示杭州数据中消费者属于第一类/第二类的概率大于消费者属于第三类的概率。
这些解释都是正确的!
虽然变量中有的水平不显著,但是intercept的值都是显著的,说明,变量(家庭收入,可支配收入,文化程度)能区分消费者类型(某一类相对于参考组)的程度大于临界水平。
你这里所用的自变量类别比较多,此时可以把它们当成连续变量处理.上表中每个类别效应几乎都不显著,仅仅是截距显著,那个意义不大,所以可以跑另外一个模型试试看.
5.总结
通过对杭州数据的分析发现,根据消费者对购物的看法和态度(A1)两表中选取的10个变量对样本进行两步骤聚类,将消费者分为:
时尚理性型、虚荣敏感型和购物冷感型三类。
然后,选取家庭收入、可支配收入和文化程度三个变量,对样本消费者的类型进行多峰逻辑回归。
最后,结果显示,模型可以准确预测50.2%的消费者的类型。
好格式!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 分析 作业