SPSS综合练习1答案doc.docx
- 文档编号:14433387
- 上传时间:2023-04-23
- 格式:DOCX
- 页数:23
- 大小:428.99KB
SPSS综合练习1答案doc.docx
《SPSS综合练习1答案doc.docx》由会员分享,可在线阅读,更多相关《SPSS综合练习1答案doc.docx(23页珍藏版)》请在冰豆网上搜索。
SPSS综合练习1答案doc
SPSS综合练习1
数据:
CCSS.sav内容:
一、数据处理和描述
1•请报告样本中来自上海的有多少人,占的比例(有效样本)是多少?
家庭月收入30000以上的样本有多少,占整个样本的比例是多少?
答案:
来自上海的387人,占有效样本的33.7%;家庭月收入30000以上的样本31人,占整个样本的2.7%。
也可以用部分样本选择的方法再做频率分析。
so.城市
Frequency
Percent
ValidPercent
Cumulative
Percent
Valid100北京
378
33.0
33.0
33.0
200上海
387
33.7
33.7
66.7
300广州
382
33.3
33.3
100.0
Total
1147
100.0
100.0
S9.家庭月收入
Frequency
Percent
ValidPercent
Cumulative
Percent
Valid999元或以下
26
2.3
2.6
2.6
1000-1499元
30
2.6
3.0
5.6
1500-1999元
54
4.7
5.4
11.1
2000-2999元
116
10.1
11.7
22.8
3000-3999元
111
9.7
11.2
34.0
4000-4999元
119
10.4
12.0
46.0
5000-5999元
127
11.1
12.8
58.8
6000-7999元
106
9.2
10.7
69.5
8000-9999元
84
7.3
8.5
77.9
10000-14999元
124
10.8
12.5
90.4
15000-19999元
41
3.6
4.1
94.6
20000-29999元
23
2.0
2.3
96.9
30000以上
31
2.7
3.1
100.0
Total
992
86.5
100.0
Missing99拒绝回答
155
13.5
Total
1147
100.0
2.请对样本进行排序:
总指数从高到低排序,遇到相同的值时按照现状指数从低到高排序,如果以上两个变量取值相同,则根据年龄从小到大排序。
将最终结果的前10名ID号依次写出来。
答案:
在排序个案选项中依次放入总指数、现状指数、年龄,分别点击各个变量设置排序方式。
之后从原始数据中查看前10个ID号。
3.在原变量原始数据上对a8题的取值进行反向修改得分,1改为5,2改为4,4改为2,5改为1,3不改或改为3。
原数据缺失值9不变。
答案:
进行“重新编码为相同变量”,将窗的旧值1、2、3、4、5分别改为5^4、3、2、1o
4.如果预期指数减去现状指数的差值等于“失落指数”,请给每个样本计算它们的“失落指数”,并保存数据到原始数据中。
答案:
在转换的“计算变量”中,输入新变量名“失落指数”,公式框中列入“预期指数■现状指数”。
5.计算a8a9al0三个变量的平均值,用“平均指数”命名保存在原始数据中。
答案:
在转换的“计算变量”中,输入新变量名“平均指数”,公式框中输入
“(A8+A9+A10)/3”。
6.样本中,来自北京的男性的未婚人士有多少人,占北京男性群体的百分比是多少?
学历为本科的女性公务员有多少人,占女性公务员群体的比例是多少?
答案:
在描述统计的交义表中,性别放入行,婚姻状况放入列,“单元格”中设置行百分比。
S2.性别*S7.婚姻状况*S0.城市Crosstabulation
so.城市
S7.婚姻状况
Total
已婚
未婚
离异/分居/丧偶
100北京S2.性别男Count
%withinS2.性别
115
61.2%
70
37.2%
3
1.6%
188
100.0%
女Count
%withinS2.性别
136
71.6%
52
27.4%
2
1.1%
190
100.0%
TotalCount
%withinS2.性别
251
66.4%
122
32.3%
5
1.3%
378
100.0%
上表显示,北京男性未婚人士有70人,占北京男性群体的37.2%(70除以188)。
S2•性别火S4.学历xS5.职业Crosstabulation
S5•职业
S4•学历
Total
初中饮校或以下
高中仲专
大专
本科
硕士或以上
企厚业管理人员S2•性别男Count
%withinS2.性别
6
5.2%
16
13.9%
33
287%
49
42.6%
11
9.6%
115
100.0%
女Count
%withinS2.性别
3
4.8%
7
11.3%
21
33.9%
25
40.3%
6
9.7%
62
100.0%
TotalCount
%withinS2.性别
9
5.1%
23
13.0%
54
30.5%
74
41.8%
17
9.6%
177
100.0%
工人/体力工作者(蓝领)S2.性别男Count
%withinS2.性别
12
24.0%
23
46.0%
14
28.0%
1
2.0%
50
100.0%
女Count
%withinS2.性别
9
29.0%
15
48.4%
5
16.1%
2
6.5%
31
100.0%
TotalCount
%withinS2j性别
21
25.9%
38
46.9%
19
23.5%
3
3.7%
81
100.0%
公司普通职员(白领)S2•性别男Count
%withinS2-性另i]
12
6.5%
54
29.0%
65
34.9%
45
24.2%
10
5.4%
186
100.0%
女Count
%withinS2j性另i]
20
12.3%
38
23.3%
50
30.7%
49
30.1%
6
3.7%
163
100.0%
TotalCount
%withinS2•性别
32
9.2%
92
26.4%
115
33.0%
94
26.9%
16
4.6%
349
100.0%
国家公务员S2•性别胃Count
%withinS2•性别
2
9.5%
9
42.9%
9
42.9%
1
4.8%
21
100.0%
女Count
%withinS2•性别
1
8.3%
0
.0%
10
83.3%
1
8.3%
12
100.0%
TotalCount
3
9
19
2
33
学历为本科的女性公务员共有10人,占女性公务员群体的83.3%(10除以12)o
7.请报告失落指数的平均值、标准差、中位数、众数和极差,平均指数的偏度、峰度以及百分位数90所对应的数据点。
答案:
失落指数的平均值为-5.1629(可以只取两个小数位-5.17),标准差
为28.86672,中位数为-3.2861,众数未&82,极差(即范围或全距)为224.50。
Statistics
失落指数
N
Valid
1147
Missing
0
Mean
-5.1629
Median
-3.2861
Mode
8.82
Std.Deviation
28.86672
Range
224.50
平均指数
Statistics
NValid
Missing
Skewness
Std.ErrorofSkewness
Kurtosis
Std.ErrorofKurtosis
Percentiles90
1147
0
1.161
.072
.829
.144
6.3333
平均指数的偏度为1.161,峰度为0.829,百分位数90所对应的数据点为6.33。
8.请报告总指数5%的截尾平均值,极端值所对应的取值范围和频数。
答案:
在描述统计的探索中,放入总指数进行分析。
得到的5%的修正均值96.2627即为5%的截尾均值。
通过茎叶图两端的极端值报告可以获得极端值信息。
总指数
总指数Stem_and_LeafPlot
FrequencyStem&Leaf
29.00Extremes(=<47)
19.005・444444444
・005・
38.006・2222222222222222222
13.0014・000000
12.00Extremes(>=148)
Stemwidth:
10.00
Eachleaf:
2case(s)
如上图,总指数的极小值所对应的取值范围是小于等于47,频数为29•同理,极大值对应的取值范围为大于等于148,频数为12。
9•做岀三个城市的总指数条形图。
作图
10.通过直方图查看总指数是否服从正态分布。
总指数
直观来看,总指数非常接近于标准正态分布。
[其他:
数据录入,数据的横向合并,纵向合并,拆分文件等]
二、均值比较
1•请比较北京和上海的现状指数是否存在显著性差异?
两者的平均值和标准差分别是多少?
两者的方差是否相等?
均值比较的t值和P值分别是多少,最后具体的结论是什么?
答案:
以下报告两者的均值和标准差。
GroupStatistics
so.城市
N
Mean
Std.Deviation
Std.ErrorMean
现状指数100北京
378
100.3796
26.65823
1.37115
200±海
387
98.1589
29.42873
1.49595
IndependentSamplesTest
Levene*sTestforEqualityof
Variances
t-testforEqualityofMeans
F
Sig.
t
df
Sig.(2-tailed)
MeanDifference
Std.ErrorDifferenee
现状指数Equalvariances
assumed
1.627
202
1.093
763
.275
2.22067
2.03162
Equalvariancesnotassumed
1.094
758.721
.274
2.22067
2.02926
两者的方差相等,因为方差齐性检验的p=0.202>0.05,因此两者的方差不存在显著性差异。
两者均值比较的t值为1.093,p=0.275>0.05,因此结论是:
北京和上海的现状指数不存在显著性差异。
2.请比较上海和广州的失落指数是否存在显著性差异?
两者的平均值和标准差分别是多少?
两者的方差是否相等?
均值比较的t值和p值分别是多少,最后具体的结论是什么?
方法同上:
以下报告两者均值和标准差。
GroupStatistics
so.城市
N
Mean
Std.Deviation
Std.ErrorMean
失落指数200上海
387
-5.4002
29.57851
1.50356
300广州
382
-5.7533
28.18504
1.44207
两者的方差齐性检验p=0.429>0.05,因此两者的方差齐性(即相等)。
两个城市的均值比较t值和p值分别为匸0.169,p=0.865>0.05,所以两者的均值不存在显著性差异。
3.上海的总指数与全国的总指数平均值98分是否存在显著性差异?
具体的结论是?
答案:
选择上海的样本,之后进行单样本t检验。
One・SampleTest
TestValue=98
t
df
Sig.(2-tailed)
MeanDifferenee
95%ConfidenceIntervalofthe
Differenee
Lower
Upper
总指数
-3.004
386
.003
-3.32338
-5.4987
-1.1481
P=0.003v0.05,因此上海的总指数均值(94.68)与98分存在统计学上的显著性差异,表现为上海的总指数显著低于98分。
注意及时把选择的上海样本恢复为总体。
4.现状指数和预期指数分别是人们在一季度和四季度对经济发展的判断,请问这两个指数是否存在显著性差异?
具体的结论是?
答案:
对现状指数和预期指数进行配对样本t检验。
PairedSamplesTest
PairedDifferences
t
df
Sig.(2-tailed)
Mean
Std.Deviation
Std.ErrorMean
95%ConfidenceIntervaloftheDifference
Lower
Upper
Pair1现状指数-预期指数
5.16291
28.86672
・85235
3.49057
6.83524
6.057
1146
.000
两者的均值比较匸6.057,p<0.001(小于0.05),因而结论为:
两者存在显著性差异,表现为现状指数显著高于预期指数。
5.不同城市的总指数是否存在显著性差异?
理由是什么?
写出具体的F和p值。
各组的方差是否相等?
如果存在显著性差异,哪些城市之间的总指数具有显著性差异?
各个城市的总指数的平均值和标准差分别是多少。
答案:
以总指数为因变量,城市为因子,进行单因素方差分析,设置描述性统计和方差齐性检验。
(1)以下报告的是各个城市的总指数均值和标准差。
Descriptives
总指数
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
Maxirr
LowerBound
UpperBound
100北京
378
97.5920
18.74116
.96394
95.6967
99.4874
39.05
W
200上海
387
94.6766
21.76502
1.10638
92.5013
96.8519
.00
15
300广州
382
95.4456
22.22750
1.13726
93.2095
97.6816
15.62
Total
1147
95.8935
20.99710
.61998
94.6771
97.1099
.00
15
(2)以下是组间差异的方差分析表。
ANOVA
总指数
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
WithinGroups
Total
1740.266
503506.032
505246.298
2
1144
1146
870.133
440.128
1.977
.139
"1.877,p=0.139>0.05,因此,不同城市之间的总指数均值不存在显著性差异。
因此,不需要往后做事后组间两两均值比较。
(3)以下是各组方差齐性检验(注意与均值比较区别)。
TestofHomogeneityofVariances
总指数
LeveneStatistic
df1
df2
Sig.
2.528
2
1144
.080
上表显示,方差齐性检验的p=0.080>0.05o因此各个城市总指数的方差相等,或不存在显著性差异。
6.不同婚姻状况的预期指数是否存在显著性差异?
理由是什么?
写出具体的F和p值。
各组的方差是否相等?
如果存在显著性差异,哪些婚姻状况之间的预期指数具有显著性差异,哪些没有?
各种婚姻状况的预期指数平均值和标准差分别是多少?
方法同上:
(1)以下未各种婚姻状况预期指数的平均值和标准差
Descriptives
预期指数
N
Mean
Std.Deviation
Std.Error
95%ConfidenceIntervalforMean
Minimum
LowerBound
UpperBound
已婚
790
93.1789
23.19174
.82513
91.5592
94.7986
.00
未婚
343
96.3981
22.45563
1.21249
94.0132
98.7830
12.11
离异/分居/丧偶
14
86.4795
30.72339
8.21117
68.7403
104.2186
24.21
Total
1147
94.0598
23.11645
.68256
92.7206
95.3990
.00
(2)组间均值差异的检验。
ANOVA
预期指数
SumofSquares
df
MeanSquare
F
Sig.
BetweenGroups
WithinGroups
Total
3292.958
609095.536
612388.494
2
1144
1146
1646.479
532.426
3.092
.046
上表显示,F二3.092,p二0.046V0.05,因此不同婚姻状况之间的预期指数存在显著性差异。
(3)各组方差是否相等的检验。
TestofHomogeneityofVariances
预期指数
LeveneStatistic
df1
df2
Sig.
1.241
2
1144
.289
上表显示,方差齐性检验的p=0.289>0.05,因此各组方差相等。
(4)两两比较
由于
(2)发现不同婚姻状况总体上存在显著性差异,因而需要具体的组间差异,即事后两两比较。
由于(4)显示方差齐性,因而事后两两比较的方法需要选用“假定方差相等”方框下的各种方法,这里选用LSD法(如果方差不相等,贝I」选用“未假定方差相等”)。
One-WayANOVA:
PostHocMultipleComparisons•
rEqualVariancesAssumed
0LSD
jponfeironi
BSidak
□Scheffe
oR-E-G-WF
R-E-G-WQ
PostHocTests
MuKipleComparisons
预期指数
LSD
(I)S7.婚姻状况
(J)S7•娼姻状况
MeanDifference(I-J)
Std.Error
Sig.
95%ConfidenceInterval
LowerBound
UpperBound
已娼
未婚
-3.21924x
1.49205
.031
-6.1467
-.2918
离异/分居/丧偶
6.69942
6.22129
.282
-5.5070
18.9058
未娼
已婚
3.21924'
1.49205
.031
.2918
6.1467
离异/分居/丧偶
9.91866
6.29148
.115
-2.4255
22.2628
离异/分居/丧偶
已娼
-6.69942
6.22129
.282
-18.9058
5.5070
未婚
-9.91866
6.29148
.115
-22.2628
2.4255
「Themeandiffereneeissignificantatthe0.05level.
查看上表各组比较的p值(Sig.)发现:
已婚与未婚组的p=0.031<0.05,因此它们之间存在显著性差异,表现为未婚组的预期指数显著高于已婚族;已婚与离界/分居/丧偶组的p=0.282>0.05,未婚组与离界/分居/丧偶组的p二0.115>0.05,因而,离异/分居/丧偶组与已婚、未婚两者的差界都不存在显著性差界。
7.不同职业的总指数是否存在显著性差异?
理由是什么?
写出具体的F和p值。
如果存在显著性差异,哪些职业之间的总指数具有显著性差异?
答案:
方法同上。
具体答案略。
三、相关和回归分析
1•现状指数与预期指数之间是否存在相关?
应该用什么相关分析方法?
相关系数和显著性水平分别是多少?
根据统计结果,你最后下的结论是什么?
答案:
现状指数和预期指数均为连续变量,因此选用Pearson相关分析。
Correlations
现状指数
预期指数
现状指数PearsonCorrelation
1
.388八
Sig.(2-tailed)
.000
N
1147
1147
预期指数PearsonCorrelation
.388"
1
Sig.(2-tailed)
.000
N
1147
1147
**.Correlationissignificantatthe0.01level(2-tailed).
上表显示,两者的相关系数r=0.388,p<0.001,因此结论是:
两者存在显著正相关。
2.年龄有可能对上述两个变量产生共同影响,如果控制年龄的影响在分析现状指数和预期指数之间的关系,他们存在什么样的相关关系?
答案:
采用偏相关方法处理,控制变量为年龄。
Correlations
ControlVariables
现状指数
预期指数
S3.年龄现状指数Correlation
1.000
.367
Significance(2-tailed)
•
.000
df
0
1144
预期指数Correlation
.367
1.000
Significance(2-tailed)
.000
•
df
1144
0
具体报告内容与上题类似,相关系数r=0.367,p<0.001,因此,结论是:
控制年龄后,现状指数与预期指数依然存在显著正相关。
3.学历与现状指数存在相关么?
应该用什么相关分析方法?
通过统计结果,你最后下的结论是什么?
答案:
因为学历不是连续变量,而是顺序变量或等级变量,因此采用Spearman等级相关分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 综合 练习 答案 doc
![提示](https://static.bdocx.com/images/bang_tan.gif)