SPSS期末大作业完整版演示教学.docx
- 文档编号:28293193
- 上传时间:2023-07-10
- 格式:DOCX
- 页数:63
- 大小:1.04MB
SPSS期末大作业完整版演示教学.docx
《SPSS期末大作业完整版演示教学.docx》由会员分享,可在线阅读,更多相关《SPSS期末大作业完整版演示教学.docx(63页珍藏版)》请在冰豆网上搜索。
SPSS期末大作业完整版演示教学
第1题:
基本统计分析1
分析:
本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。
其基本操作步骤如下:
数据→选择个案→随机个案样本→大约(A)80所有个案的%。
1、基本思路:
(1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。
此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。
分组后进行频数分析并绘制带正态曲线的直方图。
(2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。
操作步骤:
(1)数据分组:
【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。
在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。
存取款金额1
频率
百分比
有效百分比
累积百分比
有效
1.00
82
34.6
34.6
34.6
2.00
76
32.1
32.1
66.7
3.00
10
4.2
4.2
70.9
4.00
22
9.3
9.3
80.2
5.00
47
19.8
19.8
100.0
合计
237
100.0
100.0
(2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。
(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。
统计量
存(取)款金额
20岁以下
N
有效
1
缺失
0
百分位数
25
50.00
50
50.00
75
50.00
20~35岁
N
有效
131
缺失
0
百分位数
25
500.00
50
1000.00
75
5000.00
35~50岁
N
有效
73
缺失
0
百分位数
25
500.00
50
1000.00
75
4500.00
50岁以上
N
有效
32
缺失
0
百分位数
25
525.00
50
1000.00
75
2000.00
结果及结果描述:
频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。
统计量表格表明,年龄在20岁以下的人有1人,其存取款金额的四分位差是0(50-50)元,年龄在20~35岁之间的人有131人,其存取款金额的四分位差是4500(5000-500)元,年龄在35~50岁之间的人有73人,其存取款金额的四分位差是4000(4500-500)元,年龄在50岁以上的人有32人,其存取款金额的四分位差是1475(2000-525)元。
可见,20~35,35~50两个年龄段的离散程度比较大,其余两个年龄段的离散程度较小。
2、基本思路:
本问题涉及到两个变量户口和物价趋势,考虑两者之间的联系,因而需要用到交叉列联表。
该列联表的行变量为户口,列变量为物价趋势,需要在列联表中输出各种百分比、期望频数、剩余、标准剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对城镇和农村储户对物价趋势的态度是否一致进行分析。
操作步骤:
(1)【分析→描述统计→交叉表】,选择“户口”到【行】框中,选择“物价趋势”到【列】框中;并选中【显示复式条形图】
(2)单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框→继续;
(3)单击【统计量】,选中【卡方】框→继续;
结果及其结果分析:
户口*物价趋势交叉制表
物价趋势
合计
上升
稳定
下降
户口
城镇户口
计数
21
131
18
170
期望的计数
20.1
122.7
27.3
170.0
户口中的%
12.4%
77.1%
10.6%
100.0%
物价趋势中的%
75.0%
76.6%
47.4%
71.7%
总数的%
8.9%
55.3%
7.6%
71.7%
农村户口
计数
7
40
20
67
期望的计数
7.9
48.3
10.7
67.0
户口中的%
10.4%
59.7%
29.9%
100.0%
物价趋势中的%
25.0%
23.4%
52.6%
28.3%
总数的%
3.0%
16.9%
8.4%
28.3%
合计
计数
28
171
38
237
期望的计数
28.0
171.0
38.0
237.0
户口中的%
11.8%
72.2%
16.0%
100.0%
物价趋势中的%
100.0%
100.0%
100.0%
100.0%
总数的%
11.8%
72.2%
16.0%
100.0%
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
13.276a
2
.001
似然比
12.159
2
.002
线性和线性组合
7.750
1
.005
有效案例中的N
237
a.0单元格(0.0%)的期望计数少于5。
最小期望计数为7.92。
上面交叉列联表表明,
共有237名被访者,其中170名有城镇户口,67名是农村户口,占样本总数的71.7%,28.3%;认为物价趋势为上升、稳定、下降的人数分别为28、171、38,各占总数的11.8%,72.2%,16.0%。
对不同户口的人群进行分析:
城镇户口的人数总共有170人,对物价稳定趋势为上升、稳定、下降的比例分别为12.4%、77.1%、10.6%,认为物价趋势稳定的人数多于总比例,认为物价趋势下降的人数少于总比例;农村户口的总人数为67人,对物价稳定趋势为上升、稳定、下降的比例分别为10.4%、59.7%、29.9%,认为物价趋势稳定的人数少于总比例,认为物价趋势下降的人数多于总比例;
对物价趋势不同态度的人群分析:
认为物价上升的人数总共有28人,其中城镇户口和农村户口所占比例分别为75%,25%,有城镇户口的比例略高于总比例;认为物价稳定的人数总共有171人,其中城镇户口和农村户口所占比例分别为76.6%,23.4%,有城镇户口的比例略高于总比例;认为物价下降的人数总共有28人,其中城镇户口和农村户口所占比例分别为47.4%,52.6%,有城镇户口的比例明显低于总比例;
总体来说,不同户口的人群对物价趋势的态度存在一定的一致性。
从所得卡方检验结果来看,概率p值为0.001,小于显著性水平,因此拒绝原假设,认为行列变量具有较强的相关性。
3、对居民一次存款金额分别按照收入水平进行分类,得到均值、中位数、方差和偏度。
3、基本思路
本题中的分类变量为收入水平,因而需按照收入水平对数据进行拆分,然后分别计算一次存款金额的均值、中位数、方差和偏度。
操作步骤:
【数据→拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【中位数】、【方差】、【偏度】→继续→确定。
结果及其分析:
统计量
存(取)款金额
xīng(兴盛)fà(头发)zh?
ng(种子)huán(还书)300元以下
(22)虚心使人(进)步,骄傲使人落(后)。
N
弯弯的小河(月儿、小船)有趣的问题难忘的日子
长长的小路了不起的创举大大的脑袋黑灰色的身子有效
6、量词填空。
6、认真检查写好的句子,发现错别字及时改。
41
1、本册要求背诵的课文如下:
缺失
(10)孩子们(爱家乡),也(爱画自己美)丽的家乡。
(男)——(女)湿——(干)红——(绿)0
你是学生,我也是学生。
1、写自己想说的话,写想像中的事物,写出自己对周围事物的认识和感想。
均值
雨雨字头(雪霜零)冫两点水(次冷准)2043.17
10、用两个字组新字:
(如课本133页)
(晚)——(早)(笑)——哭(上)——(下)(去)——(来)宝盖头:
完、家、定中值
④高兴——高高兴兴大小——大大小小多少——多多少少
又说又笑又高又大又香又甜圆圆的足球圆圆的荷叶圆圆的脸蛋300.00
春天已经到了。
我已经写完作业了。
方差
3、反义词(括号里是学写过的字)30740437.195
偏度
4.066
偏度的标准误
.369
300~800元
N
有效
137
缺失
0
均值
4314.15
中值
1000.00
方差
134185788.508
偏度
6.490
偏度的标准误
.207
800~1500元
N
有效
46
缺失
0
均值
5687.67
中值
1750.00
方差
116385836.002
偏度
4.415
偏度的标准误
.350
1500元以上
N
有效
13
缺失
0
均值
11026.92
中值
7000.00
方差
197942756.410
偏度
2.193
偏度的标准误
.616
第2题:
基本统计分析2
用随机抽样中的近似抽样方法选取85%的样本,数据→选择个案→随机样本→大约(A)85所有个案的%。
第一问
基本思路:
由于存款金额是定距型变量,考虑先进行数据分组再编制频数分布表。
进行数据拆分,分别计算“300以下”、“300-800”、“800-1500”、“1500以上”收入的四分位数,并通过四分位数比较上述四者分布上的差异。
操作步骤:
【转换→重新编码为不同变量(R)】;选择“存款金额”到【数字变量→输出变量(V)】框中;在【名称(N)】中输入“存款金额分组”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。
存款金额分组
频率
百分比
有效百分比
累积百分比
有效
1.00
85
34.3
34.3
34.3
2.00
77
31.0
31.0
65.3
3.00
16
6.5
6.5
71.8
4.00
25
10.1
10.1
81.9
5.00
45
18.1
18.1
100.0
合计
248
100.0
100.0
【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。
【数据→拆分文件】,选择“收入水平”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。
统计量
存(取)款金额
300元以下
N
有效
43
缺失
0
百分位数
25
200.00
50
300.00
75
1000.00
300~800元
N
有效
148
缺失
0
百分位数
25
500.00
50
1000.00
75
4475.00
800~1500元
N
有效
41
缺失
0
百分位数
25
710.00
50
2000.00
75
6000.00
1500元以上
N
有效
16
缺失
0
百分位数
25
3000.00
50
4450.00
75
9750.00
第二问
基本思路:
该问题中设计到两个变量,应采用交叉分组下的频数分析,行变量为“年龄”,列变量为“未来收入状况的变化趋势”,在列联表中输出观测频数、期望频数、各种百分比,显示各交叉分组下频数分布柱形图,并利用卡方检验,针对各年龄段对“未来收入状况的变化趋势”的态度是否一致进行分析。
操作步骤:
【分析→描述统计→交叉表】,选择“年龄”到【行】框中,选择“未来收入情况”到【列】框中;
单击【单元格】按钮,选中【观测值】、【期望值】、【行】、【列】、【总计】各框→继续;
单击【统计量】,选中【卡方】框→继续;
选中【显示复式条形图】→确定。
年龄*未来收入情况交叉制表
未来收入情况
合计
增加
基本不变
减少
年龄
20岁以下
计数
0
2
1
3
期望的计数
.7
1.8
.5
3.0
年龄中的%
0.0%
66.7%
33.3%
100.0%
未来收入情况中的%
0.0%
1.3%
2.4%
1.2%
总数的%
0.0%
0.8%
0.4%
1.2%
20~35岁
计数
35
65
27
127
期望的计数
28.2
77.3
21.5
127.0
年龄中的%
27.6%
51.2%
21.3%
100.0%
未来收入情况中的%
63.6%
43.0%
64.3%
51.2%
总数的%
14.1%
26.2%
10.9%
51.2%
35~50岁
计数
16
55
10
81
期望的计数
18.0
49.3
13.7
81.0
年龄中的%
19.8%
67.9%
12.3%
100.0%
未来收入情况中的%
29.1%
36.4%
23.8%
32.7%
总数的%
6.5%
22.2%
4.0%
32.7%
50岁以上
计数
4
29
4
37
期望的计数
8.2
22.5
6.3
37.0
年龄中的%
10.8%
78.4%
10.8%
100.0%
未来收入情况中的%
7.3%
19.2%
9.5%
14.9%
总数的%
1.6%
11.7%
1.6%
14.9%
合计
计数
55
151
42
248
期望的计数
55.0
151.0
42.0
248.0
年龄中的%
22.2%
60.9%
16.9%
100.0%
未来收入情况中的%
100.0%
100.0%
100.0%
100.0%
总数的%
22.2%
60.9%
16.9%
100.0%
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
12.895a
6
.045
似然比
13.905
6
.031
线性和线性组合
.017
1
.895
有效案例中的N
248
a.3单元格(25.0%)的期望计数少于5。
最小期望计数为.51。
第三问
基本思路:
首先按照户口对数据进行拆分,然后计算存款金额的统计量:
均值、四分位数和标准差。
操作步骤:
【数据→拆分文件】,选择“户口”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选中【均值】、【四分位数】、【标准差】→继续→确定。
统计量
存(取)款金额
城镇户口
N
有效
178
缺失
0
均值
4476.84
标准差
8813.369
百分位数
25
500.00
50
1000.00
75
5000.00
农村户口
N
有效
70
缺失
0
均值
2856.47
标准差
8317.295
百分位数
25
300.00
50
775.00
75
2000.00
第3题:
基本统计分析3利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
1.分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
2.分析不同年龄的储户对什么合算的认同是否一致。
3.检验城镇储户的一次存款金额的均值为5000元,是否可信?
利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标:
基本思路:
首先通过随机抽样中的近似抽样方式,对居民储蓄调查数据进行抽样。
操作步骤:
选择菜单→数据→选择个案→随机个案样本,样本尺寸填大约所有个案85%
•
分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较;
基本思路:
(1)由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。
(2)进行数据拆分,并分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。
操作步骤:
转换→重新编码为不同变量→选择存(取)款金额,输出变量名称填存款金额分组,单击旧值和新值,对数据进行分组,分为0-500、501-2000、2001-3500、3501-5000、5000以上五个组。
最后点击确定。
再分析→描述统计→频率→变量:
存款金额分组,图表选择直方图,选择显示正态曲线。
步骤:
数据→拆分文件→分组方式:
户口→确定。
分析→描述统计→频率→统计量→四分位数前打勾→确定。
存款金额分组
频率
百分比
有效百分比
累积百分比
有效
1.00
87
35.4
35.4
35.4
2.00
76
30.9
30.9
66.3
3.00
14
5.7
5.7
72.0
4.00
20
8.1
8.1
80.1
5.00
49
19.9
19.9
100.0
合计
246
100.0
100.0
统计量
存款金额分组
城镇户口
N
有效
177
缺失
0
百分位数
25
2.0000
50
3.0000
75
5.0000
农村户口
N
有效
69
缺失
0
百分位数
25
1.5000
50
3.0000
75
3.0000
存款在500以下所占百分比最大,有35.4%,其次是500-1000的人数。
而存款在5000以上的也有19.9%,说明存款数额悬殊较大。
从输出图表中看出城镇储户较农村储户有两倍之多,可能是因为城镇居民比较富裕而且存款意识比较强。
农村户口的居民可能更愿意把钱藏在家里而不是拿到银行去存。
分析不同年龄的储户对什么合算的认同是否一致。
基本思路:
该问题列联表的行变量为年龄,列变量为什么合算,在列联表中输出各种百分比、期望频数、剩余、标准化剩余,显示各交叉分组下频数分布柱形图,并利用卡方检验方法,对不同年龄的储户对什么合算的认同是否一致进行分析.
操作步骤:
分析→描述统计→交叉表,显示复式条形图前打勾,行选择年龄,列选择什么合算,统计量选择卡方,点击单元格,在观察值、期望值、行、列、总计、四舍五入单元格计数前打勾,最后确认。
卡方检验
值
df
渐进Sig.(双侧)
Pearson卡方
3.997a
3
.262
似然比
3.986
3
.263
线性和线性组合
3.337
1
.068
有效案例中的N
246
a.2单元格(25.0%)的期望计数少于5。
最小期望计数为.77。
分析:
因为卡方值小于0.05拒绝原假设,认为行列变量之间相关,年龄对什么合算的认同有影响,说明不同年龄的储户对什么合算的认同不一致.
3.检验城镇储户的一次存款金额的均值为5000元,是否可信?
单个样本统计量
户口
N
均值
标准差
均值的标准误
城镇户口
存(取)款金额
177
4871.11
9643.647
724.861
农村户口
存(取)款金额
69
4517.45
14528.340
1749.007
单个样本检验
户口
检验值=5000
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
城镇户口
存(取)款金额
-.178
176
.859
-128.887
-1559.42
1301.65
农村户口
存(取)款金额
-.276
68
.783
-482.551
-3972.64
3007.54
由上表可知,城镇储户的一次存款金额的均值为5000元,不可信.
第4题:
方差分析Ⅰ
解题思路
问题
(2)是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。
建立原假设为:
不同浓度没有对收率产生显著影响,对原假设进行检验。
问题(3)首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。
建立原假设为:
H01不同浓度没有对收率产生显著影响;H02不同温度没有对收率产生显著影响;H03浓度和温度对化工厂的收率没有产生显著性的交互影响。
操作步骤
问题
(2):
选择菜单【分析→比较均值→单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,则SPSS会将结果显示到输出窗口中。
问题(3):
选择菜单【分析→一般线性模型→单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,则SPSS会将结果显示到输出窗口。
输出结果解释与结论
问题
(1):
问题
(2):
单因素方差分析
收率
平方和
df
均方
F
显著性
组间
39.083
2
19.542
5.074
.016
组内
80.875
21
3.851
总数
119.958
23
单因素方差分析结果解释:
可以看到观测变量收率的总离差平方和为119.958,如果仅考虑浓度单个因素的影响,则收率总变差中,浓度可解释的变差为39.083,抽样误差引起的变差为80.875,他们的方差分别为19.542和3.851,相除所得的F统计量的观测值为5.074,对应的概率p值近似为0.016。
由于显著性水平α=0.05,概率p值小于显著性水平,则应拒绝原假设,认为不同浓度对收率产生了显著影响。
问题(3):
主体间效应的检验
因变量:
收率
源
III型平方和
df
均方
F
Sig.
校正模型
70.458a
11
6.405
1.553
.230
截距
2667.042
1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 期末 作业 完整版 演示 教学