SPSS报告册重点讲义资料.docx
- 文档编号:26447481
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:46
- 大小:1.33MB
SPSS报告册重点讲义资料.docx
《SPSS报告册重点讲义资料.docx》由会员分享,可在线阅读,更多相关《SPSS报告册重点讲义资料.docx(46页珍藏版)》请在冰豆网上搜索。
SPSS报告册重点讲义资料
《SPSS统计软件应用》
报告册
2015-2016学年第1学期
班级:
学号:
姓名:
实验教师:
学时:
2周
1.实验一SPSS的数据管理
2.实验二描述性统计分析
3.实验三均值检验
4.实验四相关分析
5.实验五方差分析
6.实验六统计图
7.实验七因子分析
8.实验八聚类分析
9.实验九回归分析
10.实验十判别分析
11.实验十一非参数检验
实验一SPSS的数据管理
一、实验目的
1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;
2.掌握SPSS的数据管理功能。
二、实验内容及步骤:
1、定义spss数据结构。
下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。
练习:
创建数据文件的结构,即数据文件的变量和定义变量的属性。
表1大学教师基本情况调查表
问题
备选答案
1姓名
2性别
3年龄
4学历
5工作年月
6职称
7本年度教学工作量(课时)
4
(1)专科
(2)本科(3)硕士(4)博士(5)博士后
6
(1)助教
(2)讲师(3)副教授(4)教授
7
(1)0~120
(2)120~240(3)240~320(4)320~480(5)480以上
8本年度公开发表论文数
9本年度您的科研经费总额(万元)
10.您认为学校对科研人员每年的科研成果要求是否合理
(1)合理
(2)不合理(3)无所谓
11您最常用的全文期刊数据库的名称(多选,限选2个)
(1)cnki
(2)万方(3)SpringerLink(4)EBSCO
12您对学校科研管理部门的工作是否满意
(1)非常满意
(2)满意(3)一般(4)不满意
实验步骤:
(1)首先ssps统计分析软件,
(2)然后新建一个文件,点击左下角“变量视图”,
(3)然后依据所给表格创建字段,如“姓名”、“性别”等。
在输入每个名称字段时,
(4)对其类型和宽度等限制条件按要求分别限制指即可。
实验结果及分析:
实验结果如下图
最终建成了所要的表格。
2、高校提前录取名单的确定
某高校今年对部分考生采取单独出题、提前录取的招生模式。
现有20名来自国内不同省市的考生报考该校,7个录取名额。
见数据文件compute.sav.该校制定了如下录取原则:
(1)文化课成绩由数学、语文、英语和综合四门成绩组成。
文化课成绩制定最低录取分数线:
400分。
(2)个人档案中若有“不良记录”,不予录取。
(3)对西部考生和少数民族考生,给予加分优惠。
少数民族考生加20分,西部考生加10分。
(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。
(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。
练习:
利用spss软件,综合利用所学,给出成绩排名的操作步骤。
实验步骤:
(1)计算文化课总成绩:
打开数据文件compute.sav.变量计算:
点击“转换”——“计算变量”,定义变量总分,目标变量中的值设为“总分”,数字表达式设置“语文+数学+英语+综合”,单击“确定”按钮。
(2)筛选出400分以上并且没有不良记录的学生:
双击“不良记录”,在弹出的对话框中选择“如果条件满足则”单选按钮并单击if按钮,在弹出的对话框中,设置“不良记录=0&总分>=400”的判断条件,单击“继续”,最后单击“确定”。
(3)计算西部考生和少数名族加分项:
“转换”——>“计算”,选择“总分”。
if条件中设置“民族=2or民族=3or民族=4”,“数字表达式”中“总分”+20;If条件中设置“民族=5”“数字表达式中”设置总分+10
(4)点击“数据”——“排序个案”,将“总分”进行排序顺序为降序的排序。
最后所得的表格为结果。
最终,将未选定的字段删除后,得到了所选的学生字段。
实验结果及分析:
实验结果如下图:
实验二描述性统计分析
一、实验目的
利用SPSS进行描述性统计分析。
要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)。
二、实验内容:
1、打开数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。
给出操作步骤和分析结果。
实验步骤:
(1)首先,打开“分析”选项栏,然后,点击“报告”,
(2)选择个案汇总,将“年龄、身高、体重”字段放进变量组,将“班级”放进“分组变量”之中。
然后点确定。
(3)在统计量中选择“范围、最小值、最大值、平均值、标准差和方差”,点击“继续”。
最后点击“确定”即可。
实验结果及分析:
结果如图
有所得的结果可知,1班的年龄均值为14.2、最大值为15、最小值为13、标准差为0.873,以此类推。
所以得:
3班的平均年龄最大,1班的最小,而3班对应的体重值最大而且身高最高。
2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别
处理
愈合
未愈合
合计
呋喃硝胺
54
8
62
甲氰咪胍
44
20
64
合计
98
28
126
(提示:
由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量――行变量、列变量和指示每个格子中频数的变量,然后用WeightCases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。
假设三个变量分别名为R、C和W,则数据集结构和命令如下):
R
C
W
1.00
1.00
54.00
1.00
2.00
44.00
2.00
1.00
8.00
2.00
2.00
20.00
实验步骤:
(1)首先,输入如下的表格,完成后如图然后输入数值,进行一下操作:
(2)分析---描述统计---交叉表格,然后点Statistics(数据分析),
(3)在选项中勾选卡方、相关性、相关系数和伽玛,点确定后得出结果。
实验结果及分析:
得实验结果如下
由结果得,p=0.013,如果默认α=0.05时,所以拒绝原假设,呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,两种方法治疗效果有显著差别。
实验三均值检验
一、实验目的
学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。
二、实验内容:
1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。
公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。
共4台机器,每台机器抽取16支产品。
见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。
实验步骤:
(1)首先,点击数据,选择拆分文件,然后分组方式按及其编号。
(2)录入数据文件后,点击“分析”选项卡,选中“比较平均值”,选单侧检验,将置信区间设置为90%,确定后即可得出结果。
实验结果及分析:
由表2可得,四台机器生产的制动闸直径在90%显著性水平下,双尾显著性分别为0.597、0.00a、0.522和0.019,因为第一个和第三个大于0.5,不能拒绝原假设;而第二个和第四个小于0.5,所以拒绝原假设。
综上所述:
第一台和第三台所生产的产品没有显著差异而第二台和第四台机器生产的产品有显著差异。
2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。
数据如下:
男:
82.0080.0085.0085.0078.0087.0082.00
女:
75.0076.0080.0077.0080.0077.0073.00
比较在置信度为95%的情况下男女生得分是否有显著差别。
实验步骤:
(1)录入数据文件,
(2)点击“分析”选项卡,选中“比较平均值”,选独立检验,将得分作为变量,将性别作为分组变量,
(3)将置信区间设置为95%,确定后即可得出结果。
实验结果分析:
由上表可知,t统计量的观测值为3.829,对应的概率p值为0.002,即在95%的置信水平下拒绝原假设,所以男女生的乒乓球得分有显著差异。
3、某医疗结构针对具有家族心脏病史的病人研发了一种新药。
为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。
见数据文件ptest.sav.
实验步骤:
(1、录入数据文件后,点击“分析”选项卡,选中“比较平均值”,
(2、选配对检验,将得分作为变量,
(3、如下图设置,确定后即可得出结果。
实验结果及分析:
由结果可得,服药前后的甘油三脂的p值为0.249,大于0.05所以不能拒绝原假设,即服药前后甘油三酯的水平没有有显著性变化;同理,服药前后的体重的p值为0.00a小于0.05所以不能拒绝原假设服药前体重于服药后体重有显著差异。
实验四相关分析
一、实验目的
学习利用SPSS进行相关分析、偏相关分析、距离分析。
二、实验内容:
1、打开数据文件correlate1.sav,要求分析汽车价格(price)和汽车的燃油效率(mpg)之间是否存在线性关系。
实验步骤:
1、打开数据文件,点击分析——相关——双变量,
2、选择其中的Fullefficiency和Priceinthousands放入变量一栏,相关系数选pearson,
3、然后在标记显著性相关处打勾。
最后点击确定按钮即可。
实验结果及分析:
由计算结果可知,汽车价格的均值为27.339075、标准差为14.35163、燃油效率的均值为23.84、标准差为4.283。
通过相关性分析,汽车价格和汽车的燃油效率的相关系数为-0.492,由显著性p近似为零可知,当显著水平α为0.05或0.01时都应拒绝原假设,而表中相关系数的两个星号(**)即表示显著性水平α为0.01时可拒绝原假设。
又因为皮尔森相关系数为负数,综上所述,汽车价格与燃油效率反向影响。
2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。
选相似性测度。
进行结果解释。
实验步骤:
1、打开相应的数据文件,选择“分析”——“相关”——“距离”,
2、将“身高”、“体重”和“肺活量”放进变量栏,
3、计算距离选择个案间、测量选择相似性。
实验结果及分析:
通过实验分析可得,身高和体重的相关性为0.735,相关程度较高;身高和肺活量的相关性为0.581,中度相关;肺活量和体重的相关性系数为0.611,相关性为中度相关。
3、打开数据文件distance.sav,文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。
要求对10只叶片进行距离分析。
用Euclideandistance。
进行结果解释。
实验步骤:
(1)打开对应的数据文件,点击分析——相关——距离。
(2)将三次测量分别放进变量栏。
(3)计算距离选择变量间,测量选择相似性,然后点击确定即可。
实验结果及分析:
通过所得的结果可以分析出:
第十个叶片与第七个叶片欧几里得直线距离最大,为1.454,所以二者最不相似;
第六个叶片与第七个叶片欧几里得直线距离最小,为0.170,所以二者最为相似。
实验五、方差分析
一、实验目的
学习利用SPSS进行单因素方差分析、多因素方差分析和协方差分析。
二、实验内容
一位在一家大公司工作的心理学家做一项试验,以评价背景音乐对于秘书打字效率的影响。
他在众多的秘书中挑选了一个由七个人组成的随机样本。
给每个秘书放三种背景音乐:
无音乐、古典音乐和激烈的摇滚乐,然后对她们进行标准的打字测验,以测验她们的打字速度并在出现打字错误时给以惩罚。
对于每个参加试验的秘书,随机化指定放听音乐的顺序,其得分越高,表现越好,数据如下表,试问三种背景音乐对打字的得分有无影响?
(要求:
将表格的数据输入到SPSS统计软件中,命名为shiyan.sav文件,并进行方差分析)
实验步骤:
1、首先,定义变量,然后对应表格输入数据,如下图。
2、然后,点击分析——比较平均值——单因素,进入如图界面,因变量列表出3、选择音乐组别,因子处选择打字得分。
4、最后点击确定即可。
实验结果及分析:
上表是音乐类型对秘书打字得分的单因素方差分析的结果,可以看到,观测变量音乐组别的总离差平方和为14;F统计量的观测值=0.599,对应的概率p值为0.791,所以不能拒绝原假设,即认为不同音乐类型对秘书的打字得分没有显著影响。
实验六、统计图
一、实验目的
学会利用SPSS绘制各种统计图形
二、实验内容
1、下面的表分别表示某企业1991年-1995年5年中各季度计划完成和实际完成的产量(单位:
万吨)数据资料,请画出5年内每季度实际数的线形图。
年份
一季度
二季度
三季度
四季度
计划数
实际数
计划数
实际数
计划数
实际数
计划数
实际数
1991
1992
1993
1994
1995
14
17
16
18
20
12.5
17.2
16.5
18.4
20.5
18
18
20
20
21
21.4
19.8
16.8
19.2
25.8
18
17
18
20
25
18.5
19.2
17.7
20.5
22.5
20
20
21
22
25
20.4
22.5
19.6
20.8
24.5
实验步骤:
(1)首先,定义变量,按要求建好表
(2)然后点击图形——旧对话框——折线图——多线线图——勾选个案摘要,确定
(3)如下图选择各组值。
实验分析:
得出的五年内每季度的实际数线图如上图所示,由上图可知,从1991年第一季度开始到1995第四季度,每年的第一季度实际数最小,年内实际数会有波折,一般第二季度上升第三季度下降再到第四季度上升。
2、某地20家企业的情况如下:
编号
部门
所有制类型
年产值(万元)
职工人数(人)
年工资总额(万元)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
工业
交通
商业
交通
工业
工业
邮电
商业
交通
工业
工业
交通
工业
工业
商业
邮电
工业
工业
商业
交通
国有
国有
集体
个体
集体
国有
国有
个体
个体
国有
集体
个体
国有
集体
股份制
国有
国有
股份制
国有
国有
2805.58
1265.40
256.50
26.88
560.00
800.50
2580.98
125.45
590.60
950.00
1556.00
950.00
335.00
2455.08
1780.58
2500.00
775.00
3305.00
498.08
965.58
1235
605
105
20
223
568
890
65
148
325
485
354
105
680
646
485
354
1015
202
246
812.63
435.60
68.58
14.00
156.07
256.74
854.40
65.16
130.24
268.13
394.20
257.90
82.43
639.20
471.25
486.98
272.58
912.00
139.20
159.95
请画出各部门年工资总额的直条构成线图。
实验步骤:
(1)首先,定义变量,分别将部门和年工资总额作为定义变量,然后输入数据,
(2)然后点击分析——质量控制——帕累托图——简单帕累托图,勾选个案组的计数或和,然后出现如上图的界面,条的特征勾选变量和,
(3)分别将年工资总和与部门如图所示添加。
最后点击确定即可。
实验结果分析:
由所得的图表可得,工业部门的年工资总额最高,占各部门年工资总额约50%,其次是邮电、交通,而商业所占比例最少,约15%。
实验七:
因子分析
一、实验目的:
运用因子分析方法分析数据
二、实验内容:
下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。
X1
X2
X3
X4
X5
X6
X7
3.76
8.59
6.22
7.57
9.03
5.51
3.27
8.74
9.64
9.73
8.59
7.12
4.69
5.51
1.66
5.90
9.84
8.39
4.94
7.23
9.46
9.55
4.94
8.21
9.41
3.66
4.99
6.
7.28
7.08
3.98
0.62
7.00
9.49
1.33
2.98
5.49
3.01
1.34
1.61
5.76
9.27
4.92
4.38
2.30
7.31
5.35
4.52
3.08
6.44
0.54
1.34
4.52
7.07
2.59
1.30
0.44
3.31
1.03
1.00
1.17
3.68
2.17
1.27
1.57
1.55
1.51
2.54
1.03
1.77
1.04
4.25
4.50
2.42
5.11
5.28
10.02
9.84
12.66
11.76
6.92
3.36
11.68
13.57
9.87
9.17
9.72
5.98
5.81
2.80
8.84
13.60
10.05
6.68
7.79
12.00
11.74
8.07
9.10
12.50
9.77
7.50
2.17
1.79
4.54
5.33
7.63
3.53
13.13
9.87
7.85
2.64
2.76
4.57
1.78
5.40
9.02
3.96
6.49
4.39
11.58
2.77
1.79
3.75
2.45
13.74
10.16
2.73
2.10
6.22
7.30
8.84
4.76
18.52
11.06
9.91
3.43
3.55
5.38
2.09
7.50
12.67
5.24
9.06
5.37
16.18
3.51
2.10
4.66
3.10
4.78
2.13
1.09
0.82
1.28
2.40
8.39
1.12
2.35
3.70
2.62
1.19
2.01
3.43
3.72
1.97
1.75
1.43
2.81
2.27
2.42
1.05
1.29
1.72
0.91
实验步骤:
(1)首先定义变量,按要求建好表格
(2)然后点击分析——降维——因子分析,然后在弹出的表格里面依次将X1——X7选择进入变量栏,
(3)在描述栏,统计量勾选单变量描述性、原始分析结果;相关性矩阵勾选系数和KMO
(4)抽取、旋转、得分、选项也类似勾选即可。
最后点击确定即可。
实验结果及分析:
实验结果如下图,
(1)表1是原有变量的相关系数矩阵,可以看到,有不少相关系数较高,但也有一些很低,各变量线性关系不是特别强,因此不适合做因子分析。
(2)由表2可知,Bartlett检验统计量的观测值为326.285,相应的概率p值接近0,所以应拒绝零假设,认为相关系数矩阵与单位阵有显著差异。
而KMO值为0.321,<0.5,所以认为,不适合做因子分析。
(3)表3是因子分析的初始解,显示了所有变量的共同数据,可以看到,X1—X7变量的绝大部分信息都大于78%,因此可被因子解释,变量的信息丢失较少,因此本次因子提取的总体效果较好。
(4)由表4可以看出,第一个因子的特征值为3.395,解释原有7个变量总方差的48%,第二个因子的特征值为2.806,解释原有7个变量总方差的40.090%,以此类推,因此原有变量的总方差均被解释掉。
而第一和第二个因子共解释了原有变量总方差的88.953%,信息丢失较少,因子分析效果较理想。
(5)由表5可以看出,X5、X6、X7这三个变量在第一个因子上有较高的载荷,其余的在第二个因子上有较高的载荷。
因此,第一个因子解释了X5、X6、X7这三个变量,第二个因子解释了其余的变量。
因子的含义较为清晰。
实验八:
聚类分析
一、实验目的:
运用聚类分析方法分析数据
二、实验内容:
29名儿童的血红蛋白(g/100ml)与微量元素(μg/100ml)测定结果如下表。
由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。
编号
N0.
钙
X1
镁
X2
铁
X3
锰
X4
铜
X5
血红蛋白
X6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
54.89
72.49
53.81
64.74
58.80
43.67
54.89
86.12
60.35
54.04
61.23
60.17
69.69
72.28
55.13
70.08
63.05
48.75
52.28
52.21
49.71
61.02
53.68
50.22
65.34
56.39
66.12
73.89
47.31
30.86
42.61
52.86
39.18
37.67
26.18
30.86
43.79
38.20
34.23
37.35
33.67
40.01
40.12
33.02
36.81
35.07
30.53
27.14
36.18
25.43
29.27
28.79
29.17
29.99
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 报告 重点 讲义 资料