SPSS数据分析报告.docx
- 文档编号:10439348
- 上传时间:2023-02-11
- 格式:DOCX
- 页数:13
- 大小:156.48KB
SPSS数据分析报告.docx
《SPSS数据分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS数据分析报告.docx(13页珍藏版)》请在冰豆网上搜索。
SPSS数据分析报告
SPSS数据分析报告
一、数据来源
笔者向自己的导师要了一份2014学习风格的统计数据,本问卷利用了心理学著名的LASSI量表进行编制,维度为态度、动机、时间管理、焦虑、专心、信息加工、选择要点、学习辅助、自我测试以及考试策略,共有80个问题。
对北京某大学2014级38位教育技术专业学生进行的学习风格问卷调查。
笔者对该问卷进行了梳理和分析,分析包括变量分析、信度分析、集中量的分析、差异量的分析以及相关量的分析。
二、问卷和原始数据
1、问卷
2、原始数据
三、数据分析
1、数据分类
①姓名、出生年月、专业、年级和学校是常量。
②性别是称名变量。
③学号是等级变量。
④剩余按维度划分的题目都是等距变量,这种测量数据可以进行分类、排序以及加减。
性别和学号是品质数据需要用非参数方法进行检验。
LASSI量表的维度是态度、动机、时间管理、焦虑、专心、信息加工、选择要点、学习辅助、自我测试以及考试策略分别用李克特五记分法1、2、3、4、5代表了“完全不一致”“基本不一致”“一半不一致”“相当一致”“完全一致”。
2、初步分析
(1)首先对38位学生进行男女比例分析,得出的饼图如下:
由上表可知男生占有76%,女生占有24%,男女的差异可能会对样本总体的学习风格测试有一定的影响。
(2)对问卷进行问卷信度分析,其结果如下
可靠性统计量
Cronbach'sAlpha
基于标准化项的CronbachsAlpha
项数
.759
.752
80
由上图得知,问卷的信度克朗巴哈α系数为0.759,属于0.7-0.8之间,可信度较好。
3、集中量的统计
统计量
var1
var2
var3
var4
var5
var6
var7
var8
var9
var10
N
有效
37
37
37
37
37
37
37
37
37
37
缺失
16
16
16
16
16
16
16
16
16
16
均值
3.76
2.30
3.57
2.78
2.59
3.57
3.19
2.16
2.70
2.14
中值
4.00
2.00
3.00
3.00
3.00
3.00
3.00
2.00
3.00
2.00
众数
4
2
3
3
3
3
3
2
2a
2
a.存在多个众数。
显示最小值
由上表可知,在10个问题中,均值处于2~3之间,表明大多数学生在第一维度的观点不一致。
第一维度中值、众数都为3,说明数据的集中程度比较高。
在后续的检验中准确率随之也高。
性别
频率
百分比
有效百分比
累积百分比
有效
16
30.2
30.2
30.2
1
28
52.8
52.8
83.0
2
9
17.0
17.0
100.0
合计
53
100.0
100.0
var1
频率
百分比
有效百分比
累积百分比
有效
2
1
1.9
2.7
2.7
3
10
18.9
27.0
29.7
4
23
43.4
62.2
91.9
5
3
5.7
8.1
100.0
合计
37
69.8
100.0
缺失
系统
16
30.2
合计
53
100.0
以第一题为例,由上表可知,男女生的对学习的观点不一致,而且一半的男生对能否全神贯注的学习有很大的差异。
(1)对问题进行分析得到的频数分布图如下:
以第一维度为例,由上表可知学生对于学习时全神贯注,不能概括刚刚听讲的或读的内容,总设法把正在学的内容与自己的经历联系起来,觉得很难坚持自己的学习计划,在参加考试、写学习论文等过程时,发现自己总会误解题意并由此丢分等方面有一半人的观点不同。
4、差异量统计
了解了数据的集中程度以后可以发现集中程度较高,说明数据的代表性强,进一步分析数据的差异性则非常有必要了,在如下的数据分析中笔者对进行了方差、标准差、T检验、卡方检验等能代表数据离散程度、差异系数的量。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
它与Z检验、卡方检验并列。
T检验分为单总体检验(一个样本平均数与总体平均数是否差异显著)和双总体检验(独立样本t检验和配对样本t检验)。
其中独立样本t检验是两组被试无相关关系。
配对样本t检验指两组被试有关(如来自同一个样本的分组、对同一个样本进行前侧与后测、对同一个样本条件改变后进行测量等),笔者假设选择3的样本在95%的置信区间可接受,如下图。
单个样本统计量
Statistic
Bootstrapa
偏差
标准误差
95%置信区间
下限
上限
var1
N
37
均值
3.76
.00
.10
3.57
3.95
标准差
.641
-.017
.084
.468
.796
均值的标准误
.105
a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples
笔者以第一题为例,进行了单个样本t检验。
由表可知均值为3.76;标准差为0.641,越大说明数据的离散程度越大,一般在均值的12%以内比较符合规范,而该数据大于0.45,因此它的离散程度较大;标准误为0.105,标准误较小,说明样本对总体代表性越强,而该标准误较大。
单个样本检验
检验值=3
t
df
Sig.(双侧)
均值差值
差分的95%置信区间
下限
上限
var1
7.177
36
.000
.757
.54
.97
本次t检验,检验值为3,观测值为7.177,笔者的p值是0.000,p值小于0.05,因此差异显著。
样本均值与检验的差值是0.757。
因为不在95%的置信区间内,所以笔者认为有95%的把握认为均值与样本均值存在显著性差异。
单个样本检验Bootstrap
均值差值
Bootstrapa
偏差
标准误差
显著性水平(双侧)
95%置信区间
下限
上限
var1
.757
.002
.105
.001
.568
.946
a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples
描述统计量
N
和
均值
标准差
方差
峰度
统计量
统计量
统计量
统计量
统计量
统计量
标准误
var1
37
139
3.76
.641
.411
.621
.759
var2
37
85
2.30
.740
.548
-.414
.759
var3
37
132
3.57
.987
.974
-.997
.759
var4
37
103
2.78
.917
.841
.531
.759
var5
37
96
2.59
.956
.914
-.001
.759
var6
37
132
3.57
.959
.919
-.943
.759
var7
37
118
3.19
.938
.880
.236
.759
var8
37
80
2.16
.986
.973
-.835
.759
var9
37
100
2.70
1.127
1.270
-.363
.759
var10
37
79
2.14
.787
.620
.172
.759
有效的N(列表状态)
37
由上图可知第一维度各个题目的均值、标准差、方差、峰值的统计量和标准误,可以判断各题目的离散程度,准确度。
方差越大,数据离散程度越大,说明结论的代表性越差。
笔者选择了第一题和第六题,方差分别为0.411和0.919,方差不齐性,说明二者数据的离散程度等不一致,代表性不同。
检验统计量(卡方)
var1
var2
var3
var4
var5
var6
var7
var8
var9
var10
卡方
32.081a
18.243a
4.622a
24.757b
19.622b
8.081a
21.514b
4.838a
9.892b
18.892a
df
3
3
3
4
4
3
4
3
4
3
渐近显著性
.000
.000
.202
.000
.001
.044
.000
.184
.042
.000
MonteCarlo显著性
显著性
.000c
.001c
.214c
.000c
.001c
.045c
.001c
.187c
.041c
.000c
99%置信区间
下限
.000
.000
.203
.000
.000
.040
.000
.177
.036
.000
上限
.000
.001
.224
.001
.002
.051
.001
.197
.046
.001
a.0个单元(.0%)具有小于5的期望频率。
单元最小期望频率为9.3。
b.0个单元(.0%)具有小于5的期望频率。
单元最小期望频率为7.4。
c.基于10000个具有起始种子2000000的采样表。
卡方代表统计样本的实际观测值与理论推断值之间的偏离程度,卡方值越大,越不符合,卡方越小,偏差值越小,越符合假设的值。
从卡方检验可以看出,第一维度所有题目都不符合小于5的期望频率,说明笔者的假设与实际的误差过大。
方差齐性检验
var1
Levene统计量
df1
df2
显著性
.526
2
33
.596
显著性为0.596,0.05以上不显著,说明方差齐性,来自同一个整体,所以适合进行方差分析。
ANOVA表的F检验中样本平均数显著性小于0.05,差异显著。
T比较两组差异,F比较多组之间的差异。
ANOVA
var1
平方和
df
均方
F
显著性
组间
3.567
3
1.189
3.490
.026
组内
11.244
33
.341
总数
14.811
36
5、相关量统计
相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。
相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。
在SPSS中,如果两个变量都是分类变量或者有一个是分类变量,则需要用Spearman相关分析,如果两个变量都是连续性的变量,则Pearson分析方法更加适合。
一般都是双变量分析,有时会配合回归分析进行。
下图是笔者对第一个维度下的题目进行的相关性分析。
相关性
var1
var2
var1
Pearson相关性
1
-.194
显著性(双侧)
.249
N
37
37
Bootstrapa
偏差
0
.020
标准误差
0
.199
95%置信区间
下限
1
-.543
上限
1
.226
var2
Pearson相关性
-.194
1
显著性(双侧)
.249
N
37
37
Bootstrapa
偏差
.020
0
标准误差
.199
0
95%置信区间
下限
-.543
1
上限
.226
1
a.Unlessotherwisenoted,bootstrapresultsarebasedon1000bootstrapsamples
皮尔逊系数介于1~-1之间,1代表完全正相关,-1代表完全负相关,0代表无关。
由上图皮尔逊相关分析表可知,相关系数为-0.194和1,第一题和第二题相关性为-0.194和1,代表相关性较高,对第一题来说是完全正相关,对第二题来说完全负相关。
笔者通过对SPSS操作流程、以及本次问卷的分析,学习到了许多课堂上迷迷糊糊不太明白的知识,也清楚了它的分析流程,对问题的分析和对SPSS的理解比起之前好了很多,这次数据分析中遇到了不少问题,相信在今后的研究中笔者会坚持练习用SPSS分析数据,使自己的应用能力得到提高。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 报告