SPSS17教案Word格式文档下载.doc
- 文档编号:14617293
- 上传时间:2022-10-23
- 格式:DOC
- 页数:38
- 大小:906KB
SPSS17教案Word格式文档下载.doc
《SPSS17教案Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《SPSS17教案Word格式文档下载.doc(38页珍藏版)》请在冰豆网上搜索。
3.46E+02
5.Date:
日期型yyyy/mm/dd
6.Dollar:
货币型à
$3000
7.Customcurrency:
用户自定义型
8.String:
字符型
c)变量标签
d)变量值标签
e)用户缺失值定义:
1.定义三个单独的缺失值
2.定义一个缺失值范围和一个单独的缺失值
f)变量的测量尺度
1.定性变量Nominal,它的取值只代表观测对象的不同类别,例如姓名,性别
2.定序变量Ordinal,它的取值大小能够表示观测对象的某种顺序关系(等级、方位或大小)等,例如学历的变量的取值是1-小学及以下、2-初中、3-高中、中专、技校、4、大专、5本科、6、研究生、7、博士
3.定距变量,它的取值之间可以比较大小,可以用+-法计算出差异的大小,例如年龄,其取值60与20相比,表示60岁比20岁大,并且可以计算出大40岁。
4.定比变量,它与定距变量意义相近,差别在于定距变量中的0值只表示某一值,不表示没有,如在测定温度的摄氏度中,0度不表示没有温度。
b)数据的输入[DataView]
c)保存格式:
*.sav 或 *.xls
示例:
一组社会调查的数据
姓名+性别+年龄+学历+职业+收入+测试成绩1+测试成绩2
二、常规数据操作方法
l选取指定数据行[Data]à
[SelectCases]
l数据分类汇总:
i.分类变量
ii.汇总变量
l缺失值的替代
²
SeriesMean:
用该变量的所有非缺失值的均数作替代
Meanofnearbypoints:
用缺失值相邻点的非缺失值的均数替代,取多少个相邻点可任意定义
Medianofnearbypoints:
用缺失值相邻点的非缺失值的中数千替代,取多少个相邻点可任意定义
Linearinterpolation:
用缺失值相邻两点非缺失值的均值作替代
Lineartrendatpoint:
用线性拟合方式确定替代值
l数据次序确定
求大专女性的平均收入
三、变量的操作
l增减变量
l指定加权变量,例如希望了解某超市中某天售出商品的平均价格。
如果仅以各种商品的单价平均数作为平均价格是不合理的,还应考虑到各商品的销售量对平均价格的影响。
因此,对商品的销售量作为权重计算各中商品单价的加权平均数,才是我们需要求的数据。
l根据已经存在的变量建立新变量[Transform]à
ComputeVariable
l产生计数变量,例如,要对每个学生统计语文、数学、化学三门课成绩中几门在80分以上。
四、统计描述
SPSS基本统计分析是进行其他统计分析研究基础和前提。
通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。
基本统计分析包括:
1.均值Mean,均值标准误差S.E.mean,是描述样本均值与总体均值之间平均差异程序的统计量。
求某班级学生在一次数学测验中平均成绩的差异程序,
99,88,79,59,54,89,79,56,89,99,23,89,70,50,67,78,89,56
2.中位数Median,把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。
它是一种位置代表值,所以不会受极端数值的影响,具有较高的稳健性。
求某班级学生身高的中位数。
174,168,164,174,176,150,183,162,171,146,189,167
3.众数Mode,是指一组数据中,出现次数最多的那个变量值。
在描述数据集中趋势方面有一定意义。
例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。
求某医院当天出生新生儿的体重的众数:
8,7,6,7,5,4,5,6,8,7,5,6,4,7,6,5.,7,4
4.全距Range:
也称极差,是数据的最大值与最小值之间的绝对差。
在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。
求某班级学生数学成绩的全距:
99,88,79,59,54,89,79,556,89,99,23,89,70,50,67,78,89,56
5.方差Variance和标准差StandardDeviation:
方差,它表示了一组数据分布的离散程序的平均值。
标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程序。
方差和标准差越大,说明变量值之间的差异越大,距离平均数这个中心的离散趋势越大。
求某班级学生数学成绩的方差和标准差:
6.四分位数Quartiles、十分位数Deciles、百分位数Percentiles:
四分位数是将一组个案由小到大或由大到小排序后,用三个点将全部数据分成四等份,与三个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。
其中Q1与Q3之间的距离的一半又称为四分位差,记为Q。
四分位差越小,说明中间的数据越集中;
四分位数越大,则意味着中间部分的数据越分散。
7.频数Frequency:
就是一个变量在各个变量值上的取值的个案数。
如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少人,就要用到频数分析。
8.峰度Kurtosis:
是描述某变量所有取值颁布形态陡缓程序的统计量。
这个统计量是与正态分布相比较的量。
l峰度=0表示其数据分布与正态分布的陡缓程序相同;
l峰度>
0表示比正态分布高峰要更加陡峭,为尖顶峰;
l峰度<
0表示比正态分布的高峰要更平坦,为平顶峰。
某班级学生的年龄分布如下所示,试求学生年龄峰度。
年龄
人数
Kurtosis=0.639>
是尖顶峰
表示年龄差距较大
18
1
19
7
20
22
21
8
2
9.偏度Skewness:
是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。
这个统计量也是与正态分布相比较的量。
l偏度=0表示其数据分布形态与正态分布偏度x相同;
l偏度>
0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;
l偏度<
0表示负偏差数值大,为负偏或左偏,有一条长屘拖在左边。
面偏度的绝对值数越大表示分布形态的偏斜程序越大。
某班级41个学生的身高分布如下表,求学生身高的分布偏度。
身高
Skewness=1.271>
右偏
身高较高的人较多
165
168
170
173
175
180
10.标准化Z分数及其线性转换。
Z分数定义:
从平均数为μ,标准差为σ的总体中抽出一个变量值χ,Z分数表示的是这个变量χ>
或<
平均数μ多少个标准差σ。
因此Z能够用来比较两个从不同单位总体中抽出的变量值。
公式:
[例] 对某校高二学生进行期中学习质量检测,语文、数学和英语成绩的平均数分别是80分、70分和85分,这三种成绩的标准差分别是10分、15分和12分。
某学生的三科成绩分别是85分、82分和90分,问:
该生这三科成绩哪一科最好?
可见,故可认为该生的数学成绩相对最好,其次为语文,再次是英语。
在标准分数Z的应用中,由于标准分数Z分值过小,并往往带有小数和负值等缺陷,在许多情形下直接使用不大合乎人们表示分数的习惯,故通常把标准分数Z通过线性变换,转到更大的标准分数量表上。
常见的有如下几种:
①教育与心理测验中的T分数:
T=50+10Z
②韦氏智力量表中各分测验的量表分:
T=10+3Z
韦氏智力量表智商(离差智商):
IQ=100+15Z
③美国大学入学考试报告分数:
CEEB=500+100Z
④为出国人员举行的英语水平考试:
EPT=90+20Z
⑤美国教育测验中心举办“托福”考试:
TOEFL=500+70Z
11.探索分析
调用此过程可对变量进行更为为深入详尽的描述性统计分析,帮称之为探索分析。
它在一般描述性统计指标的基础上,增加有关羝数据其他特征的文字与图形描述,显得更加细致与全面、有助于用户思考对数据进行进一步分析的方案。
1)探索分析的内容包括下面几个方面:
l检查数据是否有错误:
过大或过小的数据均有可能是奇异值、影响点或错误数据,往往这样的数据对分析的影响较大,不能真实反映数据的总体特征,所以就需要找出这样的数据,并分析原因,然后决定是否从分析中删除这些数据。
l获得数据分布特征:
很多分析方法对数据分布有一事实上的要求,例如,很多检验就需要数据分布服从正态分布。
因此检验数据是否符合正态分布,就决定了它们是否能用只对正态分布数据适用的分析方法。
l对数据规律的初步观察:
通过初步观察获得数据的一些内部规律,例如,两个变量间是否线性相关。
2)探索分析的考察方法
探索分析一般通过数据文件在分组或不分组的情况下,获得常用统计量和图形。
一般以图形方式输出,直观帮助用户确定奇异值、影响点、进行假设检验,以及确定用户要使用的某种统计方式是否合适。
3)正态分布检验
常用的正态分布检验是Q-Q图。
4)方差齐次性检验
对数据分析不仅需要进行正态分布检验,有时还需要比较各个分组的方差是否相同,这就要进行方差齐次性检验。
Levene检验可以对数据进行方差齐次性检验,此检验方法不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。
如果得到显著性水平<
0.05,那么就可以认定数据方差不相同。
Output:
TestofHomogeneityofVariance
方差齐次性检验
LeveneStatistic
df1
df2
Sig.显著水平
语文
BasedonMean-均值
2.687
27
.113
BasedonMedian-中位数
1.828
.188
BasedonMedianandwithadjusteddf-中位数和调整后的自由度
23.362
.189
Basedontrimmedmean-调整后的均值
2.678
从四个指标得到的显著水平Sig看,都是>
0.05的,因此,可能确定全组数据方差是相等的。
如果从四个指标得到的显著水平中,有>
0.05的,也有<
0.05的,那么就不能确定是否方差相等。
从箱图中,可以看出有没有奇异值:
如果存在奇异值,则会在箱图中用”0”标记,存在极值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS17 教案