SPSS--数据探查数据整理(三).ppt
- 文档编号:2633115
- 上传时间:2022-11-04
- 格式:PPT
- 页数:44
- 大小:355.50KB
SPSS--数据探查数据整理(三).ppt
《SPSS--数据探查数据整理(三).ppt》由会员分享,可在线阅读,更多相关《SPSS--数据探查数据整理(三).ppt(44页珍藏版)》请在冰豆网上搜索。
数据探查数据探查数据探查数据探查数据整理数据整理数据整理数据整理(三)(三)(三)(三)马敬东马敬东华中科技大学同济医学院医药华中科技大学同济医学院医药卫生管理学院卫生管理学院数据探查的目的错误识别错误识别设计缺陷被调查者数据录入探查数据探查数据为检验假设作准备为检验假设作准备数据探查的方法频数表探查法非期望值编码或许表明数据输入或编码有误异常但可能正确的记录值图式探查法将数据以图的方式表示出来,可以对数据从大致分布、总体情况、趋势的走向等方面有一个直观的认识。
数据探查的方法极端值探查法极端值,就是与其它数值相距甚远的值交叉表探查法数据输入时产生的不能用频数表、图、极值表找出的误差和异常值有时可用交叉表识别出来。
数据的初步分析
(一)数据的初步分析
(一)数据的初步分析
(一)数据的初步分析
(一)频数分析、描述统计量频数分析、描述统计量频数分析、描述统计量频数分析、描述统计量马敬东马敬东华中科技大学同济医学院医药华中科技大学同济医学院医药卫生管理学院卫生管理学院频数分析频数分析Frequencies过程产生频数表、集中趋势、离散度指标、直方图和条图。
用户可按数值或频数对频数表进行排序。
从菜单中选择:
AnalyzeDescriptiveStatisticsFrequencies,此即打开了Frequencies对话框,如下图所示。
频数分析频数分析频数的描述统计量频数的描述统计量在上对话框中选择Statistics键,就进入FrequenciesStatistics对话框,如图所示。
PercentileValues(百分数值)(百分数值)用户可选用以下一个或多个选项。
Quartiles输出第25,50,75个百分位数。
Cutpointsfornequalgroups输出将样本等分成n组的百分位数值。
缺省的组数是10。
Percentile(s)用户定义的百分位数值。
这些值按顺序出现在百分位数列表中。
频数分析频数分析Dispersion(离散趋势指标)(离散趋势指标)用户可选用以下一个或多个选项。
Stddeviation标准差。
Variance方差,即标准差的平方。
Range极差,最大值和最小值之间的差值。
Minimum最小值。
Maximum最大值。
S.E.mean均值的标准差,测量样本均值的变异性。
频数分析频数分析CentralTendency(集中趋势指标)(集中趋势指标)Mean算数平均值。
Median中位数。
Mode众数。
Sum总和。
Distribution(分布系数)(分布系数)Skewness偏度,分布不对称程度的一个指标。
偏度,分布不对称程度的一个指标。
Kurtosis峰度,观测值集中于中心点程度的一个指标。
峰度,观测值集中于中心点程度的一个指标。
Valuesaregroupmidpoints当输出的数据为分组频数数据,并且具体数据是组中值,选中该复选框通知SPSS。
频数分析频数分析频数图表频数图表欲获得条图或直方图,按下Frequencies对话框中的Charts即打开了FrequenciesCharts对话框,如下图所示。
频数分析频数分析CharttypeNone此为缺省设置,表示不获得图形。
BarCharts(条形图)(条形图)大小由要画出的最大频数栏决定。
Piecharts(饼图)Histograms(直方图)(直方图)直方图只适用于数值变量,可画出的区间数为21。
Withnormalcurve这一选项在直方图上加一条正态曲线。
ChartvalueFrequenciesPercentages频数分析频数分析频数格式频数格式欲修改频数表输出格式,选用Frequencies对话框中的Displayfrequencytables选项并按下Format,即打开了FrequenciesFormat对话框,如下图所示。
频数分析频数分析Orderby这一顺序选项决定数据值在频数表中排序和显示的方式。
Ascendingvalues按值的升序排列各类别。
Descendingvalued按值的降序排列各类别。
Ascendingcounts按频数的升序排列各类别。
Descendingcounts按频数的降序排列各类别。
MultipleVariablesComparevariablesOrganizeoutputbyvariablesSuppresstablewithmorethan_categories描述统计量概述统计量按其量化特征,这些统计量可分成三类:
集中趋势、离散度和形状。
我们已知道可通过频数(Frequencies)过程来得到某个变量的统计量,这里我们学习怎样通过描述(Descriptive)过程来获得描述统计量。
描述统计量欲获取描述统计量,从菜单中选用:
Analyze-DescriptiveStatistics-Descriptives,此即打开了Descriptives对话框了,如下图所示。
描述统计量Savestandardizedvaluesasvariables此生成每个变量的Z分数(标准分)变量。
新变量名以在原变量的前7个字符前加Z字母生成。
例如,ZX即是X的Z分数变量。
Z分数变量的变量标识通过在原变量标识的前31各字符前加zscore生成。
描述统计量描述统计选项描述统计选项欲获得更多的描述统计量或者项控制变量出现在输出窗口的顺序,按下Descriptives对话框中的Options。
此即打开了DescriptivesOptions对话框,如下图所示。
其基本操作和基本功能与Frequences过程大致相同。
统计描述与统计推断统计描述与统计推断统计学知识复习之二统计学知识复习之二统计描述计量资料的描述性统计计数资料的描述性统计计量资料的描述性统计集中趋势指标离散趋势指标集中趋势指标平均数用于描述一组同质计量资料的集中趋势,反映一组观察值的平均水平或者一个分布的平均位置的指标平均数的种类算术平均数几何平均数中位数众数、调和平均数集中趋势指标算术平均数定义:
是一群已知性质相同的数值之和除以数值个数的商数。
适用条件:
资料呈正态分布近似正态分布。
计算方法直接计算法加权计算法注意事项同质对称集中趋势指标几何平均数适用条件:
不呈正态分布,差距较大,数值顺序排列后,呈倍数关系。
计算方法直接法加权法注意事项观察值不能小于或等于零观察值不能同时有正值和负值同一组资料求得的几何均数小于算术均数中位数定义:
把一组观察值,按大小次序排列,居于中间位置的那个数值。
适用条件:
明显偏态分布;分布的一端或两端无确定数值;资料的分布情况不清楚。
计算方法直接法加权法集中趋势指标离散趋势指标变异性:
同质条件下的观察单位,其同一标志的数据间的差异性。
变异指标:
用以表述一组计量资料观察值之间参差不齐程度的指标。
变异指标的种类全局极差四分位数间距方差与标准差变异系数方差与标准差定义方差:
离均差平方和的均数。
标准差:
方差的平方根。
计算方法直接法加权法标准差的应用表示离散程度;计算变异系数;求正常值的范围;计算标准误离散趋势指标变异系数亦称离散系数,即标准差与均数之比用百分数表示。
应用范围比较均数相差悬殊的几组资料的变异度;比较度量衡单位不同的几组资料的变异度。
离散趋势指标计数资料的描述性统计相对数:
两个有关联的数据之比,用以说明事物的相对关系,便于对比分析。
相对数的种类:
率构成比相对比率表示特定条件下,某现象实际发生例数与可能发生该现象的总例数之比,用来说明某现象发生的强度与频率。
比两事物数量的比值,以反映相对比例、比重或倍数。
构成比:
事物内部某一构成在全部构成中所占的比例或比重,常以100为比例基数。
相对比:
两个有关指标之比。
反映两者之间的差别。
计数资料的描述性统计统计推断抽样误差总体参数估计(略)总体参数比较抽样误差误差定义分类系统误差随机误差抽样误差一种随机误差因个体间存在的差异性,由于抽样的随机性所引起的误差。
抽样误差标准误样本均数以总体均数为中心呈正态分布。
样本均数的标准差成为标准误。
计算公式总体参数比较假设检验的基本思想假设检验的基本步骤建立假设和确定显著性水准选定检验方法和计算统计量确定P值作出推断结论
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 探查 整理