第二章SPSS基本统计分析.docx
- 文档编号:5078729
- 上传时间:2022-12-13
- 格式:DOCX
- 页数:19
- 大小:1.71MB
第二章SPSS基本统计分析.docx
《第二章SPSS基本统计分析.docx》由会员分享,可在线阅读,更多相关《第二章SPSS基本统计分析.docx(19页珍藏版)》请在冰豆网上搜索。
第二章SPSS基本统计分析
第二章:
SPSS基本统计分析
SPSS软件的基本统计计算和绘图功能主要通过Analyze菜单中的DescriptiveStatistics以及Reports来完成的。
另外,基本统计分析的报表是利用Analyze菜单中Tables制作的。
为更清楚地讨论SPSS基本统计分析,可引入实际的案例加以介绍。
以《世界500强公司》的数据为例:
✓我们想统计世界500强中,主营业务为电信的公司出现的频率怎么做?
✓我们想计算500强公司营业收入的均值、差异程度,怎么做?
●本章学习内容:
1.1数据的基本统计描述量
1.2频数分析(Frequencies)
1.3描述统计(Descriptives)
1.4探索分析(Explore)
1.5 报告输出
●具体内容:
1.1数据的基本统计描述量
表示集中趋势的统计量
总和(Sum)
所有数据的算术和
均值(Mean)
算术平均值
众数(Mode)
n个数据中出现次数最多的数
中位数(Median)
排在中间位置的数
百分位数(Percentile)
数据从小到大排序,处在k%位置的数称为第k百分位数
表示离散程度的统计量
方差(Variance)
标准差(Std.Deviation)
极差(Range)
最大值与最小值之差
四分位极差(Interquartile)
第75百分位数与第25百分位数之差
表示分布形状特征的统计量
偏度(Skewness)
接近0,对称分布;>0,右偏态;<0,左偏态。
峰度(Kurtosis)
接近0,为正态分布;>0,陡峭;<0,平缓。
1.2 频数分析(Frequencies)
1.2.1主要作用
可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。
1.2.2实例分析
打开文件《世界500强公司》,对世界500强公司数据进行频数分析:
(1)对世界500强公司主营业务进行频数分析;
(2)对世界500强公司的营业收入进行频数分析并画出直方图;
(3)对我国进入500强的公司进行频数分析。
具体操作如下:
题1. 对世界500强公司主营业务进行频数分析:
Analyze→DescriptiveStatistics→ Frequencies,打开Frequencies对话框,如下图。
4
题2.对世界500强公司的营业收入进行频数分析并画出直方图
题目分析:
由于营业收入属于数值型变量,其中每一数值都不相同,所以直接做频数分析没有意义。
应将其按数值大小分成不同区间,然后作频数分析;而这一步应首先基于对数值进行描述统计,找出最小值和最大值。
具体步骤分为描述统计、分组(通过“重新编码”(Recode))、频数分析等三步。
描述统计:
Analyze→Descriptive Statistics→Descriptives,打开如下对话框。
根据最小值和最大值,对原数据中营业收入进行重新分组:
(0-29999.9),(30000-59999.9),(60000-89999.9),(90000-119999.9),(120000-149999.9),(150000-179999.9),(180000-209999.9),(210000-)
分组(通过“重新编码”(Recode)):
Transform→Recode→IntoDifferentVariables(重新编码为新的变量)
此时我们会看到数据编辑窗口中变量栏多了一个:
收入分组。
频数分析:
现在可以对新的变量:
收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。
步骤同一。
结果如下两图。
题3:
对我国进入500强的公司进行频数分析。
(1)首先挑选出中国的公司,可以通过筛选观测量来完成。
具体操作:
Data→Select Cases,点选If对话框,然后设定“总部所在”为“中国”(总部所在=“中国”)。
将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。
见下图。
Ok之后将文件另存到桌面。
(2)对中国进入500强公司进行频数分析。
打开中国.sav文件,Analyze→Descriptive Statistics→Frequencies,打开Frequencies对话框,在charts选项中选择“BarCharts”,输出结果如下。
1.3 描述统计(Descriptives)
1.3.1 主要作用
对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。
1.3.2 实例分析
刚才已经使用过。
可对500强进行描述统计,操作后输出结果如下:
对结果的解释可参照教科书。
习题:
✓对“frequencies-舒张压.sav”文件中的数据进行频数分析(以10分组);
✓练习2
1.4 探索分析(Explore)
1.4.1主要功能:
此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。
剔除奇异值和错误数据。
探测数据的错误来源
✓人为的数据差错
✓仪器测量的误差
✓输入数据时的手误,如:
小写的“l”与“1”、“o”与“0”
数据探测的重要性
由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。
1.4.2实例分析
(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。
首先筛选出日本公司,步骤同上。
Analyze--DescriptiveStatistics--Explore 顺序单击,打开Explore 主对话框。
如图:
点击ok后,会出现输出窗口,如下:
百万美元Stem-and-Leaf Plotfor
filter_$=Selected
Frequency Stem&Leaf
33.00 1.33333333444
15.00 1. 556666666778999
11.00 2. 00001122333
6.00 2. 555669
2.00 3.03
.003.
7.00 4. 0011333
1.00 4. 9
12.00Extremes (>=54997)
Stem width:
10000.0
Eachleaf:
1 case(s)
茎叶图从左到右分为三部分:
频数、茎和叶、茎是整数部分,叶是小数部分,Stem width表示茎宽。
每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。
例如:
从茎叶图中可以看出,25000 (2)按主营业务绘制日本500强公司的箱线图 首先用Select Cases选出500强中的所有银行业(If=”银行”)。 然后用Graphs→Boxplot,打开箱线图对话框,如图: 习题: 421/17 对“explore-合金温度测试.sav”数据文件进行探索分析,并利用Boxplot绘制新型合金的箱线图,找出其中的极端值。 1.5报告输出 作用: 对数据进行整理汇总,并作统计分析(仅举例均值、标准差、最大值及最小值),以便于阅读和分析。 1.5.1样品汇总报告(CaseSummaries) 打开文件“房屋地段与销售情况.sav”,具体操作如下: Analyze→Reports→CaseSummaries,即会出现如下对话框。 随后可见输出结果(对所需图表右击来选择输出形式: 图-以图像形式;表-可以两种形式,图像和表格): 1.5.2行形式报告(ReportSummaries in Rows) 统计量以行的形式列出。 Analyze→Reports→ ReportSummariesinRows,即会出现如下对话框。 房屋Page1 地段 标价 出售价格 ________ ________________ 城中心 Mean 3250 3330 Minimum2800 2800 Maximum 3600 3650 StdDev 328 338 近郊区 Mean 1892 1835 Minimum 1780 1650 Maximum 2250 2300 StdDev 179 245 卫星城 Mean 2064 2070 Minimum 1900 1950 Maximum 2400 2350 StdDev 197 168 远郊区 Mean 17681726 Minimum 1670 1650 Maximum 1880 1800 StdDev 96 72 GrandTotal Mean 2227 2221 Minimum 1670 1650 Maximum 3600 3650 StdDev 627 681 1.5.3列形式报告(ReportSummariesinColumns) 操作过程和行形式报告相似 Page 1 标价 标价 标价出售价格 出售价格 出售价格 地段 MeanMinimum Maximum MeanMinimumMaximum __________________________________ __________________________ 城中心 3250 2800 3600 3330 2800 3650 近郊区 1892 1780 2250 1835 1650 2300 卫星城 2064 1900 2400 2070 1950 2350 远郊区 1768 1670 188017261650 1800 习题: 根据“各地区普通高等学校 (机构)教职工情况(2005年).xls” (1)建立“各地区普通高等学校(机构) 教职工情况”的spss数据文件; (2)对其中“正高级”人数进行描述统计; (3)用“列形式报告”汇总文件中五种职称类型人数的均值、最大值和最小值。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 SPSS 基本 统计分析