应用统计学实验报告Word格式.doc
- 文档编号:13113662
- 上传时间:2022-10-05
- 格式:DOC
- 页数:21
- 大小:565.38KB
应用统计学实验报告Word格式.doc
《应用统计学实验报告Word格式.doc》由会员分享,可在线阅读,更多相关《应用统计学实验报告Word格式.doc(21页珍藏版)》请在冰豆网上搜索。
但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。
因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。
通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。
二、实验原理
描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。
集中趋势的特征值:
算术平均数、调和平均数、几何平均数、众数、中位数等。
其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。
离散趋势的特征值:
全距、内距、平均差、方差、标准差、标准误、离散系数等。
其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。
分布特征值:
偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。
三、实验步骤
1.频数分析(Frequencies)
实验数据1:
表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。
表2.7某班16位学生的身高数据
学号
性别
身高(cm)
1
M
170
9
150
2
F
173
10
157
3
169
11
177
4
155
12
160
5
174
13
6
178
14
154
7
156
15
172
8
171
16
180
基本统计分析往往从频数分析开始。
通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。
比如,在某项调查中,想要知道被调查者的性别分布状况。
频数分析的第一个基本任务是编制频数分布表。
SPSS中的频数分布表包括的内容有:
(1)频数(Frequency)即变量值落在某个区间中的次数。
(2)百分比(Percent)即各频数占总样本数的百分比。
(3)有效百分比(ValidPercent)即各频数占有效样本数的百分比。
这里有效样本数=总样本-缺失样本数。
(4)累计百分比(CumulativePercent)即各百分比逐级累加起来的结果。
最终取值为百分之百。
频数分析的第二个基本任务是绘制统计图。
统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。
频数分析中常用的统计图包括:
条形图,饼图,直方图等。
频数分析的应用步骤:
在SPSS中的频数分析的实现步骤如下:
选择菜单“【文件】—>
【打开】—>
【数据】”在对话框中的文件类型选项中选择所有文件,找到需要分析的数据文件“SPSS数据/学生身高数据.xls”,然后选择“打开”。
如图1.1所示。
图2.1打开数据
选择菜单“【分析】—>
【描述统计】—>
【频率】”。
如图2.2所示
图2.2频率
确定所要分析的变量,例如身高。
在变量选择确定之后,在同一窗口上,点击“统计量”按钮,打开统计量对话框,如下图2.3所示,选择统计输出选项。
图2.3统计量子对话框
表2.1描述性统计量
统计量
N
有效
缺失
表2.2Gender频数分布表
频率
百分比
有效百分比
累积百分比
6.3
12.5
18.8
25.0
31.3
37.5
50.0
56.3
62.5
68.8
75.0
81.3
87.5
93.8
100.0
合计
图2.4变量身高的条形图
图2.5变量身高的饼图
图2.6变量身高的直方图
结果分析:
由实验结果可知,该班学生的平均身高为166.56cm,其中身高为169cm的同学数量最多,身高的标准偏差为9.668cm,根据直方图可得,该班学生的身高分布不均。
2.描述统计(Descriptives)
试验数据2:
测量18台电脑笔记重量,见表2.8,对其进行描述统计量分析,并对试验结果作出说明。
表2.818台笔记本电脑重量表
序号
重量
1.75
1.92
1.59
1.85
1.83
1.68
1.89
1.70
1.79
17
18
1.66
1.80
2.05
1.91
1.76
1.88
SPSS的【描述】命令专门用于计算各种描述统计性统计量。
选择菜单【分析】→【描述统计】→【描述】,如图2.7所示
图2.8描述对话框
将待分析的变量移入描述性列表框,将序号、重量2个变量进行描述性统计,以观察重量与序号的关系。
Savestandardizedvaluesasvariables,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。
其变量名为相应变量名前加前缀z。
标准化计算公式:
图2.9描述对话框选项
单击【选项】按钮,如图2.9所示,选择需要计算的描述统计量。
各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。
在主对话框中单击ok执行操作。
表2.3描述统计量表
描述统计量
极小值
极大值
均值
标准差
9.50
5.339
1.8083
.10777
有效的N(列表状态)
结果输出与分析:
从实验结果中可以看出,该批次笔记本的平均质量为1.8083kg,而大部分笔记本电脑重量在1.8kg左右,占到了总台数的50%以上。
存在个别过轻或者过重的笔记本电脑产品,有可能是不合格产品。
实验2统计推断
1.熟悉点估计概念与操作方法
2.熟悉区间估计的概念与操作方法
3.熟练掌握T检验的SPSS操作
4.学会利用T检验方法解决身边的实际问题
1.参数估计的基本原理
2.假设检验的基本原理
三、实验演示内容与步骤
1.单个总体均值的区间估计
例题:
某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为:
72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?
设α=0.05
¨
打开SPSS,建立数据文件:
“某省大学生四级英语测验成绩.sav”。
这里,研究变量为:
四级英语测验平均成绩成绩,即这20个样本的成绩。
选择区间估计选项,方法如下:
选择菜单【分析】—>
【探索】”,打开图3.1探索对话框。
从源变量清单中将“四级英语测验平均成绩”变量移入、因变量列表框中。
图3.1探索对话框
图3.2探索:
计算结果
表3.1案例处理摘要
案例
四级英语测验平均成绩
100.0%
.0%
表3.2描述
标准误
70.1905
2.05243
均值的95%置信区间
下限
65.9092
上限
74.4718
5%修整均值
70.1561
中值
70.0000
方差
88.462
9.40542
54.00
87.00
范围
33.00
四分位距
15.00
偏度
.060
.501
峰度
-.848
.972
如上表显示。
从上表“95%ConfidenceIntervalforMean”中可以得出区间估计(置信度为95%)为:
(65.9092,74.4718),其中lowerBound表示置信区间的下限,UpperBound表示置信区间的上限。
点估计是:
四级英语测验平均成绩Stem-and-LeafPlot
FrequencyStem&
Leaf
1.005.4
2.005.69
4.006.1224
3.006.688
3.007.024
5.007.56688
1.008.3
2.008.57
Stemwidth:
10.00
Eachleaf:
1case(s)
图3.3
2.两个总体均值之差的区间估计
分析某班级学生的高考数学成绩是否存在性别上的差异。
数据如表所示:
某班级学生的高考数学成绩
数学成绩
男(n=18)
858975588680787684899995828760857580
女(n=12)
9296868378877065706570787256
打开SPSS,按如下图示格式输入原始数据,建立数据文件:
“工会会员工资差别.spss”。
这里,“会员”表示是否为工会会员的变量,y表示是工会会员,n表示
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 实验 报告