统计学excel操作共32页.docx
- 文档编号:25967159
- 上传时间:2023-06-16
- 格式:DOCX
- 页数:29
- 大小:5.92MB
统计学excel操作共32页.docx
《统计学excel操作共32页.docx》由会员分享,可在线阅读,更多相关《统计学excel操作共32页.docx(29页珍藏版)》请在冰豆网上搜索。
统计学excel操作共32页
《统计学》课程实验(shíyàn)指导
【试验(shìyàn)目的】
能够使学生在学习统计学原理课程时,掌握统计学中的计算过程(guòchéng),理论联系实际。
由于Excel是目前办公软件中比较流行的软件,因此,本试验课以该软件为基础,实现(shíxiàn)它的统计计算功能。
通过该试验课程的学习,使每个学生能够达到能够利用该软件的统计计算功能熟练地完成教材中有关例题、习题的计算,并通过案例的学习,培养学生一定的解决实际问题的能力。
【试验内容】
Excel中的统计分析功能,包括算术平均数、加权平均数、方差、标准差、协方差、相关系数、统计图形、随机抽样、参数点估计、区间估计、假设检验、方差分析、移动平均、指数平滑、回归分析。
【试验计划】
两个教学周,上试验课一次,时间一小时。
【试验地点】
学院办公楼二层计算机机房
试验一:
描述性统计在Excel中的操作程序
此分析工具用于生成对输入区域中数据的单变值分析,提供有关数据趋中性和易变性的信息。
(-)“描述统计”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
分组方式
如果需要指出输入区域中的数据是按行还是(háishi)按列排列,请单击“逐行”或“逐列”。
标志(biāozhì)位于第一行/列
如果输入区域的第一行中包含(bāohán)标志项,请选中“标志(biāozhì)位于第一行”复选框;如果输入区域的第一列中包含标志项,请选中“标志位于第一列”复选框;如果输入区域没有标志项,则该复选框不会被选中,MicrosoftExcel将在输出表中生成适宜的数据标志。
平均数置信度
如果需要在输出表的某一行中包含均值的置信度,请选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。
例如,数值95%可用来计算在显著性水平为5%时的均值置信度。
第K大值
如果需要在输出表的某一行中包含每个区域的数据的第k个最大值,请选中择此复选框,然后在右侧的编辑框中,输入k的数值。
如果输入1,则这一行将包含数据集中的最大数值。
第K小值
如果需要在输出表的某一行中包含每个区域的数据的第k个最小值,请选中此复选框,然后在右侧的编辑框中,输入k的数值。
如果输入1,则这一行将包含数据集中的最小数值。
输出区域
在此输入对输出表左上角单元格的引用。
此工具将为每个数据集产生两列信息。
左边一列包含统计标志项,右边一列包含统计值。
根据所选择的“分组方式”选项的不同,MicrosoftExcel将为输入表中的每一行或每一列生成一个两列的统计表。
新工作表组
单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1单元格开始粘贴计算结果。
如果需要给新工作表命名,请在右侧编辑框中键入名称。
新工作簿
单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。
汇总统计
如果需要MicrosoftExcel在输出表中生成下列统计结果,请选中此复选框。
这些统计结果有:
平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏斜度、极差(全距)、最小值、最大值、总和、总个数、Largest(#)、Smallest(#)和置信度。
(二)实例应用:
某老师对几名学生的五次考试成绩进行分析,以便对这几个学生在学习方面的问题加以解决。
使用“描述统计”分析工具对其数据进行分析。
(数据文件名:
描述统计.xls)
操作步骤:
1、打开数据“描述统计.xls”。
如下:
2、选择(xuǎnzé)“数据分析”对话框中“描述统计”,跳出(tiàochū)“描述统计”对话框。
2、在“输入(shūrù)区域”编辑框中键入三列数据所在(suǒzài)的单元格区域引用($A$4:
$F$8)。
3、单击“逐行”选项。
4、选中“标志位于第一行”选项。
5、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:
“描述统计结果”。
6、选中“汇总统计”。
7、选中“平均数置信度”,并在其相应的编辑框中输入“95”。
8、选中“第K大值”和“第K小值”,并在其相应编辑框中输入“1”。
9、单击“确定”。
10、数据输出在新创建的工作表“协方差分析结果”中的“A1:
J18”区域。
如下:
在数据输出的工作表中,可以看出每个学生的的成绩的各种分析结果。
其中第3行至第18行分别为:
平均值、标准误差、中值、标准误差、样本方差(fānɡchà)、峰值、偏度、最大值、最小值、和、计数、第1大值、第1小值、95%概率保证程度的置信度。
根据“标准偏差”值可以看出王华的成绩离散程度最大,即是说其成绩极不稳定,刘明的成绩是最稳定的。
若取中值进行分析则是王华的成绩最好。
平均值为刘明最佳。
总体上而言,王华的成绩应该是最好的,只是(zhǐshì)最后一次的成绩太差,造成了较大的影响。
试验(shìyàn)二:
统计直方图在Excel中的操作程序
在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别(gèbié)和累积频率,用于统计有限集中某个数值元素的出现次数。
例如,在一个有20名学生的班级里,可以确定以字母打分(如A、B-等)所得分数的分布情况(qíngkuàng)。
直方图表会给出字母得分的边界,以及在最低边界与当前边界之间某一得分出现的次数。
出现频率最多的某个得分即为数据组中的众数。
“直方图”对话框
接收(jiēshōu)区域(可选)
在此输入接收区域的单元格引用,该区域应包含一组可选的用来定义接收区间的边界值。
这些(zhèxiē)值应当按升序排列。
只要存在的话,MicrosoftExcel将统计在当前边界点和相邻的高值边界点之间的数据点个数。
如果某个数值等于或小于某个边界值,则该值将被归到以该边界值为上限的区间中。
所有小于第一个边界值的数值将一同计数,同样所有大于最后一个边界值的数值也将一同记数。
如果省略此处的接收区域,MicrosoftExcel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。
柏拉图
选中此复选框,可以在输出表中同时按降序排列频率数据。
如果此复选框被清除,MicrosoftExcel将只按升序来排列数据,即省略输出表中最右边的三列数据。
累积百分率
选中此复选框,可以在输出表中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。
如果清除此选项,则会省略累积百分比。
图表输出
选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。
实例应用:
学生历次考试成绩统计,按照一定区间生成频数分布表,使用“直方图”分析工具来完成。
(数据文件名:
直方图.xls)
操作步骤:
1、打开(dǎkāi)数据“直方图.xls”,如图
2、选择(xuǎnzé)“数据分析”对话框中“直方图”,跳出(tiàochū)“直方图”对话框。
3、在“输入(shūrù)区域”对应编辑框输入学生成绩数据的引用。
($B$2:
$B$15)
4、在“接受区域”对应编辑框输入数据划分单元格的引用。
($A$18:
$A$22)
5、看是否在输入栏里是否选择了标志单元格,考虑选定“标志”。
在输出选项中选择“新工作表组”,在其对应编辑框中输入输出工作表名称,如;“图表输出”。
选择“帕拉图”、“累积百分率”、“图表输出”选项。
5、单击确定。
结果输出如下
在图中显示的统计结果中,可以看见输出的内容分为两部分(bùfen),一部分是数据表示形式,一部分是直方图形式。
在数据表部分,显示每个区间中的人数及累计百分率数值。
通过该统计结果,我们可以知道,在第一次考试中有6人在100~85分之间,5人在85~75之间,1人在75~65之间,1人在65以下。
试验(shìyàn)三:
协方差和相关系数在Excel中的计算
1、协方差
此分析工具及其公式(gōngshì)用于返回各数据点的一对均值偏差之间的乘积的平均值。
协方差是测量两组数据相关性的量度。
可以使用协方差工具来确定两个区域中数据的变化是否相关(xiāngguān),即,一个集合的较大数据是否与另一个集合的较大数据相对应(正协方差);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负协方差);还是两个集合中的数据互不相关(协方差为零)。
“协方差”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
实例应用:
用协方差分析工具分析某公司(ɡōnɡsī)历史“推销(tuīxiāo)费用”、“销售额”、“营业人员”三项数据(shùjù)之间是否存在相关。
(数据文件名:
协方差.xls)
操作步骤:
1、打开(dǎkāi)数据“协方差.xls”,如下:
2、选择“数据分析”对话框中“协方差”,跳出“协方差”对话框。
3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($B$1:
$D$9)。
6、单击“逐列”选项。
7、选中“标志位于第一行”选项。
8、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:
“协方差分析结果”。
9、单击“确定”。
10、数据输出在新创建的工作表“协方差分析结果”中的“A1:
D4”区域。
如下:
在上图所示的输出表为“推销(tuīxiāo)费用”、“营业员”、“销售额”三个变量的协方差矩阵。
明显,对角线上为各自方差;其他,三个变量相互之间协方差分别(fēnbié)为:
202.125、199.5、610.5,说明三个变量之间存在较显著的相关性,不是相互独立的。
2、相关系数
此分析工具及其公式可用于判断两组数据集(可以使用(shǐyòng)不同的度量单位)之间的关系。
总体相关性计算的返回值为两组数据集的协方差除以它们标准偏差的乘积:
可以(kěyǐ)使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关性为零)。
“相关系数”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
实例应用:
对某厂销售额、营业人员、以及推销(tuīxiāo)费用的历史数据进行相关分析。
(数据文件名:
相关系数.xls)
操作过程:
1、打开(dǎkāi)数据“相关系数.xls”。
如下(rúxià):
2、在数据分析对话框中选择(xuǎnzé)“相关系数”后,跳出“相关系数”对话框。
3、在“输入区域”编辑框中输入三列数据所在的单元格区域引用($B$1:
$D$9)。
4、单击“逐列”选项。
5、选中“标志位于第一行”选项。
6、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:
“相关分析结果”。
7、单击确定。
8、数据输出在新创建的工作表“相关分析结果”中的“A1:
D4”区域。
如下:
在上图所示的输出表为“推销(tuīxiāo)费用”、“营业员”、“销售额”三个变量的相关系数矩阵。
明显,对角线上变量与自己完全正相关,值为1;其他,三个变量相互之间相关系数分别为:
0.989786、0.993619、0.996674,数值非常接近1,说明三个变量之间存在(cúnzài)较显著的相关关系。
试验(shìyàn)四:
t统计检验在Excel中的操作程序
“分析(fēnxī)工具库”中提供了三种工具,可用来检验各种样本总体的均值。
(-)“t-检验:
双样本等方差假设”分析
此分析工具可以进行双样本学生氏t-检验。
此t-检验先假设两个数据集的平均值相等,故也称作齐次方差t-检验。
可以使用t-检验来确定两个样本均值实际上是否相等。
“t-检验:
双样本等方差假设”对话框
变量1的区域
在此输入需要分析的第一个数据区域的单元格引用。
该区域必须由单列或单行的数据组成。
变量2的区域
在此输入需要分析的第二个数据区域的单元格引用。
该区域必须由单列或单行的数据组成。
假设平均差
在此输入期望中的样本均值的差值。
0值则说明假设样本均值相同。
α
在此输入检验的置信度。
该值必须在范围0~1之间。
Alpha置信度为I型错误(cuòwù)发生概率的显著性水平(舍弃真实假设)。
实例(shílì)应用:
检验两组实验测试数据(shùjù)是否有差异。
(数据文件名:
双样本等方差假设.xls)
操作步骤:
1、打开(dǎkāi)“双样本等方差假设.xls”,如下
2、选择“数据分析”中的“t-检验:
双样本等方差假设”,跳出“t-检验:
双样本等方差假设”对话框。
3、在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。
4、“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表名称。
如:
“t检验分析结果”。
5、
6、单击确定。
输出如下
根据图中所示工作表显示的计算结果数据,可一直到两个温度(wēndù)下产品的轻度不受影响(即可认为两种温度下强度祥等)。
(二)“t-检验:
双样本异方差(fānɡchà)假设”分析(fēnxī)
此分析(fēnxī)工具及其公式可以进行双样本学生氏t–检验。
此t-检验先假设两个数据集的方差不等,故也称作异方差t-检验。
可以使用t-检验来确定两个样本均值实际上是否相等。
当进行分析的样本组不同时,可使用此检验。
如果某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。
用于确定检验统计值t的公式如下:
下面的公式用于估计自由度。
因为计算结果通常不为整数,从t分布表中查找临界值时,应使用最接近的整数。
“t-检验:
双样本异方差假设”对话框
假设(jiǎshè)平均差
在此输入期望中的样本均值的差值。
0值则说明(shuōmíng)假设样本均值相同。
α
在此输入检验的置信度。
该值必须在范围0~1之间。
Alpha置信度为I型错误发生(fāshēng)概率的显著性水平(舍弃真实假设)。
实例(shílì)应用:
提出零假设为强度有变化,检验两组实验测试数据是否有差异。
(数据文件名:
双样本异方差假设.xls)
操作步骤:
7、打开“双样本异方差假设.xls”,如下
8、选择“数据分析”中的“t-检验:
双样本异方差假设”,跳出“t-检验:
双样本异方差假设”对话框。
9、在“变量1的区域”和“变量2的区域”分别输入50和60度时测试数据所在单元格的引用。
10、“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表名称。
如:
“t检验分析结果”。
10、单击确定。
输出(shūchū)如下
根据图中所示工作表显示的计算结果数据,原假设不成立,可以知道(zhīdào)两个温度下产品的强度不受影响(即可认为两种温度下强度相等)。
(三)t-检验(jiǎnyàn):
平均值的成对二样本分析
此分析工具及其公式可以进行成对双样本学生氏t-检验,用来(yònɡlái)确定样本均值是否不等。
此t-检验并不假设两个总体的方差是相等的。
当样本中出现自然配对的观察值时,可以使用此成对检验,例如对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。
注意由此工具生成的结果中包含有合并方差,亦即数据相对于平均数据离散值的累积测量值,可以由下面的公式得到:
“t-检验:
平均值的成对二样本分析”对话框
假设(jiǎshè)平均差
在此输入期望中的样本均值的差值。
0值则说明(shuōmíng)假设样本均值相同。
α
在此输入检验的置信度。
该值必须(bìxū)在范围0~1之间。
Alpha置信度为I型错误发生概率的显著性水平(舍弃真实假设)。
实例(shílì)应用:
采用与前相同数据,操作过程一样,结果如下:
试验五:
z统计检验在Excel中的操作程序
此分析工具可以进行方差已知的双样本均值z-检验。
此工具用于检验两个总体均值之间存在差异的假设。
例如,可以使用此检验来确定两种汽车模型性能之间的差异情况。
“z-检验:
双样本平均差检验”对话框
变量(biànliàng)1的方差(已知)
在此输入变量(biànliàng)1输入区域的总体方差。
变量(biànliàng)2的方差(已知)
在此输入(shūrù)变量2输入区域的总体方差。
实例应用:
比较不同两地区水源矿物质含量是否相同。
(数据文件名:
Z检验.xls)
操作步骤:
1、打开数据“Z检验.xls”,如下
2、选择“数据分析”中的“z-检验:
双样本平均差检验”,跳出“z-检验:
双样本平均差检验”对话框。
3、在“变量1的区域”、“变量2的区域”对应的编辑框中键入A、B地区数据所在单元格的引用。
4、在“变量1的方差”、“变量2的方差”编辑框中分别键入A、B方差5和8。
5、在“输出选项”下单击“新工作表组”选项,并在其对应编辑框中键入新工作表名称,如:
“z检验分析结果”。
6、单击确定(quèdìng),数据结果如下
可以看到Z值为-1.61245,双尾临界值为1.959961,因此,可以接受零假设,认为两地(liǎnɡdì)水源矿物质含量无显著差异。
试验(shìyàn)六:
F统计检验在Excel中的操作程序
此分析工具可以进行(jìnxíng)双样本F-检验,用来比较两个样本总体的方差。
例如,可以对参加游泳比赛的两个队的时间记分进行F-检验,查看二者的样本方差是否不同。
“F-检验:
双样本方差分析”对话框
变量(biànliàng)1的区域
在此输入对需要分析(fēnxī)的第一列或第一行数据的引用。
变量(biànliàng)2的区域
在此输入(shūrù)对需要分析的第二列或第二行数据的引用。
α
在此输入检验的置信度。
该值必须在范围0~1之间。
Alpha置信度为I型错误发生概率的显著性水平(舍弃真实假设)。
实例应用:
对测试产品在不同温度下强度的实验数据进行“F-检验双样本方差分析”,以检查两种数据下测得的数据方差是不是相等。
(数据文件名:
F-检验:
双样本方差分析.xls)
操作步骤:
1、打开“F-检验:
双样本方差分析.xls”数据,如图
2、选择“数据分析”对话框中“F-检验:
双样本方差分析”,跳出“F-检验:
双样本方差分析”对话框。
3、在变量1的区域、变量2的区域所对应的编辑框中输入所要引用的单元格的引用。
4、置信度对应数据框输入0.05。
5、在输出数据对应的编辑框中输入,输出单元格的引用。
6、单击确定。
试验(shìyàn)七:
方差分析(anova)在Excel中的操作程序
“分析(fēnxī)工具库”中提供了三种工具,可用来分析方差。
具体使用哪一工具则根据因素的个数以及待检验(jiǎnyàn)样本总体中所含样本的个数而定。
(一)“Anova:
单因素(yīnsù)方差”分析
此分析工具通过简单的方差分析(anova),对两个以上样本均值进行相等性假设检验(抽样取自具有相同均值的样本空间)。
此方法是对双均值检验(如t-检验)的扩充。
“Anova:
单因素方差分析”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
α
在此输入计算F统计临界值的置信度。
Alpha置信度为I型错误发生概率的显著性水平(舍弃真实假设)。
实例应用:
检验某市职工工资总额与商品零售总额是否存在线性关系(数据文件名:
单因素方差分析.xls)。
操作步骤:
1、打开(dǎkāi)数据“单因素(yīnsù)方差分析.xls”,如下(rúxià):
2、选择(xuǎnzé)“数据分析”对话框中“单因素方差分析”,跳出“单因素方差分析”对话框。
3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($B$1:
$C$11)。
4、单击“逐列”选项。
5、选中“标志位于第一行”选项。
6、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:
“方差分析结果”。
7、单击“确定”。
8、数据输出在新创建的工作表“方差分析结果”中,如下:
通过图中显示(xiǎnshì)数据,用户可以看到F值远大于“Fcrit”得知,因此零假设不被接受,说明年度职工工资总额对当前社会商品(shāngpǐn)零售总额是显著的线性相关。
(二)“Anova:
可重复(chóngfù)双因素”分析(fēnxī)
此分析工具是对单因素anova分析的扩展,即每一组数据包含不止一个样本。
“Anova:
可重复双因素分析”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
每一样本的行数
在此输入包含在每个样本中的行数。
每个样本必须包含同样的行数,因为每一行代表数据的一个(yīɡè)副本。
α
在此输入(shūrù)需要用来计算F统计的临界值的置信度。
Alpha置信度为I型错误发生概率的显著性水平(舍弃真实假设)。
实例(shílì)应用:
测试产品不同温度下的强度,将原来8次测试值改为每次试验(shìyàn)得到4个测试值,而实验进行了2次。
对两次试验得到的数据进行样本均值相等的假设检验。
操作步骤:
1、打开数据“双因素方差分析.xls”,选择“可重复双因素方差分析数据”工作表,如下:
2、选择“数据分析”对话框中“可重复双因素方差分析”,跳出“可重复双因素方差分析”对话框。
3、在“输入区域”编辑框中键入三列数据所在的单元格区域引用($A$1:
$C$9)。
4、在“每一样本的行数”对应编辑框中填入4。
5、在“输出选项”下单击“新工作表组”选项,并在对应编辑框中输入新工作表的名称。
如:
“方差分析结果”。
11、单击“确定”。
12、数据输出在新创建的工作表“可重复双因素分析结果”中,如下:
在山图所示结果中给出了3个F值,分别用于不同样本之间的均值相等性假设检验。
如果只是进行(jìnxíng)不同温度下的两组数据之间的均值相等性假设检验,则可以取“列”所对应(duìyìng)的F值,并于同一行中所对应的“Fcrit”值进行比较,从而可以(kěyǐ)判断出该两组数据的均值相等性假设成立。
(三)“Anova:
无重复(chóngfù)双因素”分析
此分析工具通过双因素anova分析(但每组数据只包含一个样本),对两个以上样本均值进行相等性假设检验(抽样取自具有相同均值的样本空间)。
此方法是对双均值检验(如t-检验)的扩充。
“Anova:
无重复双因素分析”对话框
输入区域
在此输入待分析数据区域的单元格引用。
该引用必须由两个或两个以上按列或行组织的相邻数据区域组成。
标志(biāozhì)
如果在输入(shūrù)区域中没有标志项,则本复选框不会被选中,MicrosoftExcel将在输出表中生成适宜的数据标志。
α
在此输入需要用来计算F统计的临界值的置信度。
Alpha置信度为I型错误发生(fāshēng)概率的显著性水平(舍弃真实假设)。
实例(shílì)应用:
无重复双因素方差分析在使用时,不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 excel 操作 32