实验三实验报告.docx
- 文档编号:29312498
- 上传时间:2023-07-22
- 格式:DOCX
- 页数:15
- 大小:64.42KB
实验三实验报告.docx
《实验三实验报告.docx》由会员分享,可在线阅读,更多相关《实验三实验报告.docx(15页珍藏版)》请在冰豆网上搜索。
实验三实验报告
浙江万里学院实验报告
课程名称:
统计实验
实验名称:
实验三参数估计
分组组长:
组员及分工:
一、实验目的和要求
能熟练的用Excel的描述统计工具进行数据的描述和分析,了解Excel中的各种参数估计统计函数,能够运用Excel统计函数对正态单总体参数进行区间估计。
二、实验主要内容
1、综合指标的计算
2、熟悉用于参数估计的各种统计函数
3、正态单总体参数的区间估计
三、基础理论知识
1、总体均值区间估计的基本内容
当总体方差
已知时,总体均值的区间估计
对于给定的显著性水平,可以构造均值的置信区间为:
当总体方差未知时总体均值的区间估计
对于给定的显著性水平,总体均值的置信区间为:
2、必要样本容量的计算公式
样本量
的大小为:
△为抽样极限误差
必要样本容量
与总体方差、抽样极限误差,置信水平之间具有下述关系:
在其他条件不变的情况下,总体方差越大,必要样本容量
越大,必要样本容量与总体方差成正比;置信水平越大,必要样本容量越大,二者成正方向关系;抽样极限误差越大,样本容量就越小,二者成反方向关系。
3、总体比例(成数)区间估计
比例(成数)抽样分布的平均误差为:
比例(成数)置信区间是:
估计总体比例(成数)的必要样本容量
四、实验步骤
(一)综合指标的计算和理解
1、集中趋势的测定与分析
【例10.13】某企业的生产部门使用抽样方法检测一批新产品的质量,该批产品的抗拉强度见原始数据。
管理人员希望知道这批产品的抗拉强度的平均水平,以决定产品质量是否合格。
由此需要计算抗拉强度的均值、中位数与众数。
操作步骤如下:
(1)选择“抗拉强度”工作表。
在单元格A23中输入“均值”,在A24中输入“中位数”,在A25中输入“众数”。
(2)选定单元格B23,插入选均值函数“AVERAGE”。
单击“确定”,则弹出“AVERAGE”函数对话窗口。
(3)在“Number1”区域中输入数据B2:
B21后,对话窗口底部便显示出计算结果。
如果对话窗口中没有计算结果,便说明计算有错误,需要再检查一下。
(4)也可以直接在单元格B7中输入均值函数公式“=AVERAGE(B2:
B21)”,然后敲回车键,得到同样结果。
(5)在单元格B24中输入公式“=MEDIAN(B2:
B21)”计算中位数。
(6)在单元格B25中输入公式“=MODE(B2:
B21))”计算众数。
说明:
在计算众数时,如结果为N/A,说明不存在众数。
均值
38.75
中位数
38.5
众数
29
专业班级:
姓名:
学号:
实验日期:
2、离中趋势的测定与分析
如下图所示,三个不同的曲线表示三个不同的总体,其均值相同,但离中趋势不同。
(1)用Excel函数计算标准差与样本标准差
可以利用Excel来创建公式进行标准差测定,也可以利用Excel中的工作表函数来直接进行计算。
操作步骤如下:
①打开“抗拉强度”工作表。
②单击工具栏中的“函数”快捷按钮,弹出对话框如前述所示的“粘贴函数”的对话框。
在“函数分类”列表中选择“统计”,在“函数名”列表中选择总体标准差函数STDEVP。
③在数据区域中输入B2:
B21,单击“确定”按钮结束。
样本标准差的计算方法与其相同。
总体标准差
10.61544
(2)四分位数与四分位距
将总体分成相等的四个部分的测定数为四分位数。
位于总体第25%位置的数值是第1四分位数Q1,位于总体第50%位置的数值是第2四分位数Q2,位于总体第75%位置的数值是第3四分位数Q3。
四分位距是总体中第3四分位数与第1四分数之差。
四分位距可包括位于总体分布中心的50%,它能集中地反映总体的特征。
仍以抗拉强度为例,计算数据的最小值、第1四分位数、第2四分位数、第3四分位数和四分位距。
①打开“数据描述分析.xls”工作簿,选择“抗拉强度”工作表。
②在单元格A27、A28、A29、A30和A31中分别输入“最小值”、“第1四分位数”、“第2四分位数”、“第3四分位数”、“最大值”和“四分位距”。
③在B27单元格中打开“插入”菜单,单击“函数”选项,在“函数类型”列表中选择“统计”,在“函数名”列表中选择四分位数函数QUARTILE,单击“确定”按钮,进入四分位数对话框窗口。
④在四分位数函数QUARTILE的对话框中,
在Array中输入数据区域B2:
B21;
在Quart中输入0,表示计算最小值或第0四分位数;
单击“确定”按钮,其值便显示在单元格B27中。
⑤在单元格B28中输入“=QUARTILE(B2:
B21,1)”,计算第1四分位数。
⑥在单元格B29中输入“=QUARTILE(B2:
B21,2)”,计算第2四分位数。
⑦在单元格B30中输入“=QUARTILE(B2:
B21,3)”,计算第3四分位数。
⑧在单元格B31中输入“=QUARTILE(B2:
B21,4)”,计算最大值。
⑨在单元格B32中输入“=B30-B28”,计算四分位距。
专业班级:
姓名:
学号:
实验日期:
最小值
22
下四分位数
29.75
中位数
38.5
上四分位数
46.75
最大值
58
四分位差
17
3、分布形态的测定与分析
对于一组数据,不仅要描述其集中趋势、离中趋势,而且也要描述其分布形态。
这是因为一个总体如果均值相同,标准差相同,但也可能分布形态不同。
另外,分布的形态有助于识别整个总体的数量特征。
总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。
前者的测定参数称为偏度或偏斜度,后者的测定参数称为峰度。
在统计分析中,用偏度指标对其进行测定。
偏度数值等于零,说明分布为对称;偏度数值大于零,说明分布呈现右偏态;如果偏度数值小于零,说明分布呈左偏态。
峰度是掌握分布形态的另一个指标,它能够描述分布的平缓或陡峭。
如果峰度数值等于0,说明分布为正态;如果峰度数值大于0,说明分布呈陡峭状态;如果峰度值小于0,则说明分布形态趋于平缓。
仍以抗拉强度为例,计算其偏态与峰度。
计算步骤如下:
①选择“抗拉强度”工作表。
②在A33单元格中输入“偏态”,在B33单元格中输入“=SKEW(B2:
B21)”。
③在A34单元格中输入“峰度”,在B34单元格中输入“=KURT(B2:
B21)”。
从图中偏度与峰度计算结果中可以看出,偏度0.277,说明其分布形态呈轻微右偏态,基本接近于对称分布。
峰度系数为-1.0812,小于0,说明其分布形态趋势于平坦。
偏度
0.277013
峰度
-1.0812
4、利用“描述统计”工具计算描述统计指标
操作步骤如下:
(1)打开学生成绩表。
打开“工具”菜单,选择“数据分析”选项,打开“数据分析”对话框,选择“描述统计”分析工具。
(2)单击“确定”按钮,打开“描述统计”对话框。
在输入区域中输入:
$E$1:
$E$65,分组方式选择“逐列”,选中“标志位于第一行”复选框,若分组方式为“逐行”,则为“标志位于第一列”。
如果输入区域没有标志项,该复选框被清除。
在输出区域中任选一单元格,单击“汇总统计”,如不选此项,则Excel省略部分输出结果。
(3)单击“确定”按钮,将产生输出结果。
在输出结果中:
专业班级:
姓名:
学号:
实验日期:
平均—算术平均数
标准误差—估计标准误差
中值—中位数
模式—众数
标准偏差—样本标准差s
样本方差—
平方
峰值—反映钟形分布峰高的一个指标
偏斜度—反映偏斜程度的一个指标
区域—全距,等于最大值减最小值
计数—单位数
(二)参数估计
1、利用Excel计算总体均值置信区间
(1)总体方差已知的情况
【例10.14】如果有一正态总体,其方差已知为81,采取重复抽样的方法,随机抽取36个样本,其平均数为60,试利用Excel计算总体平均数的95%的置信区间。
根据题目,总体方差已知,所以计算总体平均数的置信区间用下面的公式:
题中已知总体方差=81,
=36,样本平均数=60,F(t)=95%,只需计算Z值就可以得出置信区间。
具体操作步骤:
①打开“参数估计.xls“工作薄,选择“总体方差已知的均值估计”工作表。
②在C2中输入81,在C3中输入36,C4输入60,C5输入95%
③选择C6,插入函数NORMSINV函数。
单击“确定”按钮,打开NORMSINV函数对话框,用此函数计算Z值。
在“Probability”中输入“1-(1-C5)/2”,单击确定按钮,C6显示的值为1.96。
④选中C7,输入“=C4-C6*SQRT(C2/C3)”结果为57.06
⑤选中C8,输入“=C4+C6*SQRT(C2/C3)”结果为62.94
由此得出该总体平均数的置信区间为(57.06,62.94)。
方差
81
样本容量
36
样本均值
60
概率
95%
z
1.959964
57.06005
62.93995
(2)总体方差未知的情况
【例10.15】某工厂检验一批灯泡的质量,抽取10个样本对其耐用小时进行检测,结果如下:
专业班级:
姓名:
学号:
实验日期:
1326133613511365120913431259136513081349
试以95%的置信度估计这批灯泡的平均耐用小时。
【分析】根据题目总体方差未知,所以计算灯泡平均耐用时间的置信区间用下面的公式:
由已知,n=10,F(t)=95%,需要根据已知条件先计算出均值、样本标准差S和t的值,进而根据上面公式得出置信区间。
具体操作步骤如下:
①打开“参数估计.xls“工作薄,选择“总体方差未知的均值估计”工作表。
②选择单元格D1,插入计数函数COUNT。
单击“确定”按钮,打开计数函数对话框。
③在value1中输入数据范围。
单击A列列头,或输入“A:
A”,这相当于选择整个列,包括标题和所有的空单元格。
单击“确定”按钮。
单元格D1中会显示结果为10,即A列中数据的个数。
④在单元格D2中输入公式“=AVERAGE(A:
A)”,计算A列的均值,显示值为1321.1。
在单元格D3中输入公式“=STDEV(A:
A)”,计算A列的标准差,显示值为50.38397。
在单元格D4中输入公式“=D3/SQRT(D1)”,计算标准误差(平均误差),即标准差除以样本容量的平方根,D4中显示15.932.81。
在单元格D5中输入置信度95%。
在单元格D6中使用TINV函数计算在95%置信度和自由度下的t值。
⑤选择单元格D6,插入TINV函数。
单击“确定”按钮,打开TINV函数对话框。
⑥在“Probability”中输入“1-D5”,所显示的值是0.05;在“Deg_freedom"中输
入自由度的表达式,即“D1-1”,所显示值是9,单击“确定”按钮,单元格D6中显示值为2.262159。
在单元格D7中输入计算抽样极限误差的公式,它是t值和标准误差(平均误差)的乘积,公式为“=D6*D4”,显示值为36.04255。
⑧在单元格D8和D9中输入计算置信区间上限和下限的公式,下限为样本均值减抽样极限误差,上限为样本均值加抽样极限误差。
其公式分别为“=D2-D7”和“=D2+D7”,显示值为1285.057和1357.143。
这样,总体均值的95%的置信区间为:
为了进一步理解置信度与置信区间的关系,我们可以分别修改置信度为90%和98%,
来观察置信区间的不同。
得出结论:
置信度越高,下限值越低,上限值越高,置信区间越宽;反之,置信度越低,置信区间越小。
专业班级:
姓名:
学号:
实验日期:
2、样本容量的计算
样本量
的大小为:
从上式可以看出,必要样本容量
与总体方差、抽样极限误差,置信水平之间具有下述关系:
在其他条件不变的情况下,总体方差越大,必要样本容量
越大,必要样本容量与总体方差成正比;置信水平越大,必要样本容量越大,二者成正方向关系;抽样极限误差越大,样本容量就越小,二者成反方向关系。
【例10.16】某快餐店想在置信度为96%的条件下估计午餐时间每位顾客的平均支出,根据过去经验,每个顾客平均支出的标准差约为5元,要抽取多少样本才能使其抽样极限误差不超过2元呢?
【分析】由已知,
=5,△=2,置信度=96%,根据计算样本容量的公式,先求出
的值,进而求出样本容量
的值。
①打开“参数估计.xls”工作簿,选择“样本容量”工作表;
②在单元格B1中输入极限误差2,在单元格B2中输入置信度0.96(或96%),在单元格B3中输入显著水平“=1-B2”。
③在单元格B5中输入标准差5。
单元格B4中需要输入与B2中置信度相对应的
值。
使用NORNSINV函数,可以把概率转换成Z值。
④在单元格B4中输入公式“=NORMSINV(1-B3/2)”,计算与B2的置信度相应的
值。
显示对应于96%的置信度的Z值为2.05。
⑤在B6单元格中根据上面样本容量的计算公式,输入公式“=(B4^2*B5^2)/B1^2”,计算样本容量,显示值为26.36。
⑥在B7单元格输入“=CEILING(B6,1)”,显示值为27。
极限误差
2
置信度
96.00%
显著水平
4.00%
Z值
2.05
样本标准差
5.00
样本容量
26.36177867
样本容量
27.00
3、总体比例(成数)区间估计
【例10.17】某食品厂准备上市一种新产品,并配合以相应的广告宣传,企业想通过调查孩子们对其品牌的认知情况来评估广告的效用,以制定下一步的市场推广计划。
他们在该地区随机抽取350个小孩作访问对象,进行儿童消费者行为与消费习惯调查,其中有一个问句是“你听说过这个牌子吗?
”,在350个孩子中,有112个小孩的回答是“听说过”。
根据这个问句,可以分析这一消费群体对该品牌的认知情况。
所以,食品厂市场部经理要求,根据这些样本,给定95%的置信度,估计该地区孩子认知该品牌的比例(成数)区间。
【分析】根据题目无法算出样本均值,但能够得出样本比例(成数)p=112/350,又知样本个数n=350,置信度为95%,所以可以根据下面的公式求出置信区间。
专业班级:
姓名:
学号:
实验日期:
具体操作步骤:
①打开“参数估计.xls”工作簿,选择“比例估计”工作表;
②在单元格B2中输入n值为350。
③在单元格B3中键入公式“=112/350”,计算得出抽样比例P值为0.32。
④在单元格B4中键入公式“=SQRT(B3*(1-B3)/B2)”计算比例标准误差(平均误差)。
其显示值为0.024934。
⑤在单元格E2中键入置信度0.95。
⑥选定E3单元格,输入公式“=NORMSINV(1-(1-E2)/2)”或“=NORMSINV(E2+(1-E2)/2)
”,便可确定Z值,单元格E3中将显示1.959964。
⑦在E4单元格中输入公式“=E3*B4”,计算极限误差,其结果显示为0.04887。
⑧在单元格E5中输入“=B3-E4”计算估计下限,在E6单元格中输入“=B3+E4”计算估计上限。
结果分别显示为0.27113和0.36887。
五、实验作业
1、网上冲浪者的年龄(资料见excel文件)
据报道,越来越多的人热心于网上冲浪,因为它能够打开空间的界限,带给人许多新的知识。
现随机抽取一些上网人进行调查,得知其年龄数据如下:
22、58、24、50、29、52、57、31、30、41、44、40、46、29、31、37、32、44、49、29。
试根据此样本资料对网上冲浪者的年龄水平的集中趋势和离中趋势给以描述。
最小值
22
第1四分位数
31
第2四分位数
40.5
第3四分位数
46.75
最大值
58
平均数
39.75
中位数
40.5
中位数
40.5
众数
44
标准差
10.23169
全距
36
四分位差
15.75
专业班级:
姓名:
学号:
实验日期:
2、某大学从学生中随机抽取100人进行调查,得知其每天参加体育锻炼的平均时间为26分钟,设已知总体方差为36分钟,要求以95%的置信概率估计全校学生平均每天参加体育锻炼的时间。
(新建表格)
3、随机从一批苗木中抽取16株,测得其高度(单位:
m)为:
1.14,1.10,1.13,1.15,1.20,1.12,1.17,1.19,1.15,1.12,1.14,1.20,1.23,1.11,1.14,1.16.设苗木高度服从正态分布,求总体均值μ的0.95的置信区间(数据见excel作业2)。
单位数n
16
均值
1.153125
标准差
0.036463
标准误差
0.009116
置信度
0.95
t值
2.13145
极限误差
0.01943
估计下限
1.133695
估计上限
1.172555
4、某广告公司要估计某类商店去年平均每家付出多少广告费,已知总体方差为180万元2,如设定置信概率为95%,估计总体均值置信区间的上下限相差在500元以内,要求确定应取多大样本。
专业班级:
姓名:
学号:
实验日期:
极限误差
500
置信度
0.95
显著水平
0.05
Z值
1.959964
标准差
1341.641
样本容量
27.6585
样本容量
28
5、某企业在对职工流动原因的调研中,抽选已调离的职工200人进行访问,有140人回答是因为与管理人员不能融洽相处而离开企业的,要求以95%的置信概率估计全部调离职工中因与管理人员不能融洽相处而离开企业的比例。
(新建表格)
样本容量n
200
样本比例p
0.7
标准误差
0.032404
置信度
0.95
Z值
1.959964
标准极限误差
0.06351
置信下限
0.63649
置信上限
0.76351
五、实验体会
张毅:
通过本次的自主学习作业,我对原本并不是很熟悉的参数估计有了更深入的认识,也能从原来的一窍不通到现在的应用自如,多亏了同学和组长的耐心指导,在我不会的时候积极主动的教我,使我能熟练的用Excel的描述统计工具进行数据的描述和分析,了解Excel中的各种参数估计统计函数,能够运用Excel统计函数对正态单总体参数进行区间估计。
专业班级:
姓名:
学号:
实验日期:
专业班级:
姓名:
学号:
实验日期:
专业班级:
姓名:
学号:
实验日期:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 报告