第十章第二节用样本估计总体.docx
- 文档编号:29096207
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:12
- 大小:160.91KB
第十章第二节用样本估计总体.docx
《第十章第二节用样本估计总体.docx》由会员分享,可在线阅读,更多相关《第十章第二节用样本估计总体.docx(12页珍藏版)》请在冰豆网上搜索。
第十章第二节用样本估计总体
第二节用样本估计总体
重点难点
重点:
用样本的频率分布估计总体分布;用样本的数字特征估计总体的数字特征.
难点:
频率分布直方图的理解和应用.
知识归纳
1.编制频率分布直方图的步骤如下:
①求极差:
极差是一组数据的最大值与最小值的差.
②决定组距和组数:
当样本容量不超过100时,常分成5~12组.
组距=
.
③将数据分组:
通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;
④列频率分布表:
登记频数,计算频率,列出频率分布表.将样本数据分成若干小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组的大小.
⑤绘制频率分布直方图:
把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的
,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.
2.频率分布折线图
(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图.
(2)总体密度曲线
如果样本容量不断增大,分组的组距不断缩小,则频率分布折线图实际上越来越接近于一条光滑曲线,这条光滑的曲线就叫总体密度曲线.
3.茎叶图
统计中还有一种用来表示数据的图叫做茎叶图.
茎是指中间的一列数,叶是从茎的旁边生长出来的数.
在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.
4.平均数、中位数和众数
(1)平均数:
一组数据的总和除以数据的个数所得的商就是平均数.
(2)中位数:
如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.
(3)众数:
出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).
5.方差、标准差
设样本数据为x1,x2,…,xn样本平均数为
,则s2=
·[(x1-
)2+(x2-
)2+…+(xn-
)2]=
[(x
+x
+…+x
)-n
2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.
误区警示
1.对频率分布直方图和茎叶图识图不准是常见的错误.在频率分布直方图中,小矩形的高=
=
.频率=
×组距=小矩形的面积.
2.中位数可能不在样本数据中.
3.计算公式用错或计算错误.计算平均数、方差、标准差等时计算量大,要注意计算结果的准确性.
4.直方图与条形图不要混淆.
解题技巧
1.在频率分布直方图中,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和;中位数的估计值,应使中位数左右两边的直方图面积相等;最高小长方形的中点所对应的数据值即为这组数据的众数.
注意以下结论:
(1)如果x1、x2、…、xn的平均数为
,则ax1+b,ax2+b,…,axn+b的平均数为a
+b.
(2)数据x1、x2、…、xn与数据x1+m、x2+m、…、xn+m的方差相等.
(3)若x1、x2、…、xn的方差为s2,则kx1,kx2,…,kxn的方差为k2s2.
计算方差时,要依据所给数据的特点恰当选取公式以简化计算.
频率分布直方图
[例1] 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图;由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a、b的值分别为( )
A.0.27,78 B.0.27,83
C.2.7,78D.2.7,83
分析:
从图中可知第一组与第二组的频率(频数),结合前4组的频数成等差数列及第四组直方图最高,可求a.因此后6组是已知首项和各项和的等差数列,由等差数列求和公式可求出公差d,最后可求视力在4.6~5.0之间的学生数b,计算时可以用频数计算,也可以用频率计算.
200辆汽车经过某一雷达地区,时速频率分布直方图如下图所示,则时速超过70km/h的汽车数量为( )
A.1辆 B.10辆
C.20辆 D.70辆
某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图).根据频率分布直方图推测这3000名学生在该次数学考试中成绩小于60分的学生数是________.
茎叶图
[例2] 下图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )
A.304.6B.303.6
C.302.6D.301.6
在如下图所示的茎叶图中,若甲、乙两组数据的中位数分别为λ1,λ2,平均数分别为μ1,μ2,则下列判断正确的是( )
A.λ1>λ2,μ1<μ2
B.λ1>λ2,μ1>μ2
C.λ1<λ2,μ1<μ2
D.λ1<λ2,μ1>μ2
样本平均数与样本方差
[例3] 某人5次上班途中所花的时间(单位:
分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.1B.2
C.3D.4
在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )
A.92,2B.92,2.8
C.93,2D.93,2.8
已知数据x1、x2、x3、x4、x5是互不相等的正整数,且
=3,中位数是3,则这组数据的方差是________.
用样本估计总体
[例4] 要加工一圆形零件,按图纸要求,直径为10mm,现在由甲、乙两人加工此种零件,在他们的产品中各抽5件测得直径如下:
甲:
10.05 10.02 9.97 9.96 10.00
乙:
10.00 10.01 10.02 9.97 10.00
问甲、乙两人谁生产的零件较好?
点评:
一组数据的方差,刻画了这组数据波动的大小(即各数据偏离平均数的大小,也称离散性、差异性)方差越大,说明这组数据的波动越大,即这组数据越分散.
(1)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:
环):
甲
10
8
9
9
9
乙
10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
(2)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.
(1)假设n=2,求第一大块地都种植品种甲的概率;
(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地的每公顷产量(单位:
kg/hm2)如下表:
分别求出品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?
附:
样本数据x1,x2,…,xn的样本方差s2=
[(x1-
)2+(x2-
)2+…+(xn-
)2],其中
为样本平均数.
综合应用
[例5] 汽车是碳排放量比较大的行业之一,欧盟规定,从2012年开始,将对CO2排放量超过130g/km的M1型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类M1型车抽取5辆进行CO2排放量检测,记录如下(单位:
g/km):
甲
80
110
120
140
150
乙
100
120
x
y
160
经测算发现,乙品牌车CO2排放量的平均值为x乙=120g/km.
(1)从被检测的5辆甲类品牌中任取2辆,则至少有一辆CO2排放量超标的概率是多少?
(2)若乙类品牌的车比甲类品牌的车CO2的排放量的稳定性要好,求x的取值范围.
某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:
千克)如下:
品种A:
357,359,367,368,375,388,392,399,
400,405,412,414,415,421,423,423,
427,430,430,434,443,445,445,451,454
品种B:
363,371,374,383,385,386,391,392,
394,394,395,397,397,400,401,401,
403,406,407,410,412,415,416,422,430
(1)画出A、B的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
甲、乙两种鱼的身体吸收汞,当汞的含量超过体重的1.00ppm(即百万分之一)时,就会对人体产生伤害.质检部门对市场中出售的一批鱼进行检测,在分别抽取的10条鱼的样本中,测得汞含量与鱼体重的百分比如下:
甲种鱼1.31 1.55 1.42 1.35 1.27
1.44 1.28 1.37 1.36 1.14
乙种鱼1.01 1.35 0.95 1.16 1.24
1.08 1.17 1.03 0.60 1.11
(1)用前两位数做茎,画出样本数据的茎叶图,并回答下面两个问题:
①写出甲、乙两种鱼关于汞分布的一个统计结论.
②经过调查,市场上出售汞超标的鱼的原因是这些鱼在出售前没有经过检验,可否得出每批这两种鱼的平均汞含量都超过1.00ppm?
(2)如果在样本中选择甲、乙两种鱼各一条做一道菜,(在烹饪过程中汞含量不会发生改变)
①如果20条鱼中的每条鱼的重量都相同,那么这道菜对人体产生危害的概率是多少?
②根据算出的结论,你对政府监管部门有什么建议?
(提出一条建议即可)
一、选择题
1.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
2.学校为了调查学生在课外读物方面的支出情况,抽出一个容量为n且支出在[20,60)的样本,其频率分布直方图如下图所示,其支出在[50,60)的同学有30个,则n的值为( )
A.90B.100
C.900D.1000
3.在某次测验中,有6位同学的平均成绩为75分,用xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:
编号n
1
2
3
4
5
成绩xn
70
76
72
70
72
(1)求第6位同学的成绩x6,及这6位同学成绩的标准差s;
(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 第二 节用 样本 估计 总体