112 用样本估计总体.docx
- 文档编号:4944138
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:14
- 大小:178.65KB
112 用样本估计总体.docx
《112 用样本估计总体.docx》由会员分享,可在线阅读,更多相关《112 用样本估计总体.docx(14页珍藏版)》请在冰豆网上搜索。
112用样本估计总体
1.作频率分布直方图的步骤
(1)求极差(即一组数据中________与________的差).
(2)决定________与________.
(3)将数据________.
(4)列________________.
(5)画________________.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的________,就得到频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的________增加,________减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
4.标准差和方差
(1)标准差是样本数据到平均数的一种______________.
(2)标准差:
s=________________________________________________________________________.
(3)方差:
s2=_______________________________________________________________
(xn是样本数据,n是样本容量,
是样本平均数).
【知识拓展】
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示
,频率=组距×
.
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为
,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m
+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
【思考辨析】
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( )
1.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
2.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93B.123C.137D.167
3.(2016·四川宜宾模拟)若数据x1,x2,x3,…,xn的平均数为
=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2B.16,2
C.16,18D.16,9
4.(2016·江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
5.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:
cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
题型一 频率分布直方图的绘制与应用
例1 (2016·北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
思维升华
(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?
说明理由.
题型二 茎叶图的应用
例2
(1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:
℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③B.①④C.②③D.②④
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:
分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5B.5,5
C.5,8D.8,8
引申探究
1.本例
(2)中条件不变,试比较甲、乙两组哪组成绩较好.
2.在本例
(2)条件下:
①求乙组数据的中位数、众数;②求乙组数据的方差.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(1)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A.
B.
C.36D.
题型三 用样本的数字特征估计总体的数字特征
例3
(1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:
环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
①分别求出两人得分的平均数与方差;
②根据图和上面算得的结果,对两人的训练成绩作出评价.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2016·全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得以下柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:
元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
9.高考中频率分布直方图的应用
考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
典例 (12分)(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
规范解答:
提醒:
完成作业 第十一章 §11.2
答案精析
基础知识 自主学习
知识梳理
1.
(1)最大值 最小值
(2)组距 组数 (3)分组 (4)频率分布表 (5)频率分布直方图
2.
(1)中点
(2)组数 组距
4.
(1)平均距离
(2)
(3)
[(x1-
)2+(x2-
)2+…+(xn-
)2]
思考辨析
(1)√
(2)× (3)√ (4)× (5)√ (6)×
考点自测
1.A 2.C 3.C 4.0.1 5.24
题型分类 深度剖析
例1 解
(1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即该市居民该月的人均水费估计为10.5元.
跟踪训练1 解
(1)如图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均数高于A地区用户满意度评分的平均数;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:
“A地区用户的满意度等级为不满意”;CB表示事件:
“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
例2
(1)B
(2)C
引申探究
1.解 由原题可知x=5,
则甲组平均数为
=17.4.
而乙组平均数为16.8,所以甲组成绩较好.
2.解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
故中位数为18,众数为18.
②s2=
[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]
=23.76.
跟踪训练2
(1)A
(2)B
例3
(1)2
(2)解 ①由图象可得甲、乙两人五次测试的成绩分别为
甲:
10分,13分,12分,14分,16分;
乙:
13分,14分,12分,12分,14分.
甲=
=13;
乙=
=13,
s
=
[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;
s
=
[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
②由s
>s
,可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
跟踪训练3 解
(1)当x≤19时,y=3800;
当x>19时,y=3800+500(x-19)=500x-5700.
所以y与x的函数解析式为
y=
(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为
(3800×70+4300×20+4800×10)=4000(元),
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为
(4000×90+4500×10)=4050(元).
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
高频小考点
典例 解
(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.[3分]
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.[5分]
(2)由
(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.[8分]
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为
0.04+0.08+0.15+0.21=0.48<0.5.
所以2≤x<2.5.
由0.50×(x-2)=0.5-0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.[12分]
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 112 用样本估计总体 样本 估计 总体