必修3 用样本估计总体.docx
- 文档编号:23843378
- 上传时间:2023-05-21
- 格式:DOCX
- 页数:13
- 大小:156.94KB
必修3 用样本估计总体.docx
《必修3 用样本估计总体.docx》由会员分享,可在线阅读,更多相关《必修3 用样本估计总体.docx(13页珍藏版)》请在冰豆网上搜索。
必修3用样本估计总体
用样本估计总体
用样本的频率分布估计总体的分布:
频率分布图、频率分布直方图、频率折线图、茎叶图
用样本的数字特征估计总体的特征:
众数、中位数、平均数、极差、方差、标准差
频率分布表:
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.
频率分布直方图
频率分布的概念:
指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.
编制频率分布直方图的步骤:
①求极差:
最大值-最小值
②决定组距与组数(注意取整):
当样本容量不超过100时,按照数据的多少,常分成5至12组,组数=
③将数据分组(给出组的界限)
④列频率分布表(包括分组、频数、频率、频率/组距)
⑤画频率分布直方图.
注意:
①在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1;
②在频率分布直方图中,中位数左边和右边的直方图的面积相等;
③频率=
=小矩形的面积;
④平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标的和;
⑤众数是出现次数最多的,在直方图中,高度最高的小矩形的中间值的横坐标即为众数;
⑥中位数是所有数据中的中间值,在直方图中,体现的是中位数的左右两边频数应用相等,即频率相等,从而就是小矩形的面积和相等,此在频率分布直方图中,将频率分布直方图中所有小矩形面积一分为二的直线所对应的成绩即为所求.
频率分布折线图:
把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图.
总体密度曲线:
如果样本不断增大,分组的组数增加,组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,它可以用一条光滑曲线y=f(x)来描绘,这条光滑的曲线就叫总体密度曲线.
茎叶图:
统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.
制作茎叶图的方法是:
将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出,共茎的叶按从大到小(或从小到大)的顺序同行列出.
四种图表的区别与联系
名称
区别
频率分布图
从数量上比较准确地反映样本的频率分布规律
频率分布直方图
直观地反映样本的频率分布情况
频率分布折线图
反映了数据的变化趋势
总体密度曲线
虽然客观存在,但是要准确画出难度很大,只能用样本频率分布估计,样本容量越大,估计越准确
几种表示样本分布方法的比较
名称
优点
缺点
频率分布表
在数量表示上比较确切
不够直观、形象,损失了样本的一些信息,分析数据分布的总体情况不够方便
频率分布直方图
能够很容易的表示大量数据,非常直观地表示数据分布的情况,使我们能够看到在频率分布表中看不到的数据模式
从直方图本身不能得出原始的数据内容,把数据表示成直方图后,原有的数据信息被抹掉了
频率分布折线图
反映了数据的变化趋势
原有的具体数据信息被抹掉了
茎叶图
①由所有样本数据构成,没有原始信息的损失
②便于记录和表示
③能够展示数据的分布情况
只方便记录两组数据,当样本数据较多时,茎叶图就显得不够方便
频数:
将一批数据按照要求分成若干组,各组内数据的个数叫做该组的频数.
频率:
每组的频数除以全体数据个数得到该组的频率,即表示该组数据在样本中所占的比例大小.
众数:
一组数据中出现次数最多的数据;
中位数:
将一组数据按大小顺序排列,处在最中间的一个数据(数据个数为奇数时)或最中间的两个数据的平均数(数据个数为偶数时)叫做这组数据的中位数.
平均数:
众数、中位数与平均数的优缺点
名称
优点
缺点
众数
①体现样本数据的最大集中点;
②容易计算.
①只能表达样本数据中很少的一部分信息;
②无法客观地反映总体特征.
中位数
①不受少数几个极端数据,即排序靠前或靠后的数据的影响;
②容易计算.
对极端值不敏感
平均数
反映出更多的关于样本数据全体的信息
①任何一个数据的改变都会引起平均数的改变;
②数据越“离群”,对平均数的影响越大.
平均距离、方差、标准差
设样本数据为x1,x2,…,xn,样本平均数为
,
平均距离:
方差:
,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.
标准差:
(方差的算术平方根)
数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度;方差则反映一组数据围绕平均数波动的大小;标准差是样本数据到平均数的一种平均距离.
课堂练习
1.关于频率直方图的下列有关说法正确的是( )
A.直方图的高表示取某数的频率
B.直方图的高表示该组上的个体在样本中出现的频率
C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值
D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值
2.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是()
A.频率分布折线图与总体密度曲线无关
B.频率分布折线图就是总体密度曲线
C.样本容量很大的频率分布折线图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线
3.一个容量为20的样本数据,分组后组距与频数如下表.
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70)
频数
2
3
4
5
4
2
则样本在区间[10,50)上的频率为()
A.0.5B.0.25C.0.6D.0.7
4.运动鞋员参加体操比赛,当评委亮分后,往往是先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是为了( )
A.减少计算量 B.避免故障 C.剔除异常值 D.活跃赛场气氛
5.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各有1人,则该小组数学成绩的平均数、众数、中位数分别是( )
A.85,85,85B.87,85,86C.87,85,85D.87,85,90
6.从某小学随机抽取100名同学,将他们身高(单位:
厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=______.若要从身高在[120,130﹚,[130,140﹚,[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为_______.
7.甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为______和______.
8.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:
mm),设计了如下茎叶图
根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:
(1)________________________________________________;
(2)________________________________________________.
9.从甲、乙两人手工制作的圆形产品中,各自随机抽取6件,测得其直径如下(单位:
cm):
甲:
9.00,9.20,9.00,8.50,9.10,9.20
乙:
8.90,9.60,9.50,8.54,8.60,8.90
据以上数据估计两人的技术稳定性,结论是()
A.甲优于乙B.乙优于甲C.两人没区别D.无法判断
10.某射击小组有20人,教练根据他们某次射击的数据绘制如图所示的统计图,则这组数据的众数和中位数分别是()
A.7,7B.8,7.5C.7,7.5D.8,6
11.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图,估计这次测试中数学成绩的平均分、众数、中位数分别是()
A.73.3,75,72B.72,75,73.3C.75,72,73.3D.75,73.3,72
12.如图①是某城市三月份1至10日的最低气温随时间变化的图象.
(1)根据图①提供的信息,在图②中补全直方图;
(2)这10天最低气温的众数是______摄氏度,最低气温的中位数______摄氏度,最低气温的平均数是_____摄氏度.
13.为迎接国庆,某校举行以“祖国成长我成长”为主题的图片制作比赛,赛后整理参赛同学的成绩,并制作成图表如下:
分数段
频数
频率
60⩽x<70
30
0.15
70⩽x<80
m
0.45
80⩽x<90
60
n
90⩽x<100
20
0.1
请根据以上图表提供的信息,解答下列问题:
(1)表中m和n所表示的数分别为:
m=_____,n=_____;
(2)请在图中,补全频数分布直方图;
(3)比赛成绩的中位数落在分数段是___________;
(4)若该校共有3600名学生,且规定比赛成绩80分以上(含80分)可以获得奖励,请根据上述调查结果估计该校,那么全校共有多少学生获奖?
课后练习
1.一个容量100的样本,其数据的分组与各组的频数如下表
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40)上的频率为()
A.0.13B.0.39C.0.52D.0.64
2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:
[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()
A.588B.480C.450D.120
3.为了调查学生每天零花钱的数量(钱数取整数元),以便引导学生树立正确的消费观.样本容量1000的频率分布直方图如图所示,则样本数据落在[6,14)内的频数为 ( )
A.780B.680C.648D.460
4.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为______.
5.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是______.
6.重庆市2013年各月的平均气温(°C)数据的茎叶图如下:
0
8
9
1
2
5
8
2
0
0
3
3
8
3
1
2
则这组数据中的中位数是 ( )
A.19B.20C.21.5D.23
7.对某商店一个月30天内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()
A.46,45,56B.46,45,53C.47,45,56D.45,47,53
8.在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1∼35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是_____.
9.右图是某赛季甲、乙两名篮球运动员参加的每场比赛 得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()
A.65 B.64 C.63 D.62
10.在抽查某批产品尺寸的过程中,样本尺寸数据的频率分布表如下,则m等于()
分组
[100,200]
(200,300]
(300,400]
(400,500]
(500,600]
(600,700]
频数
10
30
40
80
20
m
频率
0.05
0.15
0.2
0.4
a
b
A.10B.20C.30D.40
11.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a、b分别是()
A.32,0.4B.8,0.1C.32,0.1D.8,0.4
12.样本中五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()
A.
B.
C.
D.2
13.某部门计划对某路段进行限速,为调查限速60km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图,则这300辆汽车中车速低于限速的汽车有______辆.
14.某部门计划对某路段进行限速,为调查限速60km/h是否合理,对通过该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70),[70,80]分组,绘制成如图所示的频率分布直方图。
则这300辆汽车中车速低于限速的汽车有()
A.75辆B.120辆C.180辆D.270辆
15.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:
万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=_____.
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为______.
16.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),…[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的a值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数。
说明理由;
(3)估计居民月均用水量的中位数.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 必修3 用样本估计总体 必修 样本 估计 总体