样本估计总体教师.docx
- 文档编号:30271177
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:15
- 大小:215.99KB
样本估计总体教师.docx
《样本估计总体教师.docx》由会员分享,可在线阅读,更多相关《样本估计总体教师.docx(15页珍藏版)》请在冰豆网上搜索。
样本估计总体教师
抽样方法与统计
一、随机抽样
1.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随
机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
总体中的个体数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分中抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,分层进行抽样
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2.抽样方法中的计算问题
(1)三种抽样都是等_________抽样,即在整个抽样过程中每个个体被抽到的概率是____的,且P=_________,其中n是样本容量,N是总体容量.
(2)对于系统抽样,若抽样的间距为d,在第1个小组抽取的样本编号为k0,则在其他各组抽取的样本编号为k0+(i-1)d,i=2,3,….
二、频率分布直方图
1.定义:
反映样本频率分布规律的直方图称为频率分布直方图.画图时,应以横轴表示数据值,纵轴表示_______与_________的比值,以每个组距为底,以各频率除以组距的商为高,分别画成矩形,这样得到的直方图就是频率分布直方图.
2.作频率分布直方图的步骤
(1)求极差,即一组数据中________和_________的差.
(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.这时应注意:
①一般样本容量越大,所分组数越多;②为方便起见,组距的选择应力求“取整”;③当样本容量不超过100时,按照数据的多少,通常分成5~12组.
(3)将数据分组.
(4)计算各小组的频率,作频率分布表.
各小组的频率=____________________.
(5)画频率分布直方图.
3.在频率分布直方图中,每个小矩形的面积表示样本数据落在相应范围内的_______,所有小矩形的面积之和等于_____.
三、茎叶图
1.茎叶图:
统计图中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
2.用茎叶图表示数据有两个优点:
一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.
3.在根据茎叶图求数据的中位数时要注意:
先观察茎叶图中的数据是否已按大小进行了排序,若没有按大小进行排序,应先进行排序,再寻找中间位置上的数,否则可能会出现错误.
四、样本的数字特征
1.众数
在样本数据中,出现次数________的那个数据.
2.中位数
样本数据中,将数据按大小排列,位于最______的数据.如果数据的个数为偶数,就取中间两个数据的___________作为中位数.
3.平均数
样本数据的算术平均数,即____=________________
4.方差与标准差
方差:
________________________________________
标准差:
s=___________________________________.
5.注意以下两点:
(1)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越____,越_______;标准差、方差越小,数据的离散程度越_____,越_______.
(2)已知样本数据求出的平均数是一个实际值,而频率分布直方图中用组中值×频率求和得到的平均数仅是一个估计数字,与实际值有一定的误差.
抽样方法
1.(2012年莆田市高三质检)某社区有480户家庭,其中中等收入家庭200户,低收入家庭160户,其他为高收入家庭.若在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则在该次调查中该社区被抽取的总户数为( )
(A)20(B)24(C)30(D)36
2.(2012年皖南八校高三第二次联考)据报道,德国“伦琴”(ROSAT)卫星在2011年10月23日某时落在地球的某个地方,砸中地球人的概率约为,为了研究中学生对这件事情的看法,某中学对此事进行了问卷调查,共收到2000份有效问卷,得到如下结果.
对卫星撞
地球的态度
关注但
不担心
关注有
点担心
关注且
非常担心
不关注
人数(人)
1000
500
x
300
则从收到的2000份有效问卷中,采用分层抽样的方法抽取20份,抽到的关注且非常担心的问卷份数为( )
(A)2(B)3(C)5(D)10
统计图表与数字特征
3.(2011年陕西省高三质检)如图,是某市甲乙两地五月上旬日平均气温的统计图,则甲乙两地这十天的日平均气温的平均数,和日平均气温的标准差s甲,s乙的大小关系应为( )
(A)=,s甲>s乙(B)=,s甲
(C)>,s甲,s甲>s乙
4.(2012年淮北市高三第一次模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是__________________.
0
7 8 9 9 9
1
0 1 2 2 3
①众数是9;②平均数是10;③中位数是9或10;
④标准差是3.4.
5.(2012年安徽省“江南十校”高三联考)根据《中华人民共和国道路交通安全法》规定:
车辆驾驶员血液酒精浓度在20~80mg/100mL(不含80)之间,属于酒后驾车;血液酒精浓度在80mg/100mL(含80)以上时,属醉酒驾车.据有关报道,在某个时期某地区查处酒后驾车和醉酒驾车共500人,如图是对这500人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为 .
6.(2012年肇庆市高三第一次模考)某中学举行了一次田径运动会,其中有50名学生参加了一次百米比赛,他们的成绩和频率如图所示.若将成绩小于15秒作为奖励的条件,则在这次百米比赛中获奖的人数共有 人.
7.(2012年石家庄市高中毕业班教学质量检测)某班甲、乙两名同学参加100米训练,在相同条件下两人10次训练的成绩(单位:
秒)如下:
1
2
3
4
5
6
7
8
9
10
甲
11.6
12.2
13.2
13.9
14.0
11.5
13.1
14.5
11.7
14.3
乙
12.3
13.3
14.3
11.7
12.0
12.8
13.2
13.8
14.1
12.5
(1)请画出适当的统计图;如果从甲、乙两名同学中选一名参加学校的100米比赛,从成绩的稳定性方面考虑,选派谁参加比赛更好,并说明理由(不用计算,可通过统计图直接回答结论).
(2)经过对甲、乙两位同学的若干次成绩的统计,甲、乙的成绩都均匀分布在[11.5,14.5]之间,现甲、乙比赛一次,求甲、乙成绩之差的绝对值小于0.8秒的概率.
8.(2012年江西卷,文6,5分)小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )
(A)30%(B)10%(C)3%(D)不能确定
9.如图所示是某公司(共有员工300人)2010年员工年薪情况的频率分布直方图,由此可知,员工中年薪在1.4万元~1.6万元之间的共有_________人.
10.(2011年湖北卷,文5)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )
(A)18(B)36(C)54(D)72
11.(2011年江西卷,文7)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为,则( )
(A)me=m0=(B)me=m0<
(C)me 12.(2012年山东卷,文14,4分)如图是根据部分城市某年6月份的平均气温(单位: ℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____________. 13.(2012年广东卷,文13,5分)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________________________.(从小到大排列) 14.(2010年福建卷,文14)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于_______________. 15. (2012年广东卷,文17,13分)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是: [50,60),[60,70),[70,80),[80,90),[90,100]. (1)求图中a的值; (2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数. 分数段 [50,60) [60,70) [70,80) [80,90) x∶y 1∶1 2∶1 3∶4 4∶5 16.(2012年安徽卷,文18,13分)若某产品的直径长与标准值的差的绝对值不超过1mm时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品,计算这50件不合格品的直径长与标准值的差(单位: mm),将所得数据分组,得到如下频率分布表: 分组 频数 频率 [-3,-2) 0.10 [-2,-1) 8 (1,2] 0.50 (2,3] 10 (3,4] 合计 50 1.00 (1)将上面表格中缺少的数据填在答题卡的相应位置; (2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品,据此估算这批产品中的合格品的件数. 17.(2011年广东卷,文17)在某次测验中,有6位同学的平均成绩为75分,xn表示编号为n(n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下: 编号n 1 2 3 4 5 成绩xn 70 76 72 70 72 (1)求第6位同学的成绩x6及这6位同学成绩的标准差s; (2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率. 18.(2010年安徽卷,文18)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. (1)完成频率分布表; (2)作出频率分布直方图; (3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价. 19.(2010年陕西卷,文19)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下: (1)估计该校男生的人数; (2)估计该校学生身高在170~185cm之间的概率; (3)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率. 20某中学团委组织了“我对祖国知多少”的知识竞赛,从参加竞赛的学生中抽出60名学生,将其成绩(均为整数)分成六组[40,50),[50,60),…,[90,100],其部分频率分布直方图如图所示.观察图形,回答下列问题. (1)求成绩在[70,80)的频率,并补全这个频率分布直方图; (2)估计这次考试的及格率(60分及以上为及格)和平均分(计算时可以用组中值代替各组数据的平均值); (3)从成绩在[40,50)和[90,100]的学生中选两人,求他们在同一分数段的概率. 古典概型的概率 【例】有两个箱子,里面各装有编号为1,2,3,4,5,6的6个小球,所有的球除编号外完全相同,现从两个箱子里各摸一个球,称为一次试验.若摸出的两个球的编号之和为5,则中奖.求一次试验中奖的概率. 注意区分相近的概念 易混一: “非等可能”与“等可能”混同 【例】掷两枚骰子,求所得的点数之和为6的概率. B.A.A.①②.75.117.解: (1)画出茎叶图 从统计图中可以看出,乙的成绩较为集中,差异程度较小,应选派乙同学参加比赛更好; (2)设甲同学的成绩为x,乙同学的成绩为y,则|x-y|<0.8,得-0.8+x 如图阴影部分面积即为3×3-2.2×2.2=4.16, 则P(|x-y|<0.8)=P(-0.8+x 即甲、乙成绩之差的绝对值小于0.8秒的概率为. C.72.B.D.9 13.解由题,设x1≤x2≤x3≤x4,则x1+x2+x3+x4=8,x2+x3=4,=1, 即(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2=4,联立解得x1=1,x2=1,x3=3,x4=3. 14.答6015.解: (1)由(2a+0.02+0.03+0.04)×10=1知a=0.005. (2)估计这100名学生的平均分为: 55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=7.5+26+22.5+17=73(分). (3)由频率分布直方图知,语文成绩在[50,60)之间的人数为100×0.05=5,[60,70)之间的人数为100×0.4=40,[70,80)之间的人数为100×0.3=30,[80,90)之间的人数为100×0.2=20,故数学成绩在这几个分数段内的人数分别为5,20,40,25,总人数为90,故在[50,90)之外的人数为100-90=10. 16.解: (1)频率分布表 分组 频数 频率 [-3,-2) 5 0.10 [-2,-1) 8 0.16 (1,2] 25 0.50 (2,3] 10 0.20 (3,4] 2 0.04 合计 50 1.00 (2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70; (3)设这批产品中的合格品数为x,依题意有=, 解得x=-20=1980.所以该批产品的合格品件数估计是1980. 17.解: (1)∵==75,∴x6=6×75-(70+76+72+70+72)=90, ∴s2=×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2] =×(25+1+9+25+9+225)=49, ∴s==7.即这6位同学成绩的标准差为7. (2)从5位同学中随机选两位有: (1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)共10种可能情况,记事件A=“恰有一位同学成绩在(68,75)”,A包含(1,2),(2,3),(2,4),(2,5)共4种可能情况,∴P(A)==.即恰有1位同学成绩在区间(68,75)的概率为. 18.解: (1)频率分布表: 分组 频数 频率 [41,51) 2 [51,61) 1 [61,71) 4 [71,81) 6 [81,91) 10 [91,101) 5 [101,111] 2 (2)频率分布直方图如图所示: (3)答对下述两条中的一条即可: ①该市一个月中空气污染指数有2天处于优的水平,占当月天数的.有26天处于良的水平,占当月天数的,处于优或良的天数为28天,占当月天数的.说明该市空气质量基本良好. ②轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数共17天,占当月天数的,超过50%.说明该市空气质量有待进一步改善. 19.解: (1)样本中男生人数为40, 由分层抽样比例为10%估计全校男生人数约为400. (2)由统计图知,样本中身高在170~185cm之间的学生有14+13+4+3+1=35(人),因为样本容量为70, 所以样本中学生身高在170~185cm之间的频率f==0.5, 故由频率f估计该校学生身高在170~185cm之间的概率P1=0.5. (3)样本中身高在180~185cm之间的男生有4人,设其编号为①,②,③,④, 样本中身高在185~190cm之间的男生有2人,设其编号为⑤,⑥, 从上述6人中任取2人的树状图为: 故从样本中身高在180~190cm之间的男生中任选2人的所有可能结果数为15,至少有1人身高在185~190cm之间的可能结果数为9,因此,所求概率P2==. 20.解: (1)因为各组的频率和等于1, 故成绩在[70,80)的频率是1-(0.025+0.015×2+0.01+0.005)×10=0.3. 频率分布直方图如图所示: (2)依题意,60分及以上的分数在[60,70),[70,80),[80,90),[90,100]这四个组,其频率和为(0.015+0.03+0.025+0.005)×10=0.75.所以估计这次考试的及格率是75%. 利用组中值估算学生成绩的平均分,则有 45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71. 所以估计这次考试的平均分是71分. (3)成绩在[40,50)的人数是60×0.1=6,成绩在[90,100]的人数是60×0.05=3, 所以从成绩在[40,50)与[90,100]的学生中选两人,他们在同一分数段的概率是P=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 总体 教师
