第1讲抽样方法与总体分布的估计.pptx
- 文档编号:30846398
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:38
- 大小:1.15MB
第1讲抽样方法与总体分布的估计.pptx
《第1讲抽样方法与总体分布的估计.pptx》由会员分享,可在线阅读,更多相关《第1讲抽样方法与总体分布的估计.pptx(38页珍藏版)》请在冰豆网上搜索。
第第1讲抽样方法与总体分布的估计讲抽样方法与总体分布的估计【2014年高考会这样考】年高考会这样考】1考查三种抽样方法及其应用2考查频率分布直方图中的相关计算(求解频率、频数等)3考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等)考点梳理考点梳理类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等,均属于不放回抽样从总体中逐个抽取总体中的个体数较少将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多系统抽样分层抽样将总体分成几层,分层进行抽样各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成1.三种抽样方法的比较三种抽样方法的比较
(1)当总体很大或不便获得时,可以用样本的频率分布去估计总体的频率分布,我们把反映样本频率分布的表格称为频率分布表绘制频率分布表的步骤为:
_;_;_;_.求极差决定组距和组数将数据分组列频率分布表12.频率分布直方图与茎叶图频率分布直方图与茎叶图
(2)利用直方图反映样本的频率分布,这样的直方图称为频率利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图画频率分布直方图的一般步骤是:
分布直方图画频率分布直方图的一般步骤是:
绘制频率分绘制频率分布表;布表;作直角坐标系,把横轴分成若干段,每一段对应一个作直角坐标系,把横轴分成若干段,每一段对应一个组的组距;组的组距;在上面标出的各点中,分别以相邻两点为端点的在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的线段为底作矩形,它的高等于该组的频率频率组距组距.此时,每个矩形的此时,每个矩形的面积恰好就是该组的频率,显然所有矩形的面积之和为面积恰好就是该组的频率,显然所有矩形的面积之和为_.
(1)众数在样本数据中,出现次数最多的那个数据
(2)中位数样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数3样本的数字特征样本的数字特征样本数据的算术平均数,即_(4)方差与标准差方差:
s2_标准差:
s_.(3)平均数1n(x1x2xn)x1n(x1x)2(x2x)2(xnx)21nx1x2x2x2xnx2一条规律一条规律【助学【助学微博】微博】两个特性两个特性
(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样本容量,各小组频率的和等于1;
(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于该组的频率,所有小矩形的面积之和为1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是nN.1(2012山东山东)采用系统抽样方法从960人中抽取32人做问卷调查为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()考点自测考点自测A7B9C10D15答案答案C解析解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an930(n1)30n21,由45130n21750,得23615n25710,所以n16,17,25,共有2516110人,选C.2(2013临沂模拟临沂模拟)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三校分别抽取的学生人数是()A30,30,30B30,45,15C20,30,10D30,50,10答案答案B解析解析抽取比例是903600540018001120,故三校分别抽取的学生人数为3600112030,5400112045,1800112015.310名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是()A14B16C15D17答案答案C解析解析将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为1515215.4(2013西北工大附中测试西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据落在6,10)内的频数为()A12B48C60D80解析解析落在6,10)内的频率为0.0840.32,故频数为0.3215048.答案答案B5(2013长沙模拟长沙模拟)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_答案答案6.8(注:
方差注:
方差s21n(x1x)2(x2x)2(xnx)2,其中其中x为为x1,x2,xn的平均数的平均数)解析解析x15(89101315)11,s215(941416)6.8.审题视点审题视点因为802不能整除80,为了保证“等距”分段,应先剔除2个个体考向一考向一抽样方法抽样方法【例【例1】从某厂生产的802辆轿车中抽取80辆测试某项性能请合理选择抽样方法进行抽样,并写出抽样过程第三步:
从第1段即1,2,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:
从5开始,再将编号为15,25,795的个体抽出,得到一个容量为80的样本解解由于总体及样本中的个体数较多,且无明显差异,因此由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:
采用系统抽样的方法,步骤如下:
第一步:
先从第一步:
先从802辆轿车中剔除辆轿车中剔除2辆轿车辆轿车(剔除方法可用随机剔除方法可用随机数法数法);第二步:
将余下的第二步:
将余下的800辆轿车编号为辆轿车编号为1,2,800,并均匀,并均匀分成分成80段,每段含段,每段含k8008010个个体;个个体;解决系统抽样问题的两个关键步骤为:
(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本
(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了答案答案189【训练训练1】(2012天津天津)某地区有小学150所,中学75所,大学25所现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校解析解析根据分层抽样的特点求解从小学中抽取30150150752518所学校;从中学中抽取307515075259所学校考向二考向二频率分布直方图的绘制及应用频率分布直方图的绘制及应用【例例2】某班同学利用国庆节进行社会实践,对25,55岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观“”念的调查,若生活习惯符合低碳观念,称为低碳族,否“”则称为非低碳族,得到如下统计表和各年龄段人数频率分布直方图:
组数分组低碳族的人数占本组的频率第一组25,30)1200.6第二组30,35)195p第三组35,40)1000.5第四组40,45)a0.4第五组45,50)300.3第六组50,55150.3
(1)补全频率分布直方图;
(2)求n,a,p的值审题视点审题视点
(1)要补全频率分布直方图,关键是计算出第二组的频率;
(2)灵活运用关系式:
频率组距组距频率,频数样本容量频率求解解解
(1)第二组的频率为第二组的频率为1(0.040.040.030.020.01)50.3,所以小长方形的高为,所以小长方形的高为0.350.06.频率分布直方频率分布直方图如图所示图如图所示
(2)第一组的人数为第一组的人数为1200.6200,频率为,频率为0.0450.2,所以所以n2000.21000.由由
(1)知,第二组的频率为知,第二组的频率为0.3,所以第二组的人数为,所以第二组的人数为10000.3300,所以,所以p1953000.65.第四组的频率为第四组的频率为0.0350.15,所,所以第四组的人数为以第四组的人数为10000.15150,所以,所以a1500.460.
(1)绘制频率分布直方图时需注意:
制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;频率分布直方图的纵坐标是频率组距,而不是频率
(2)由频率分布直方图进行相关计算时,需掌握下列关系式:
频率组距组距频率【训练训练2】(2013烟台四校联考烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示已知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.
(1)求这次铅球测试成绩合格的人数;
(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由解解
(1)由题易知,第由题易知,第6小组的频率为小组的频率为1(0.040.100.140.280.30)10.14,此次测试的总人数为此次测试的总人数为70.1450.这次铅球测试成绩合格的人数为这次铅球测试成绩合格的人数为(0.2810.3010.141)5036.
(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为前三组的频率和为0.28,前四组的频率和为,前四组的频率和为0.56,中位数位于第中位数位于第4组内组内考向三考向三用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征【例例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价审题视点审题视点
(1)先通过图象统计出甲、乙二人的成绩;
(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价解解
(1)由图象可得甲、乙两人五次测试的成绩分别为由图象可得甲、乙两人五次测试的成绩分别为甲:
甲:
10分,分,13分,分,12分,分,14分,分,16分;分;乙:
乙:
13分,分,14分,分,12分,分,12分,分,14分分.x甲甲1013121416513,x乙乙1314121214513,s2甲甲15(1013)2(1313)2(1213)2(1413)2(1613)24,s2乙乙15(1313)2(1413)2(1213)2(1213)2(1413)20.8.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高
(2)由由s2甲甲s2乙乙可知乙的成绩较稳定可知乙的成绩较稳定
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况
(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小【训练训练3】(2012陕西陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为设甲乙两组数据的平均数分别为x甲甲,x乙乙,中位,中位数分别为数分别为m甲甲,m乙乙,则,则()A.x甲甲m乙乙B.x甲甲x乙乙,m甲甲x乙乙,m甲甲m乙乙D.x甲甲x乙乙,m甲甲m乙乙答案答案B解析解析x甲116(41433030382225271010141818568)34516,x乙116(42434831323434382022232327101218)45716.x甲x乙又m甲20,m乙29,m甲m乙方法优化方法优化1515快速掌握抽样方法的技巧快速掌握抽样方法的技巧【命题研究命题研究】通过近三年的高考试题分析,考查分层抽样方法的题目较多,其次是系统抽样题型多为选择题、填空题,有的与统计的其它知识或概率综合考查,常以解答题的形式出现,难度较低教你审题教你审题一审一审等比例性质;二审二审抽取的样本容量抽取的样本容量【真题探究真题探究】(2012江苏江苏)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生答案答案15优美解法优美解法高二年级学生人数占总高二年级学生人数占总的的3334310.样本样本容量为容量为50,则高二年级抽取:
,则高二年级抽取:
5031015(名名)学生学生反思反思用分层抽样抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于样本容量在总体中的比例,即nN.【试一试试一试】(2013徐州模拟徐州模拟)从某小学随机抽取100名同学,这些同学身高都不低于100厘米,将他们的身高(单位:
厘米)数据绘制成频率分布直方图(如图)现用分层抽样的方法从身高在120,130),130,140),140,150三组学生中,选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_答案答案3解析解析由(0.0050.0100.0200.035a)101,得a0.030,因此120,130),130,140),140,150三组学生人数分别为:
0.310030,0.2010020,0.1010010,所以,从身高在140,150内的学生中选取的人数应为10302010183.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方法 总体 分布 估计