第十五章第1讲随机抽样和样本估计总体.pptx
- 文档编号:30810046
- 上传时间:2024-01-30
- 格式:PPTX
- 页数:44
- 大小:768.15KB
第十五章第1讲随机抽样和样本估计总体.pptx
《第十五章第1讲随机抽样和样本估计总体.pptx》由会员分享,可在线阅读,更多相关《第十五章第1讲随机抽样和样本估计总体.pptx(44页珍藏版)》请在冰豆网上搜索。
第十五章统计,第1讲,随机抽样和样本估计总体,1总体、个体、样本把所考察对象的某一个数值指标的全体构成的集合看成总体,构成总体的每一个元素为个体,从总体中随机抽取若干个个体构成的集合叫做总体的一个样本,2随机抽样,均等的,抽样时保证每一个个体都可能被抽到,每一个个体被抽到的机会是_,满足这样的条件的抽样是随机抽样,3简单随机抽样,相等,抽签法,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都_,就把这种抽样方法叫做简单随机抽样最常用的简单随,机抽样方法有两种_和_,随机数表法,4系统抽样
(1)当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方式叫做系统抽样,
(2)步骤:
编号采用随机的方式将总体中的个体编号,编号的方式,可酌情处理;,分段,确定起始个体编号在第1段用_确定起,始的个体编号S;,简单随机抽样,按照事先确定的规则抽取样本通常是将S加上间隔k,得到第2个个体编号Sk,再将(Sk)加上k,得到第3个个体编号S2k,这样继续下去,获得容量为n的样本其样本编号依次是:
S,Sk,S2k,S(n1)k.,5分层抽样,明显差异,当总体由_的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层中独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样,6.频率分布直方图
(1)求极差:
极差是一组数据的最大值与最小值的差
(2)决定组距和组数:
当样本容量不超过100时,常分成5,12组组距_.,(3)将数据分组:
通常对组内数值所在区间取左闭右开区间最后一组取闭区间也可以将样本数据多取一位小数分组(4)列频率分布表:
登记频数,计算频率,列出频率分布表将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的_频率反映这,组数据在样本所占比例的大小,频率,极差组数,(5)绘制频率分布直方图:
把横轴分成若干段,每一段对应一,个组距,然后以线段为底作一矩形,它的高等于该组的,频率组距,,这,样得到一系列的矩形,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图7频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端,的_,就得到频率分布折线图,中点,
(2)总体密度曲线:
随着_的增加,作图时所分的组数增加,_减小,相应的频率折线图会接近于一条光滑的曲,线,即总体密度曲线,样本容量,组距,8茎叶图在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示茎是中间的一列数,叶是从茎的旁边生长出来的数9样本数字特征
(1)众数:
在一组数据中,出现次数最多的数据叫做这组数据,的众数,最中间,中位数,
(2)中位数:
将一组数据按大小依次排列,把处在_位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_,(4)方差:
s2_.,(5)标准差:
s_.,C都相等,且为,D都相等,且为,1从2004名学生中选取50名组成参观团,若采用下面的方法选取:
先用简单随机抽样从2004人中剔除4人,剩下的2000,),C,人再按系统抽样的方法进行则每人入选的概率(A不全相等B均不相等251002,140,2(2011年广东广州调研)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选,是(,),C,A甲,B乙,C丙,D丁,3(2011年广东广雅中学测试)在广雅中学“十佳学生”评选的演讲比赛中,如图1511是七位评委为某学生打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的众数和中,位数分别为(,),图1511,A85,85,B84,86,C84,85,D85,86,C,4(2011年上海)课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应城市数分别为4,12,8.若用分层,抽样抽取6个城市,则丙组中应抽取的城市数为_.,2,5某个容量为100的样本的频率分布直方图如图1512,,则在区间4,5)上的数据的频数为_.,30,解析:
对于在区间的频率的数值为0.3,而总数为100,因此频数为30.图1512,考点1随机抽样及其应用例1:
现要完成下列3项抽样调查:
从10盒酸奶中抽取3盒进行食品卫生检查科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本,较为合理的抽样方法是(,),A简单随机抽样,系统抽样,分层抽样B简单随机抽样,分层抽样,系统抽样C系统抽样,简单随机抽样,分层抽样D分层抽样,系统抽样,简单随机抽样,解析:
此题主要考察的是三种抽样方法的适用情况对总体个数较少,采用简单随机抽样,对个体数相对较多,采用系统抽样,对个体相互差异明显,采用分层抽样,故选A.,答案:
A,三种抽样方法的联系与区别:
【互动探究】1某小区有800个家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100户的样本;从10名同学中抽取3个参加座谈会.简单随机抽样方法;.系统抽样,),B,方法;.分层抽样方法问题和方法配对正确的是(ABCD,2一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量,),D,为40的样本则从上述各层中依次抽取的人数分别是(A12,24,15,9B9,12,12,7C8,15,12,5D8,16,10,6,3用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1至160编号按编号顺序平均分成20组(18号,916号,153160号),若第16组应抽出的号码为126,,则第一组中用抽签方法确定的号码是_.,6,解析:
采用系统抽样,设每组中依次抽出的号码构成一数列an,首项为a1,公差为8的等差数列,则该数列的通项公式为ana18(n1),依题意则a16126a18(161),则a16.即第一组中用抽签方法确定的号码是6.,考点2,频率分布直方图,例2:
(2010年广东佛山调研)某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段40,50),50,60),90,100后得到如图1513所示的部分频率分布直方图观察图形的信息,回答下列问题:
图1513,
(1)求分数在70,80)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分;(3)用分层抽样的方法在分数段为60,80)的学生中抽取一个容量为6的样本,将该样本看成一个总体,从中任取2人,求至多有1人在分数段70,80)的概率,10.70.3.故,0.310,0.03,,解析:
(1)分数在70,80)内的频率为:
1(0.0100.0150.0150.0250.005)10,如图D33,图D33,设从样本中任取2人,至多有1人在分数段70,80)为事件A,,则基本事件空间包含的基本事件有:
(m,n),(m,a),(m,b),(m,c),(m,d),(c,d)共15,种,,则事件A包含的基本事件有:
(m,n),(m,a),(m,b),(m,c),(m,d),(n,a),(n,b),,(n,c),(n,d)共9种,,
(1)频率分布直方图的绘制按照前面的要点预览的步骤进行值得注意的是,在频率分布直方图中,纵轴表示,“,频率组距,”,数据落在各小组内的频率用小矩形的面积表示,各小,矩形的面积总和等于1.
(2)由频率分布直方图估计样本的数字特征时:
众数为频率分布直方图中最高矩形的底边中点的横坐标,中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,【互动探究】,4(2011年广东佛山质检)为提高广东中小学生的健康素质和体能水平,广东省教育厅要求广东各级各类中小学每年都要在体育教学中实施“体能素质测试”,测试总成绩满分为100分根据广东省标准,体能素质测试成绩在85,100之间为优秀;在75,85)之间为良好;在65,75)之间为合格;在(0,60)之间,体能素质为不合格,现从佛山市某校高一年级的900名学生中随机抽取30名学生,的测试成绩如下:
85,90,77,86,81,83,82,82,64,79,86,68,71,89,96.,
(1)完成频率分布表和频率分布直方图,并估计该校高一年级,体能素质为优秀的学生人数;,
(2)现用分层抽样的方法在该校高一年级共900名学生中抽取6名学生,在上述抽取的6名学生中任取2名,求恰好抽到1名体能素质为优秀的学生的概率;,(3)请你依据所给数据和上述广东省标准,对该校高一学生的,体能素质给出一个简短评价,65,84,76,70,56,81,87,83,91,75,81,88,80,82,93,,解:
(1),的有900300(人),图D34,如图D34,根据抽样,估计该校高一学生中体能素质为优秀,1030,
(2)设在抽取的6名学生中任取2名,恰好抽到1名体能素质为优秀的学生的事件为A,则抽取的6名学生中体能素质为优秀,考点3茎叶图,例3:
(2011年广东广州综合测试)某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔1小时抽一包产品,称其重量(单位:
克)是否合格,分别记录抽查数据,获得重量数据的茎叶图如图1514.,图1514,
(1)根据样品数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对较稳定;
(2)若从乙车间6件样品中随机抽取两件,求所抽取的两件样品的重量之差不超过2克的概率,甲车间的产品的重量相对较稳定,
(2)从乙车间6件样品中随机抽取两件,共有15种不同的取法:
(108,109),(108,110),(108,112),(108,115),(108,124),(109,110),(109,112),(109,115),(109,124),(110,112),(110,115),(110,124),(112,115),(112,124),(115,124),设A表示随机事件“所抽取的两件样品的重量之差不超过2,克”,则A的基本事件有4种:
(108,109),(108,110),(109,110),(110,112),明确茎叶图的数据对处理样本的数据特征显得尤为重要,而方差可以衡量样本数据的稳定性,【互动探究】5(2010年广东广州越秀区高三摸底)甲、乙两名同学在5次数学考试中,成绩统计用茎叶图表示如图1515,若甲、乙两,),B,人的平均成绩分别用x甲,x乙表示,则下列结论正确的是(A.x甲x乙,且甲比乙成绩稳定D.x甲x乙,且乙比甲成绩稳定图1515,易错、易混、易漏,24频率分布直方图中某区间的频率误认为该矩形的纵坐标,的值,例题:
(2011年浙江)某小学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图1516)根据频率分布直方图3000名学生在该次数学考试中成绩小于60分的学生数是_,图1516,正解:
该次数学考试中成绩小于60分的学生的频率是(0.0020.0060.012)100.2,则成绩小于60分的学生人数为:
0.23000600.答案:
600,【失误与防范】关于频率分布直方图,容易出现的错误有以,下两种:
在计算位于某区间的频率时,容易将纵坐标直接当作其频,率,实际是频率等于该矩形的面积,此题中要求运用样本数据特征去估计总体的情况,而学生容易因审题不仔细而出现求样本数据中成绩小于60分的学生人数,另外值得注意的是所有的矩形的面积之和等于1.,1根据总体的情况采取适当的抽样方式,无论采用哪种抽样方式,必须保证在整个过程中每个个体被抽到的机会相等而系统抽样和分层抽样在高考中考得比较多,2对于每个个体所取不同数值较少的总体时,常用条形图表示其样本分布,而对于每个个体所取不同数值较多或无限的总体,常用频率分布直方图表示其样本分布,3描述数据的数字特征平均数、众数、中位数、方差,其中平均数、众数、中位数描述其集中趋势,方差反映各个数据与平均数的离散程度,4近年来高考题倾向于以统计为载体来考察概率的相关知,识,如例2、例3.,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 随机 抽样 样本 估计 总体