21系统抽样与分层抽样.pptx
- 文档编号:30803480
- 上传时间:2024-01-28
- 格式:PPTX
- 页数:36
- 大小:306.38KB
21系统抽样与分层抽样.pptx
《21系统抽样与分层抽样.pptx》由会员分享,可在线阅读,更多相关《21系统抽样与分层抽样.pptx(36页珍藏版)》请在冰豆网上搜索。
2.1.2系统抽样,课前练习,1、对于简单随机抽样,个体被抽到的机会(),A.相等B.不相等C.与抽取的次数有关D.不确定,2、从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25,则N=_,A,120,1简单随机抽样的概念,适用范围:
总体中个体数较少的情况,抽取的样本容量也较小时。
复习回顾:
一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
抽签法的步骤:
编号;制签;搅匀;抽签;取个体。
随机数表法的步骤:
编号;选数;读数;取个体。
2.简单随机抽样的方法:
抽签法,随机数表法,问题:
某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查。
除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?
简单随机抽样适用于个体数不太多的总体。
那么当总体个体数较多时,宜采用什么抽样方法呢?
这种抽取方法是系统抽样。
我们按照下面的步骤进行抽样:
第一步:
将这500名学生从1开始进行编号;第二步:
确定分段间隔k,对编号进行分段.由于k=500/50=10,这个间隔可以定为10;第三步:
从号码为110的第一个间隔中用简单随机抽样的方法确定第一个个体编号,假如为6号;第四步:
从第6号开始,每隔10个号码抽取一个,得到6,16,26,36,496.这样就得到一个样本容量为50的样本.,【说明】由系统抽样的定义可知系统抽样有以下特证:
(1)当总体容量N较大时,采用系统抽样。
(2)将总体平均分成几部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k(x表示不超过x的最大整数).(3)一定的规则通常指的是:
在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。
将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先从第一个间隔中随机地抽取一个号码,然后逐个抽取的号码依次增加间隔数得到所求样本。
这种方法叫系统抽样,一.系统抽样的定义,系统抽样的步骤:
(1)采用随机的方式将总体中的个体编号;
(2)将整个的编号按一定的间隔(设为K)分段,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被n整除,这时,,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号;(4)将编号为的个体抽出。
简记为:
编号;分段;在第一段确定起始号;加间隔获取样本。
系统抽样的特点:
(1)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的,,
(2)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;,(3)系统抽样是不放回抽样。
个体被抽取的概率等于,思考:
下列抽样中不是系统抽样的是()A、从标有115号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样;B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。
C,思考:
系统抽样与简单随机抽样比较,有何优、缺点?
点评:
(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;
(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.,例1.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32分析用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用简单随机抽样方法得到的数,因此只有选项B满足要求,故选B.,练习:
简单随机抽样,5,20,为了了解某地区参加数学竞赛的1005名学生的数学成绩,打算从中抽取一个容量为50的样本,现用系统抽样的方法,需要用方法先从总体中剔除个个体,然后按编号顺序每间隔_个号码抽取一个.,理论迁移,例2某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?
第二步,随机剔除2名学生,再把余下的320名学生随机编号为1,2,3,320.,第五步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.,第四步,在第1部分用抽签法确定起始编号.,第三步,把总体分成40个部分,每个部分有8个个体.,第一步,采用随机的方式给个体编号,1,2,322,1、采用系统抽样的方法,从个体数为1003的总体中抽取一个容量50的样本,则在抽样过程中,被剔除的个体数为(),抽样间隔为()。
3,20,2、用系统抽样的方法从个体数为1003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性为()A、1/1000B、1/1003C、50/1003D、50/1000,C,3、从N个编号中抽取n个号码入样,用系统的方法抽样,则抽样的间隔为()A、N/nB、nC、N/nD、N/n+1说明:
N/n表示N/n的整数部分。
4、从已编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能为()A、5,10,15,20,25B、3,13,23,33,43C、1,2,3,4,5D、2,4,6,16,32,C,B,5、(2004年福建省高考卷)一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平分成10个小组,组号依次为1,2,3,10。
现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同。
若m6,则在第7组中抽取的号码为,63,解析:
依编号顺序平均分成的10个小组分别为09,1019,2029,3039,4049,5059,6069,7079,8089,9099.因第7组抽取的号码个位数字应是3,所以抽取的号码是63.这个样本的号码依次是6,18,29,30,41,52,63,74,85,96这10个号.,2.系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便.,小结,1.系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.,两种抽样方法比较,假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?
你认为哪些因素影响学生视力?
抽样要考虑和因素?
2.1.3分层抽样,问题5:
假设某地区有高中生2400人,初中生10900人,小学生11000人.此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.你认为应当怎样抽取样本?
分析:
考察对象的特点是由具有明显差异的几部分组成.,总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”.,一、分层抽样的定义。
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。
应用分层抽样应遵循以下要求:
(1)分层:
将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。
问题5:
假设某地区有高中生2400人,初中生10900人,小学生11000人.此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.你认为应当怎样抽取样本?
解:
(1)确定样本容量与总体的个体数之比1%。
(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取24,109,110人,然后合在一起,就是所抽取的样本。
(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即24,109,110。
分层抽样的具体步骤是什么?
步骤1:
根据已经掌握的信息,将总体分成互不相交的层,步骤2:
根据总体的个体数N和样本容量n计算抽样比k=,n:
N,步骤3:
确定每一层应抽取的个体数目,并使每一层应抽取的个体数目之和为样本容量n,步骤4:
按步骤3确定的数目在各层中随机抽取个体,合在一起得到容量为n样本,分层,求比,定数,抽样,强调两点:
(1)分层抽样是等概率抽样,它也是公平的。
用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等为n/N。
(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。
分层抽样,例1一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。
为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。
由于职工年龄与这项指标有关,试问:
应用什么方法抽取?
能在500人中任意取100个吗?
能将100个份额均分到这三部分中吗?
分析:
考察对象的特点是由具有明显差异的几部分组成。
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。
分层抽样,例1一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。
为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。
由于职工年龄与这项指标有关,试问:
应用什么方法抽取?
能在500人中任意取100个吗?
能将100个份额均分到这三部分中吗?
解:
(1)确定样本容量与总体的个体数之比100:
500=1:
5。
(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56,19人,然后合在一起,就是所抽取的样本。
(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即25,56,19。
解:
因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:
(1)将3万人分为5层,其中一个乡镇为一层。
(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。
3003/15=60(人),3002/15=100(人),3002/15=40(人),3002/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60人。
(3)将300人组到一起,即得到一个样本。
例2:
一个地区共有5个乡镇,人口3万人,其中人口比例为3:
2:
5:
2:
3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?
并写出具体过程。
1分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()A、每层等可能抽样B、每层不等可能抽样C、所有层按同一抽样比等可能抽样,巩固练习,c,2某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25B.15,15,15C.10,5,30D15,10,20,D,B,D,B,注意:
1、分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。
2、分层抽样中分多少层,要视具体情况而定。
总的原则是:
层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。
简单随机抽样、系统抽样、分层抽样的比较,在下列问题中,各采用什么抽样方法抽取样本较合适?
1、从20台电脑中抽取4台进行质量检测;2、从2004名同学中,抽取一个容量为20的样本3、某中学有180名教工,其中业务人员136名,管理人员20名,后勤人员24名,从中抽取一个容量为15的样本。
简单抽样,系统抽样,分层抽样,本节课学习了关于统计的哪些内容?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 21 系统抽样 分层抽样