随机抽样知识讲解.docx
- 文档编号:29783490
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:20
- 大小:73.83KB
随机抽样知识讲解.docx
《随机抽样知识讲解.docx》由会员分享,可在线阅读,更多相关《随机抽样知识讲解.docx(20页珍藏版)》请在冰豆网上搜索。
随机抽样知识讲解
随机抽样
【学习目标】
1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:
抽签法和随机数表法;
2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本;
3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系.
【要点梳理】
要点一、简单随机抽样
简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:
放回和不放回.我们在抽样调查中用的是不放回抽取.
1、简单随机抽样的概念:
一般地,从元素个数为N的总体中不放回地抽取容量为
的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本.
2、简单随机抽样的特点:
(1)被抽取样本的总体个数N是有限的;
(2)简单随机样本数n小于等于样本总体的个数N;
(3)从总体中逐个进行抽取,使抽样便于在实践中操作;
(4)它是不放回抽取,这使其具有广泛应用性;
(5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.
3、实施抽样的方法:
(1)抽签法:
抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.
抽签法的一般步骤:
①将总体中的N个个体编号;
②把这N个号码写在形状、大小相同的号签上;
③将号签放在同一箱中,并搅拌均匀;
④从箱中每次抽取一个号签,连续抽取n次;
⑤将总体中与抽到的号签的编号一致的n个个体取出.
(2)随机数表法:
要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.
随机数表法的步骤:
①将总体的个体编号(每个号码的位数一致);
②在随机数表中任选一个数字作为开始;
③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.
注意:
①选定开始数字,要保证所选数字的随机性;
②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去.
要点诠释:
1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:
放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.
2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型.
3、简单随机抽样每个个体入样的可能性都相等,均为
,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.
要点二、系统抽样
1、系统抽样的概念:
当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样.
2、系统抽样的特征:
(1)当总体容量N较大时,采用系统抽样;
(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样;
(3)预先制定的规则指的是:
在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.
3、系统抽样的一般步骤:
(1)采用随机的方法将总体中的N个个体编号;
(2)将编号按间隔
分段,当
是整数时,取
,当
不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数
能被
整除,这时取
,并将剩下的总体重新编号;
(3)在第一段用简单随机抽样确定起始个体的编号
;
(4)按照一定的规则抽取样本,通常是将编号为
的个体取出.
要点诠释:
1、从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.
2、系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.
要点三、分层抽样
1、分层抽样的概念:
当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
2、分层抽样的特点:
(1)适用于总体是由有明显差别的几部分组成时的情况;
(2)分层抽样对各个个体来说被抽取的可能性相同.
3、分层抽样的优点:
(1)样本具有较强的代表性;
(2)在各层抽样时,可灵活地选用不同的抽样方法.
4、分层抽样的步骤:
(1)将总体按一定的标准分层;
(2)计算各层的个体数与总体的个体数的比;
(3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
(4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取)
要点诠释:
1、应用分层抽样应遵循以下要求:
(1)分层:
将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等.
2、分层抽样是当总体有差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是,层内样本的差异要小,而层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
3、分层抽样的优点是:
使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法.
要点四、三种抽样方法的比较
类别
简单随机抽样
系统抽样
分层抽样
共同点
(1)抽样过程中每个个体被抽到的可能性相等
(2)每次抽出个体后不再将它放回,即不放回抽样
各自特点
从总体中逐个抽取
将总体均分成几部分按事先确定的规则在各部分抽取
将总体分成
层,分层进行抽取
相互联系
在起始部分抽样时采用简单随机抽样
各层抽样采用简单随机抽样或系统抽样
适用范围
总体中个体数较少
总体中个体数较多
总体由差异明显的几部分组成
【典型例题】
类型一:
简单随机抽样
例1.下列抽取样本的方式是否属于简单随机抽样?
说明理由.
(1)从无限多个个体中抽取100个个体作样本;
(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意抽出1个零件进行质量检验后再把它放回盒子里.
【解析】
(1)不是简单随机抽样,因为总体的个数是无限的.
(2)不是简单随机抽样,因为它是放回抽样.
【总结升华】简单随机抽样的四个特点:
(1)总体的个数有限;
(2)逐个抽取;(3)是不放回的抽取;(4)每个个体被抽到的可能性必须是相同的.
举一反三:
【变式1】下面的抽样方法是简单随机抽样吗?
为什么?
(1)某班45名同学,指定个子最高的5名同学参加学校组织的某项活动.
(2)从20个零件中一次性抽出3个进行质量检验.
(3)一小孩从玩具箱中的20件玩具中随意拿出一件来玩.玩后放回再拿下一件,连续玩了5件.
【解析】
(1)不是简单随机抽样.因为这不是等可能抽样.
(2)不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.
(3)不是简单随机抽样.因为这是有放回抽样.
例2.某工厂有112件产品,产品的编号为1,2,…,112.用随机数表法抽取一个容量为10的样本,写出抽样过程.
【解析】
解法一:
第一步,将这112件产品原有的编号调整为001,002,003,…,112;
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;
第三步,从“3”开始,向右读,每次读出三位,凡不在001~112中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;
第四步,产品原来的编号为74,100,94,52,80,3,105,107,83,92的那10件就是被抽取出来的产品.
解法二:
第一步,将这112件产品原来的编号调整为101,102,103,…,212;
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向,例如,选第9行第7列的数“3”,向右读;
第三步,从“3”开始,向右读,每次读出三位,凡不在101~212中的数跳过去不读,前面已经读过的数也跳过去不读,依次可得到155,134,174,180,165,196,206,105,160,201;
第四步,对应原来编号为55,34,74,80,65,96,106,5,60,101的产品就是要抽取的对象.
【总结升华】本例中,112件产品原有的编号1,2,…,112的位数不统一,有1位数,有2位数,还有3位数.为了解决这一矛盾,解法一采用了“在位数少的数前面加0”的处理方法,例如,1变为001,11变为011;解法二采用了“把原来的数加上10的倍数”的处理方法.例如,2变为102,12变为112.解法一、解法二所采用的处理方法都达到了凑齐位数的效果.
举一反三:
【变式1】某校有学生1200人,为调查某种情况,打算抽取一个样本容量为50的样本,则此样本采用简单随机抽样将如何获得?
【解析】解法一:
(抽签法)①把该校学生编号,号码为0001,0002,0003,…,1200;②做大小、形状相同的号签;③将这些号签放在同一个箱子里,进行均匀搅拌;④抽签时,每次从中抽出1个号签,连续抽出50个号签,就得到了一个容量为50的样本.
解法二:
(随机数表法)①把该校学生编号,号码为0001,0002,0003,…,1200;②在随机数表中选定一个起始位置,假如起始位置是表中第5行第9列的数字6;③从6开始向右连续取数字,以4个数为一组,取到一行末尾时转到下一行从左到右继续读取,所得数字如下:
6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3016……所取得的4位数字如果小于或等于1200,则对应此号的学生就是被抽取的个体.如果所取得的4位数字大于1200而小于2400则减去1200,剩余数字即是被抽取的号码.如果遇到相同号码,则只留第一次取得的数字,其余的舍去,经此处理,被抽取的学生号码如下:
0438,0682,1022,0762,0709,0606,0644,0853,1183,0130,0616……一直取够50人止.
【变式2】要从10架钢琴中抽取4架进行质量检验,请你设计抽样方案.
【解析】解法一:
(随机数表法)
第一步,将10架钢琴编号,号码是0,1,…,9.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第3行第6列的数“2”,向右读.
第三步,从数“2”开始,向右读,每次读取1位,重复数字只记录一次,依次可得到2,7,6,5.
第四步,以上号码对应的4架钢琴就是要抽取的对象.
解法二:
(抽签法)
第一步,将10架钢琴编号,号码是0,1,…,9.
第二步,将号码分别写在一张纸条上,揉成团,制成号签
第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀.
第四步,从袋子中逐个抽取4个号签,并记录上面的编号.
第五步,所得号码对应的4架钢琴就是要抽取的对象.
【总结升华】
(1)将钢琴编号从0开始,10架钢琴用0—9就可表示,这样总体中的所有个体可用一位数表示,便于使用随机数表.
(2)用抽签法抽样关键是将号签搅匀.
类型二:
系统抽样
例3.下列抽样中,最适宜用系统抽样法的是()
A.某市的4个区共有2000名学生,且4个区的学生人数之比为3∶8∶8∶2,从中抽取200名学生做样本
B.从某厂生产的2000个电子元件中随机抽取5个做样本
C.从某厂生产的2000个电子元件中随机抽取200个做样本
D.从某厂生产的20个电子元件中随机抽取5个做样本
【答案】C
【解析】A中各区学生有区别,不好分成均衡的几部分,不适宜,B中抽取样本容量太小,不适宜.D中总体个数较少,不适宜.故选C
【总结升华】系统抽样适合总体容量较大且个体间差异较小的情况.
举一反三:
【变式1】下列抽样中不是系统抽样的是().
A.从号码为1~15的15个球中任选3个作为样本,先在1~5号球中用抽签法抽出i0号,再将号码为i0+5,i0+10的球也抽出
B.工厂生产的产品,用传送带将产品送入包装车间的过程中,检查人员从传送带上每5min抽取一件产品进行检验
C.弄某项市场调查,规定在商店门口随机地抽一个人进行询问,直到调查到事先规定的调查人数为止
D.某电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
【答案】C
【解析】本题的判定依据是系统抽样方法的特征:
系统抽样适用于个体数目较多但均衡的总体.判断一种抽样是不是系统抽样,首先看是否在抽样前知道总体是由什么构成的,抽样的方法能否保证每个个体按事先规定的条件等可能入样,再看抽样过程中是否将总体分成了几个均衡的部分,是否在每个部分中进行简单随机抽样.
本题C显然不是系统抽样,因为事先不知道总体,抽样方法也不能保证每个个体等可能入样,总体也没有分成均衡的几部分,故C不是系统抽样.
【总结升华】系统抽样的特点:
①适用于总体容量较大的情况;②剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;③是等可能抽样,每个个体被抽到的可能性都是n/N.
例4.为了了解参加某种知识竞赛的1003名学生的成绩,抽取一个容量为50的样本,选用什么抽样方法比较恰当?
简述抽样过程.
【思路点拨】因为总体容量较大,且个体差异不大,适宜选用系统抽样.
【解析】抽样过程如下:
(1)随机地将这l003个个体编号为1,2,3,…,1003.
(2)利用简单随机抽样,先从总体中随机剔除3个个体,剩下的个体数1000能被样本容量50整除,然后将1000个个体重新编号为1,2,3,…,1000.
(3)将总体按编号顺序均分成50部分,每部分包括20个个体.
(4)在编号为1,2,3,…,20的第一部分个体中,利用简单随机抽样抽取一个号码,比如是18.
(5)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:
18,38,58,…,978,998.
【总结升华】
(1)总体中的每个个体被剔除的概率相等都是
,也就是每个个体不被剔除的概率相等都是
.采用系统抽样时每个个体被抽取的概率都是
,所以在整个抽样过程中每个个体被抽取的可能性仍然相等,都是
.
(2)系统抽样是建立在简单随机抽样的基础之上的,在总体中剔除若干个个体时,采用的是简单随机抽样;当将总体均分后对第一部分进行抽样时,采用的也是简单随机抽样.
举一反三:
【变式1】从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.
【解析】因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.
由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:
第一步,先从802辆轿车中剔除2辆轿车(剔除方法可用随机数表法);
第二步,将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含
个个体;
第三步,从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个号(如5)作为起始号;
第四步,从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.
【总结升华】用系统抽样法抽取样本,当
不为整数时,取
,即先从总体中用简单随机抽样的方法剔除N-nk个个体,且剔除多余的个体不影响抽样的公平性.
【变式2】
某服装厂平均每小时大约生产服装362件,要求质检员每小时抽取40件服装检验其质量状况,请你设计一个调查方案.
【解析】
因为总体中的个体数较多,并且总体是由没有明显差异的个体组成,所以本题宜采用系统抽样法.
第一步:
把这些服装分成40组,由于
的商是9,余数是2,所以每个组有9件服装还剩2件服装,这时分段间隔就是9.
第二步:
先用简单随机抽样的方法从这些服装中抽取2件服装不进行检验.
第三步:
将剩下的服装进行编号,编号分别为0,1,2,…,359.
第四步:
从第一组(编号分别为0,1,…,8)的服装中按照简单随机抽样的方法抽取1件服装,比如,编号为k.
第五步:
依次抽取编号分别为下面数字的服装k,k+9,k+18,k+27,…,k+39×9,这样就抽取了一个容量为40的样本.
类型三:
分层抽样
例5.在下列问题中,各采用什么抽样方法抽取样本?
(1)从20台彩电中抽取4台进行质量检验;
(2)科学会堂有32排座位,每排有40个座位(座号为1~40),一次报告会坐满了听众,会后为听取意见留下了座号为18的所有32名听众进行座谈;
(3)光远中学有180名教职工,其中教师136名,管理人员20名,后勤服务人员24名,为征求某项意见,现从中抽取一个容量为15的样本.
【答案】
(1)简单随机抽样;
(2)系统抽样;(3)分层抽样.
【解析】
(1)所述问题中总体中的个体数和样本容量均较少,故宜用简单随机抽样法;
(2)所述问题具有总体中的个体数较多,且每个个体无明显差异的特点,所以适宜用系统抽样法;(3)所述问题的总体中的个体具有明显差异,即出现了3个层次,因此适宜用分层抽样法.
【总结升华】总体容量较小宜用抽签法;总体容量较大,而样本容量较小宜用随机数表法;总体容量较大,样本容量也较大的宜用系统抽样法;总体是由差异明显的几个层次组成,宜用分层抽样法.
举一反三:
【变式1】一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?
方法一:
将160人从1到160编上号,然后将用白纸做成的有1~160号的160个号签放入箱内搅匀,最后从中抽取20个签,与签号相同的20个人被选出.
方法二:
将160人从1至160编号,按编号顺序分成20组,每组8人,令1~8号为第一组,9~16号为第二组,……,153~160号为第20组.从第一组中用抽签方式抽到一个为k号(1≤k≤8),其余组是(k+8n)号(n=1,2,3,…,19),以此抽取20人.
方法三:
按20∶160=1∶8的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤服务人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人.
以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是().
A.方法一、方法二、方法三B.方法二、方法一、方法三
C.方法一、方法三、方法二D.方法三、方法一、方法二
【答案】C
【变式2】某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270;
关于上述样本的下列结论中,正确的是
A.②、③都不能为系统抽样B.②、④都不能为分层抽样
C.①、④都可能为系统抽样D.①、③都可能为分层抽样
【答案】D
例6.某地区中小学人数的分布情况如下表所示(单位:
人):
学段
城市
县镇
农村
小学
357000
221600
258100
初中
226200
134200
11290
高中
112000
43300
6300
请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案.
【思路点拨】先采用分层抽样法确定出此地区城市、县镇、农村应被抽取的个体数,再用分层抽样法将城市应抽取的个体数分配到小学、初中、高中.同理可以完成县镇、农村的分配.
【解析】
第一步,确定城市、县镇、农村应抽取的个体数.城市、县镇、农村的学生数分别为:
357000+226200+11000=695200(人),221600+134200+43300=399100(人),258100+11290+6300=275690(人).
因为样本容量与总体容量的比为1∶1000,所以样本中包含的各部分个体数分别为:
(人),
(人),
(人).
第二步,将城市应抽取的个体数分配到小学、初中、高中.
因为城市小学、初中、高中的人数比为:
357000∶226200∶112000=3570∶2262∶1120=1785∶1131∶560,1785+1131+560=3476,所以城市小学、初中、高中应抽取的人数分别为:
(人),
(人),
(人).
第三步,将县镇应抽取的个体数分配到小学、初中、高中.
因为县镇小学、初中、高中的人数比为:
221600∶134200∶43300∶2216∶1342∶433,2216+1342+433=3991,所以县镇小学、初中、高中应抽取的人数分别为:
(人),
(人),
(人).
第四步,使用同样的方法将农村应抽取的个体数分配到小学、初中、高中.可得农村小学、初中、高中应抽取的人数分别为:
258(人),11(人),6(人).
第五步,再用合适的方法在对应的各个部分中抽取个体.在各层中所抽取的个体数如下表所示(单位:
人):
学段
城市
县镇
农村
小学
357
222
258
初中
226
134
11
高中
112
43
6
按照上表数目在各层中用合适的方法抽取个体,合在一起形成所需样本.
【总结升华】本题交错使用了分层抽样的方法,像这样比较复杂的问题,在解答的时候可以先将问题分成几个部分,再对各个部分具体解决.
举一反三:
【变式1】一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
【解析】用分层抽样来抽取样本,步骤是:
(1)分层.按年龄将职工分成三层:
不到35岁的职工;35岁至49岁的职工;50岁
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 抽样 知识 讲解