第2章 抽样.pptx
- 文档编号:30840923
- 上传时间:2024-01-31
- 格式:PPTX
- 页数:82
- 大小:682.78KB
第2章 抽样.pptx
《第2章 抽样.pptx》由会员分享,可在线阅读,更多相关《第2章 抽样.pptx(82页珍藏版)》请在冰豆网上搜索。
2.2.2抽样调查,1.抽样调查的意义及基本概念,一、抽样调查的意义,一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):
按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围,抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。
1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;,2.虽可进行全面调查观察,但比较困难或并不必要;,3.对普查或全面调查统计资料的质量进行检查和修正;,4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;,5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。
一般适用于以下范围:
三、抽样调查的基本概念,
(一)全及总体和抽样总体(总体和样本),全及总体:
所要调查观察的全部事物。
总体单位数用N表示。
抽样总体:
抽取出来调查观察的单位。
抽样总体的单位数用n表示。
n30大样本n30小样本,
(二)全及指标和抽样指标(总体指标和样本指标),全及指标:
全及总体的那些指标。
抽样指标:
抽样总体的那些指标。
抽样框即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。
样本数指从总体中可能抽取的样本的数量。
样本容量指一个样本所包括的单位数。
2.抽样调查的组织形式,通常有以下四种组织形式:
一、简单随机抽样(纯随机抽样),即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:
1.直接抽选法;2.抽签法;3.随机数码表法;,二、类型抽样(分类抽样),先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。
类型的划分:
一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:
样本代表性高、抽样误差小、抽样调查成本较低。
如果抽样误差的要求相同的话则抽样数目可以减少。
两种类型:
1.等比例类型抽样(类型比例抽样);,2.不等比例类型抽样(类型适宜抽样)。
三、机械抽样(等距抽样),先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。
排列次序用的标志有两种:
1.选择标志与抽样调查所研究内容无关,称无关标志排队。
2.选择标志与抽样调查所研究的内容有关,称有关标志排队。
机械抽样按样本单位抽选的方法不同,可分为三种:
1.随机起点等距抽样,2.半距起点等距抽样,kkk,k,(k为抽取间隔),示意图:
3.对称等距抽样,示意图:
kkk,2k-a2k+a4k-a4k+a,a,k,(k为抽取间隔),机械抽样的好处:
1.可以使抽样过程大大简化,减轻抽样的工作量;,2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。
机械抽样,实际上是一种特殊的类型抽样。
因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。
四、整群抽样,整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。
整群抽样的好处:
组织工作比较简单方便,适用于一些特殊的研究对象。
其不足之处是,一般比其它抽样方式的抽样误差大。
五、多阶段抽样,即把抽样本单位的过程分为两个或几个阶段来进行。
(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:
先抽大单位(可以用类型抽样或机械抽样),再在大单位中抽小单位(可用整群抽样或简单随机抽样),小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。
六、重复抽样和不重复抽样,以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样):
重复抽样:
又称有放回抽样。
不重复抽样:
又称不放回抽样。
3.抽样平均误差,一、抽样误差的概念及其影响程度,在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。
抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。
抽样误差的影响因素:
1.全及总体标志变异程度。
正比关系2.抽样单位数目的多少。
反比关系3.不同的抽样方式。
4.不同的抽样组织形式。
抽样误差的作用:
1.在于说明样本指标的代表性大小。
误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。
2.说明样本指标和总体指标相差的一般范围。
二、抽样平均误差,抽样平均误差实际上是样本指标的标准差。
通常用表示。
在N中抽出n样本,从排列组合中可以有各种各样的样本组:
1.如果是重复抽样:
2.如果是不重复抽样:
考虑顺序的不重复抽样:
不考虑顺序的不重复抽样:
以上资料编成次数分配表如下:
抽样误差是所有可能出现的样本指标的标准差。
它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。
上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:
三、纯随机抽样的抽样平均误差,
(一)平均数的抽样平均误差,1.重复抽样,取得的途径有:
用过去全面调查或抽样调查的资料,若同时有n个的资料,应选用数值较大的那个;2.用样本标准差S代替全及标准差;3.在大规模调查前,先搞个小规模的试验性的调查来确定S,代替;4.用估计的方法。
某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:
=20小时,,根据以往资料,产品质量不太稳定,若=200小时,,2.不重复抽样:
(二)成数的抽样平均误差,已证明得:
成数的方差为p(1-p),某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。
四、类型抽样的抽样平均误差,在重复抽样情况下:
某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。
麦田类型抽样的平均误差计算表,高产麦田比重的平均误差计算表,五、机械抽样(等距抽样)的抽样平均误差,1.若按无关标志排队,公式用以上纯随机抽样的公式,一般采用不重复抽样公式:
2.若按有关标志排队,公式用类型抽样的公式:
六、整群抽样的抽样平均误差,整群抽样的抽样平均误差受三个因素影响:
(1)抽出的群数(r)多少(反比关系),
(2)群间方差()(正比关系),计算方法如下:
(3)抽样方法,假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产品的合格率,检查结果如下:
七、多阶段抽样的抽样平均误差,以两阶段抽样为例,设总体分R组,每组包含个单位,若各组相等,则,则:
在重复抽样下,在不重复抽样下,设某大学在学期初对学生进行体重抽样调查,先从全校80个班以不重复抽样方法随机抽取8个班,然后再从抽取的班中再分别抽取10个人作为第二阶段抽样单位。
计算所得的抽样平均体重为60.5千克,抽样各班内方差平均数为50,各班之间体重方差为22。
假设全校各班均为40人。
试以94.45%(t=2)的概率,推断该校学生平均体重的范围。
已知:
解:
以上抽样平均误差的公式归纳如下:
4.全及指标的推断,一、点估计和区间估计,
(一)点估计,只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。
如能满足下列三个准则:
无偏性,一致性,有效性,就会得到合理的估计,
(二)区间估计,是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。
根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:
抽样极限误差=t,(t为概率度),可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。
抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在,或,的范围内。
二、全及平均数和全及成数的推断,某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。
则:
某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。
则:
抽样一级品率:
三、全及总体总量指标的推断,
(一)直接推断法,抽样平均数(成数)总体单位数=总体标志总量,1.如果采用点估计方法:
上例1中:
40010000=400(万千克)如果用区间估计方法:
上例1中该农场小麦总产量的范围为:
t=2:
(397.62402.38)10000=397.62402.38(万千克)t=3:
(396.43403.57)10000=396.43403.57(万千克),2.上例2中,全部一级品数量的范围为:
(92.82%97.18%)8000=7425.67774.4(件),
(二)修正系数法,就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。
某村6000农户,2005年年末统计养猪头数,从下往上报的是9000头,现抽10(600户)的农户再复查一下,发现有漏报,也有重报。
按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。
某市房地局,年报工资总额3218.1万元。
现抽查14个单位:
年报:
415.03万元多报:
0.44万元少报:
1.47万元抵冲后1.47-0.44=1.03(万元),5.必要抽样数目的确定,一、影响必要抽样数目的因素,
(一)简单随机抽样,二、必要抽样数目的计算公式,
(二)类型抽样,重复抽样:
不重复抽样:
(三)机械抽样,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。
(四)整群抽样,建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。
根据过去资料=1.5,求样本数应是多少?
某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?
某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2章 抽样