第7章抽样与估计1.pptx
- 文档编号:30846403
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:61
- 大小:501.69KB
第7章抽样与估计1.pptx
《第7章抽样与估计1.pptx》由会员分享,可在线阅读,更多相关《第7章抽样与估计1.pptx(61页珍藏版)》请在冰豆网上搜索。
6-1统计学统计学STATISTICS西北工大管理院业学学第第7章抽样与估计章抽样与估计
(1)7.1概率抽样方法概率抽样方法7.2三种不同性质的分布三种不同性质的分布7.3一个总体参数推断时样本统计量分布一个总体参数推断时样本统计量分布7.4两个总体参数推断时样本统计量分布两个总体参数推断时样本统计量分布6-2统计学统计学STATISTICS西北工大管理院业学学学习目标学习目标1.1.了解抽样的概率抽样方法了解抽样的概率抽样方法2.2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布6-3统计学统计学STATISTICS西北工大管理院业学学7.1概率抽样方法概率抽样方法7.1.1简单随机抽样简单随机抽样7.1.2分层抽样分层抽样7.1.3系统抽样系统抽样7.1.4整群抽样整群抽样6-4统计学统计学STATISTICS西北工大管理院业学学抽样方法抽样方法简单随机抽样分层抽样整群抽样系统抽样多阶段抽样概率抽样方便抽样判断抽样自愿样本滚雪球抽样配额抽样非概率抽样抽样方式6-5统计学统计学STATISTICS西北工大管理院业学学概率抽样概率抽样(probabilitysampling)1.根据一个已知的概率来抽取样本单位,也称随机抽样2.特点n按一定的概率以随机原则抽取样本l抽取样本时使每个单位都有一定的机会被抽中n每个单位被抽中的概率是已知的,或是可以计算出来的n当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率6-6统计学统计学STATISTICS西北工大管理院业学学简单随机抽样简单随机抽样(simplerandomsampling)1.从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)被抽中2.抽取元素的具体方法有重复抽样和不重复抽样3.特点n简单、直观,在抽样框完整时,可直接从中抽取样本n用样本统计量对目标量进行估计比较方便4.局限性n当N很大时,不易构造抽样框n抽出的单位很分散,给实施调查增加了困难n没有利用其他辅助信息以提高估计的效率6-7统计学统计学STATISTICS西北工大管理院业学学分层抽样分层抽样(stratifiedsampling)1.将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本2.优点n保证样本的结构与总体的结构比较相近,从而提高估计的精度n组织实施调查方便n既可以对总体参数进行估计,也可以对各层的目标量进行估计6-8统计学统计学STATISTICS西北工大管理院业学学系统抽样系统抽样(systematicsampling)1.将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位n先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位2.优点:
操作简便,可提高估计的精度3.缺点:
对估计量方差的估计比较困难6-9统计学统计学STATISTICS西北工大管理院业学学整群抽样整群抽样(clustersampling)1.将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查2.特点n抽样时只需群的抽样框,可简化工作量n调查的地点相对集中,节省调查费用,方便调查的实施n缺点是估计的精度较差6-10统计学统计学STATISTICS西北工大管理院业学学多阶段抽样多阶段抽样(multi-stagesampling)1.先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查n群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将该方法推广,使抽样的段数增多,就称为多阶段抽样2.具有整群抽样的优点,保证样本相对集中,节约调查费用3.需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开4.在大规模的抽样调查中,经常被采用的方法6-11统计学统计学STATISTICS西北工大管理院业学学非概率抽样非概率抽样(non-probabilitysampling)1.相对于概率抽样而言2.抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查3.有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式6-12统计学统计学STATISTICS西北工大管理院业学学方便抽样方便抽样1.调查过程中由调查员依据方便的原则,自行确定入抽样本的单位n调查员在街头、公园、商店等公共场所进行拦截调查n厂家在出售产品柜台前对路过顾客进行的调查2.优点:
容易实施,调查的成本低3.缺点:
样本单位的确定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体6-13统计学统计学STATISTICS西北工大管理院业学学判断抽样判断抽样1.研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本n有重点抽样,典型抽样,代表抽样等方式2.判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性3.抽样成本比较低,容易操作4.样本是人为确定的,没有依据随机的原则,调查结果不能用于对推断总体6-14统计学统计学STATISTICS西北工大管理院业学学自愿样本自愿样本1.被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息n例如,参与报刊上和互联网上刊登的调查问卷活动,向某类节目拨打热线电话等,都属于自愿样本2.自愿样本与抽样的随机性无关n样本是有偏的n不能依据样本的信息推断总体6-15统计学统计学STATISTICS西北工大管理院业学学滚雪球抽样滚雪球抽样1.先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应2.适合于对稀少群体和特定群体研究3.优点:
容易找到那些属于特定群体的被调查者,调查的成本也比较低6-16统计学统计学STATISTICS西北工大管理院业学学配额抽样配额抽样1.先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位2.操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似3.抽取具体样本单位时,不是依据随机原则,属于非概率抽样6-17统计学统计学STATISTICS西北工大管理院业学学概率抽样与非概率抽样的比较概率抽样与非概率抽样的比较1.概率抽样n依据随机原则抽选样本n样本统计量的理论分布存在n可根据调查的结果推断总体2.非概率抽样n不是依据随机原则抽选样本n样本统计量的分布是不确定的n无法使用样本的结果推断总体6-18统计学统计学STATISTICS西北工大管理院业学学7.2三种不同性质的分布三种不同性质的分布7.2.1总体分布总体分布7.2.2样本分布样本分布7.2.3抽样分布抽样分布6-19统计学统计学STATISTICS西北工大管理院业学学1.总体中各元素的观察值所形成的分布2.分布通常是未知的3.可以假定它服从某种分布总体分布总体分布(populationdistribution)总体6-20统计学统计学STATISTICS西北工大管理院业学学1.一个样本中各观察值的分布2.也称经验分布3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布样本分布样本分布(sampledistribution)样本6-21统计学统计学STATISTICS西北工大管理院业学学1.样本统计量的概率分布,是一种理论分布n在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布2.2.样本统计量样本统计量是随机变量n样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布抽样分布(samplingdistribution)6-22统计学统计学STATISTICS西北工大管理院业学学抽样分布的形成过程抽样分布的形成过程(samplingdistribution)总体计算样本统计计算样本统计量量如:
样本均值、比例、方差样本6-23统计学统计学STATISTICS西北工大管理院业学学7.3样本统计量的抽样分布样本统计量的抽样分布(一个总体参数推断一个总体参数推断时时)7.3.1样本均值的抽样分布样本均值的抽样分布7.3.2样本比例的抽样分布样本比例的抽样分布7.3.3抽样方差的抽样分布抽样方差的抽样分布6-24统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布6-25统计学统计学STATISTICS西北工大管理院业学学1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布6-26统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例】【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
4个个体分别为x1=1,x2=2,x3=3,x4=4。
总体的均值、方差及分布如下总体分布总体分布14230.1.2.3均值和方差均值和方差5.21NxNii25.1)(122NxNii6-27统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。
所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2的样本(共的样本(共16个)个)6-28统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计算出各样本的均值,如下表。
并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x样本均值的抽样分布样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.56-29统计学统计学STATISTICS西北工大管理院业学学样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.52=1.25总体分布总体分布14230.1.2.3抽样分布抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x5.2x625.02x6-30统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理=50=10X总体分布总体分布n=4抽样分布抽样分布xn=16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为,方差为2/n。
即xN(,2/n)5x50x5.2x6-31统计学统计学STATISTICS西北工大管理院业学学中心极限定理中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:
中心极限定理:
设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个任意分布的总体xnxx6-32统计学统计学STATISTICS西北工大管理院业学学中心极限定理中心极限定理(centrallimittheorem)x的分布趋的分布趋于正态分布于正态分布的过程的过程6-33统计学统计学STATISTICS西北工大管理院业学学抽样均值的抽样分布与抽样均值的抽样分布与总体分布的关系总体分布的关系总体分布总体分布正态分布正态分布非正态分布非正态分布大样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布6-34统计学统计学STATISTICS西北工大管理院业学学1.样本均值的数学期望2.样本均值的方差n重复抽样n不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)(xEnx22122NnNnx6-35统计学统计学STATISTICS西北工大管理院业学学样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)比较及结论:
比较及结论:
1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n为样本数目MnMxnixix222122625.016)5.20.4()5.20.1()(5.2160.45.10.11Mxniix6-36统计学统计学STATISTICS西北工大管理院业学学均值的抽样标准误差均值的抽样标准误差1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.也称标准误差2.小于总体标准差3.计算公式为nx6-37统计学统计学STATISTICS西北工大管理院业学学样本比例的抽样分布样本比例的抽样分布6-38统计学统计学STATISTICS西北工大管理院业学学1.总体(或样本)中具有某种属性的单位与全部单位总数之比n不同性别的人与全部人数之比n合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为4.比例比例(proportion)NNNN101或nnpnnp101或6-39统计学统计学STATISTICS西北工大管理院业学学1.在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似np5,n(1-p)54.推断总体比例的理论基础样本比例的抽样分布样本比例的抽样分布6-40统计学统计学STATISTICS西北工大管理院业学学1.样本比例的数学期望2.样本比例的方差n重复抽样n不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)(pEnp)1(21)1(2NnNnp6-41统计学统计学STATISTICS西北工大管理院业学学样本方差的抽样分布样本方差的抽样分布6-42统计学统计学STATISTICS西北工大管理院业学学样本方差的分布样本方差的分布1.在重复选取容量为的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的2分布,即)1()1(222nsn22)1(sn6-43统计学统计学STATISTICS西北工大管理院业学学1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来2.设,则3.令,则Y服从自由度为1的2分布,即4.5.当总体,从中抽取容量为n的样本,则2分布分布(2distribution),(2NX)1,0(NXz2zY)1(2Y),(2NX)1()(2212nxxnii6-44统计学统计学STATISTICS西北工大管理院业学学2分布分布(2distribution)000221)(2122xxexnxfxnn6-45统计学统计学STATISTICS西北工大管理院业学学1.分布的变量值始终为正2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称3.期望为:
E
(2)=n,方差为:
D
(2)=2n(n为自由度)4.可加性:
若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布2分布分布(性质和特点性质和特点)6-46统计学统计学STATISTICS西北工大管理院业学学cc2分布分布(图示图示)选择容量为选择容量为n的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值2=(n-1)s2/2计算出所有的计算出所有的2值值不同容量样本的抽样分布不同容量样本的抽样分布cc22n=1n=4n=10n=20mmss总体总体6-47统计学统计学STATISTICS西北工大管理院业学学样本统计量的抽样分布样本统计量的抽样分布分布样本方差正态分布大样本样本比例非正态分布非正态总体(小样本)正态分布大样本正态总体或非正态总体样本均值计量样本统22spx6-48统计学统计学STATISTICS西北工大管理院业学学样本统计量的抽样分布样本统计量的抽样分布样本统计量样本统计量样本均值样本均值样本比例样本比例p样本方差样本方差s2正态总体或非正正态总体或非正态总体大样本态总体大样本非正态总体非正态总体小样本小样本大样本大样本2分布分布正态分布正态分布正态分布正态分布非正态分布非正态分布x6-49统计学统计学STATISTICS西北工大管理院业学学7.4样本统计量的抽样分布样本统计量的抽样分布(两个总体参数推断两个总体参数推断时时)7.4.1两个样本均值之差的抽样分布两个样本均值之差的抽样分布7.4.2两个样本比例之差的抽样分布两个样本比例之差的抽样分布7.4.3两个样本方差比的抽样分布两个样本方差比的抽样分布6-50统计学统计学STATISTICS西北工大管理院业学学两个样本均值之差的抽样分布两个样本均值之差的抽样分布6-51统计学统计学STATISTICS西北工大管理院业学学1.两个总体都为正态分布,即,2.两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差3.方差为各自的方差之和两个样本均值之差的抽样分布两个样本均值之差的抽样分布),(2111NX),(2222NX21xx2121)(xxE222121221nnxx6-52统计学统计学STATISTICS西北工大管理院业学学两个样本均值之差的抽样分布两个样本均值之差的抽样分布mm1ss1总体总体1ss2mm2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量n1计算计算x1抽取简单随机样抽取简单随机样样本容量样本容量n2计算计算x2计算每一对样本计算每一对样本的的x1-x2所有可能样本所有可能样本的的x1-x2mm11-mm22抽样分布抽样分布6-53统计学统计学STATISTICS西北工大管理院业学学两个样本比例之差的抽样分布两个样本比例之差的抽样分布6-54统计学统计学STATISTICS西北工大管理院业学学1.两个总体都服从二项分布2.分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似3.分布的数学期望为4.方差为各自的方差之和两个样本比例之差的抽样分布两个样本比例之差的抽样分布2121)(ppE2221112)1()1(21nnpp6-55统计学统计学STATISTICS西北工大管理院业学学两个样本方差比的抽样分布两个样本方差比的抽样分布6-56统计学统计学STATISTICS西北工大管理院业学学两个样本方差比的抽样分布两个样本方差比的抽样分布1.两个总体都为正态分布,即X1N(1,12),X2N(2,22)2.从两个总体中分别抽取容量为n1和n2的独立样本3.两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1)的F分布,即)1,1(212221nnFss6-57统计学统计学STATISTICS西北工大管理院业学学1.由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名则2.设若U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则3.称F为服从自由度n1和n2的F分布,记为F分布分布(Fdistribution)21nVnUF),(21nnFF6-58统计学统计学STATISTICS西北工大管理院业学学F分布分布(Fdistribution)0001222)(2211221212121211xxnnxnnnnnnnnxfnnn6-59统计学统计学STATISTICS西北工大管理院业学学F分布分布(图示图示)不同自由度的F分布F(1,10)(5,10)(10,10)6-60统计学统计学STATISTICS西北工大管理院业学学本章小结本章小结
(1)
(1)1.1.概率抽样方法概率抽样方法2.2.总体分布、样本分布、抽样分布总体分布、样本分布、抽样分布3.3.单总体参数推断时样本统计量的分布单总体参数推断时样本统计量的分布4.4.双总体参数推断时样本统计量的分布双总体参数推断时样本统计量的分布6-61统计学统计学STATISTICS西北工大管理院业学学结束结束THANKS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 估计
![提示](https://static.bdocx.com/images/bang_tan.gif)