抽样调查-第4章比率、回归与差值估计.pptx
- 文档编号:30809539
- 上传时间:2024-01-30
- 格式:PPTX
- 页数:58
- 大小:669.43KB
抽样调查-第4章比率、回归与差值估计.pptx
《抽样调查-第4章比率、回归与差值估计.pptx》由会员分享,可在线阅读,更多相关《抽样调查-第4章比率、回归与差值估计.pptx(58页珍藏版)》请在冰豆网上搜索。
4.1引言,一、概念在实际工作中,如果除了调查的目标量以外,还有其他指标的信息,称这些指标为辅助变量,(auxiliaryariable)。
人们总希望利用辅助变量与目标量之间的关系来提高估计的精度。
这就是本章所要介绍的方法(不是抽样方法,而是估计方法)。
通常使用的方法是:
利用调查指标与辅助变量之间的关系构造比率估计量和回归估计量。
例如,要调查家庭教育支出,则家庭的总支出就是辅助变量,家庭用于教育的支出占总支出的比重就构成了比率估计量。
二、应用条件,
(1)比率估计、回归估计需要用到辅助变量的总体均值或总体总量;
(2)如果辅助变量的总体均值或总体总量未知又要利用比率估计或回归估计,则可采用二重抽样的方法;(3)比率估计是有偏估计,因此需要有足够的样本量才能保证估计的有效。
三、符号说明,总体总量:
总体均值:
总体方差:
样本均值:
样本方差:
总体协方差:
样本协方差:
总体相关系数:
样本相关系数:
4.2比率估计,一、简单随机抽样下的比率估计,1.定义比率估计量(ratioestimator)又称比估计,Y的比率估计为:
总体比率:
总体比率估计量:
2.比估计的性质,简单随机抽样比率估计是有偏的,其偏倚的阶为,当样本量n较大时,估计量的偏倚趋于零.,因此,比率估计是渐近无偏的.,性质1对于简单随机抽样比率估计,当样本量,的方差为:
或,和样本协方差.,【例4.1】,对以下假设的总体(N=6),用简单随机抽,样抽取n=2的样本,比较简单随机抽样比率估计及简单估计的性质。
解:
对这个总体,我们列出所有可能的,个样本,以比较简单估计与比率估计的性质。
由此,可以算出:
由计算结果可以看出:
简单估计是无偏的,而比率估计是有偏的。
简单估计量的方差远远大于比例估计量的方差,比率估计的偏倚不大,其均方误差也比简单估计的方差小得多。
因此,对这个总体,比率估计比简单估计的效率高。
【例4.2】某县在对船舶调查月完成的货运量进行调查时,对运管部门登记的船舶台帐进行整理后获得注册船舶2860艘,载重吨位154626吨。
从2860艘船舶中抽取一个n=10的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如表(单位:
吨),要推算该县船舶调查月完成的货运量。
因此,对该县船舶在调查月完成货运量的比率估计为:
方差的估计为:
=2.10617,标准差的估计为:
如果用简单估计对货运量进行估计,则,由此,得到比率估计量设计效应为:
对于本问题,比率估计量比简单估计量的效率高!
3.消除比率估计偏倚的方法,由于比率估计是有偏估计,在小样本时,其偏倚不能忽略.则需要通过改善估计量或改变抽样方法使比率估计成为无偏估计.,1.无偏的比率估计量,第一种:
Hartley-Ross估计量,式中,第二种:
Mickey估计量,其中,分别是在n个样本数据中去掉第i个样本数据后剩下的n-1个样本数据的平均值.,二、分层随机抽样下的比率估计,1.分别比率估计,(separateRatioestimator)为:
总体均值:
总体总量:
层权,L:
层数,比率估计量的方差:
式中,分别比率估计量要求每一层的样本量都比较大,否则,偏倚可能比较大.,2.联合比率估计(combinedratioestimator),总体均值:
总体总量:
均方误差为:
3.分别比率估计量与联合比率估计量的比较,一般而言,分别比率估计量的方差小于联合比率估计量的方差。
但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。
实际使用时,如果各层的样本量都较大,且有理由认为各层的比率Rh差异较大,则分别比率估计优于联合比率估计。
当各层的样本量不大,或各层比率Rh差异很小,则联合比率估计更好些。
【例4.4】某市1996年对950家港口生产单位完成的吞吐量进行了调查,1997年欲对全市港口生产单位完成的吞吐量进行调查。
对港口生产单位按非国有(h=1)和国有(h=2)分为两层,单位数分别为800家和150家,分别在两层中调查了10家和15家港口生产单位,调查数据如下表,试计算1997年全市港口生产单位完成的吞吐量。
1997年国有和非国有企业调查数据如下页,(将上述数据计算的中间结果列于P77的表中),1.按分别比率估计量估计,2.按联合比率估计量估计,按联合比率估计量估计比按分别比率估计量估计要好一些!
三、比率估计的效率,1.与简单估计的比较,简单估计量是无偏的,而比率估计量是渐近无偏的.,因此,这里只比较当n比较大的情形.,由以前的讨论可知:
由此看出,比率估计量优于简单估计量的条件是:
2.比率估计成为最优线性估计的条件,比率估计量优于简单估计量。
这里,,4.3回归估计,一、回归估计的定义,的回归估计量(regressionestimatior)的定义为:
如果=0,则回归估计量就是简单估计量;,归系数,稳定在某个数值上,取最近一次调查,性质2对于简单随机抽样回归估计量,作为,的方差分别为:
协方差。
的样本估计量为:
三、为样本回归系数的情形,如果需要通过样本来确定,很自然地,,我们会想到用总体回归系数的最小二乘估计,,也就是样本回归系数:
这时简单随机抽样回归估计量,是有偏的。
但当样本量,n充分大时,估计量的偏倚趋于零。
因此,类似,比率估计量,回归估计量也是渐近无偏的。
且有,的一个近似估计为:
【例4.5】(续P72的例4.2)利用回归估计量推算该县船舶调查月完成的货运量.,解:
根据例4.2中的计算结果可得样本回归系数:
从而,因此,该县船舶调查月完成的货运量的回归估计为:
为了估计,先计算回归残差方差:
所以,与例4.2的结果比较,对于本问题回归估计优于比率估计,而比率估计又优于简单估计;回归估计优于比率估计的原因是回归直线没有通过原点。
比较上述估计量的优劣,一般是通过比较它们的均方误差或方差大小来进行。
简单估计量、比率估计量、回归估计量的比较,简单估计量:
比率估计量,回归估计量,由此可以看出:
2.比率估计量优于简单估计量的条件是:
1.回归估计量总是优于简单估计量,除非即一般而言有,四、分层随机抽样下的回归估计,1.分别回归估计(separateregressionestimator),当各层的回归系数为事先给定的常数时,分别回归估计量是无偏的。
其方差为:
其中是第h层的回归系数,达到最小,即,注意,
(1)分别回归估计量是有偏的,但当每一层的样本量都很大时,估计的偏倚可以忽略,其方差近似为:
(2)这里是子总体的回归系数,是子总体样本的回归系数,前者是未知的,后者是可知的。
式中,分别回归估计量要求每一层的样本量都较大,如果这个条件得不到满足,则分别回归估计量的偏倚可能很大,这时,采用联合回归估计量更好些。
2.联合回归估计(combinedregressionestimator),是无偏的,其方差为:
并且,只要取,3.分别回归估计与联合回归估计的比较,解:
样本回归系数:
则按分别回归估计量估计:
(见P85),按联合回归估计量估计:
(见教材P86),从本题看,联合回归估计量比分别回归估计量要优一些!
4.4差值估计,总体均值的差值估计为:
式中,就可得到的样本估计.,【例4.7】(续例4.4)利用差值估计量估计该市港口生产单位1997年完成的吞吐量,并与前面的估计量及精度进行比较.,解:
由于辅助变量是上年的普查资料,且样本回归系数接近于1,因此可以采用差值估计.,下面比较本例所用的五个估计量,看看它们的优劣,其具体数据如下表:
结果分析,1.本题中,五种估计量的精度非常接近,联合回归估计量稍好些;2.对于简单随机抽样,简单估计、差值估计是无偏的,比率估计、回归估计是渐进无偏的;3.当样本量较小时,比率估计、回归估计的偏倚是不能忽视的;4.当辅助变量为调查指标的最近普查值时,可以考虑使用差值估计。
本章小结,
(1)在实际工作中,人们使用比率估计量和回归估计量主要是利用辅助变量提高估计效率.
(2)比率估计量和回归估计量都是有偏的,但当样本量足够大时,其偏倚可以忽略.(3)如果辅助变量的总体总量或总体均值未知,则要采用二阶段抽样,以解决辅助变量信息不足的问题.,本章作业,
(1)熟悉本章附录的证明;
(2)思考书后习题1,习题2,;(3)在作业本上完成书后习题3,习题4,习题5;,(第四章结束),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 比率 回归 差值 估计