统计学课件第七章抽样推断.ppt
- 文档编号:461654
- 上传时间:2022-10-10
- 格式:PPT
- 页数:107
- 大小:1.39MB
统计学课件第七章抽样推断.ppt
《统计学课件第七章抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学课件第七章抽样推断.ppt(107页珍藏版)》请在冰豆网上搜索。
统计学概论内容,第一章统计总论第二章统计调查第三章统计数据的整理与显示第四章统计指标第五章指数的因素分析第六章时间序列分析第七章抽样推断第八章相关与回归分析第九章统计预测第十章统计的综合评价第十一章统计分析报告,第一节抽样推断概述,第三节参数估计,第二节随机抽样的概率分布,第四节抽样设计,第七章抽样推断,第一节抽样推断概述,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。
抽样推断,统计推断,全及总体指标:
参数(未知量),样本总体指标:
统计量(已知量),抽样推断,随机原则的实现,抽签法,是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。
随机数表法,将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。
计算机模拟法,是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。
并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,按随机原则抽取样本单位以样本的数量特征推断总体的数量特征抽样推断产生抽样误差,但抽样误差可以事先计算并控制,抽样推断的特点,与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。
我国在1994年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系。
不可能进行全面调查时不必要进行全面调查时来不及进行全面调查时对全面调查资料进行补充修正时,抽样推断的应用,抽样推断理论基础,大数定律,中心极限定律,表明大量随机观象平均结果具有稳定性的性质。
大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。
如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。
抽样推断理论基础,大数定律,中心极限定律,表明大量随机观象平均结果具有稳定性的性质。
大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎100%的概率,期望样本平均数与总体平均数的绝对离差为任意小。
如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。
抽样推断的基本概念,全及总体,抽样总体,又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。
常用N表示全及总体的单位数目。
又称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。
抽样总体的单位数称为样本容量,通常用n表示。
1nN。
抽样推断的基本概念,例如:
在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。
n30称为大样本,n30称为小样本.n/N称为抽样比.,设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则,根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体参数。
全及指标,总体平均数(又叫总体均值):
全及指标,总体单位标志值的标准差:
总体单位标志值的方差:
总体成数:
总体是非标志的标准差:
总体是非标志的方差:
设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则,样本平均数(又叫样本均值):
样本单位标志值的标准差:
样本单位标志值的方差:
为的无偏估计,为的无偏估计,样本成数:
样本单位是非标志的标准差:
样本单位是非标志的方差:
为的无偏估计,为的无偏估计,抽样方法的分类,重复抽样,从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。
又称放回抽样,总体单位数N不变,同一单位可能多次被抽中。
根据取样方式不同,可分为:
抽样方法的分类,不重复抽样,每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。
又称不放回抽样.,总体单位数减少n,同一单位只可能被抽中一次。
抽样方法的分类,根据对样本的要求不同,可分为:
考虑顺序抽样,不考虑顺序抽样,考虑各单位的中选顺序。
ABCCBA,不考虑各单位的中选顺序。
ABCCBA,考虑顺序的重复抽样,不考虑顺序的不重复抽样,考虑顺序的不重复抽样,不考虑顺序的重复抽样,综合起来共有四种抽样方法,样本的可能数目,考虑顺序的不重复抽样,不考虑顺序的不重复抽样,考虑顺序的重复抽样,不考虑顺序的重复抽样,把填湖南风采35选7福利彩票号码看作一次抽样,则它属于哪一种抽样?
中特等奖的概率是多少?
(09选6呢?
),不考虑顺序的不重复抽样,样本的概率分布,把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分布。
若将样本指标的取值分别记为其相应的概率记为P1,P2,Pn,将它们按顺序排列起来,可得如下概率分布表。
第二节随机抽样的概率分布,抽样分布,样本统计量所有可能值的概率分布,主要样本统计量,平均数比率(成数)方差,分布的形状及接近总体参数的程度,学生成绩30405060708090,按随机原则抽选出名学生,并计算平均分数。
平均数的抽样分布,二者均值相等,学生成绩30405060708090,离差-30-20-100102030,平均数的抽样分布,全部可能样本平均数的均值等于总体均值,即:
从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。
从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。
样本均值的标准差为总体标准差的,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:
从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。
从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。
样本比率的标准差为总体标准的。
比率的抽样分布,教师是否博士是是否否否是,具有博士学位的比率:
0.5比率的标准差:
0.5,从总体中按重复抽样方法随机抽取人,计算其比率和标准差,比率的抽样分布,全部可能样本比率的均值等于总体比率,即:
从非正态总体中抽取的样本比率当n足够大时其分布接近正态分布。
从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。
样本比率的标准差为总体标准差的。
比率的抽样分布,学生成绩60708090均值75方差125,从中按重复抽样方式抽取人,计算样本的均值及方差S。
方差的抽样分布,样本抽样分布,原总体分布,抽样误差,167CM,169CM,172CM,160CM,162CM,167CM,175CM,180CM,165CM,167CM,170CM,175CM,178CM,180CM,162CM,173CM,155CM,160CM,170CM,165CM,平均身高=169.8CM,平均身高=174.6CM,总平均身高=168.6CM,第三节参数估计,也叫抽样估计,就是根据样本指标数值对总体指标数值作出估计或推断。
参数估计,通常,把用来估计总体特征的样本指标叫估计量或统计量,待估计的总体指标叫总体参数。
特点,1、它在逻辑上运用归纳推理而不是演绎推理。
2、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。
3、抽样估计存在抽样误差。
点估计,从总体中抽取一个随机样本,计算与总体参数相应的样本统计量,然后把该统计量视为总体参数的估计值,称为参数的点估计。
的抽样分布,点估计的最大好处:
给出确定的值点估计的最大问题;无法控制误差.,问题:
第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数?
估计值的优良标准,第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?
是否一个统计量要优于另一个?
估计值的优良标准:
无偏性、有效性、一致性,抽样估计量的优良标准,设为待估计的总体参数,为样本统计量,则的优良标准为:
若,则称为的无偏估计量,若,则称为比更有效的估计量,若越大越小,则称为的一致估计量,作为优良的估计量,除了满足无偏性的要求外,其方差应比较小,有效性,指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值,一致性,抽样估计量的优良标准,学生成绩30405060708090,有效性,按随机原则抽选出名学生,并计算平均分数和中位分数。
有效性,中位数的抽样分布,平均数的抽样分布,无偏性,有偏,无偏,一致性,学生成绩30405060708090,按随机原则抽选出5名学生,并计算平均分数。
n=4时的抽样分布,n=5时的抽样分布,为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;为的无偏、有效、一致估计量。
数理统计证明:
抽样估计量的优良标准,区间估计,给出一个区间(置信区间)并推断真正的参数以一定的概率存在于这个区间的方法。
抽样平均误差,指每一个可能样本的指标值与总体指标值之间平均离差,即一系列样本指标的标准差,式中:
为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数,注意:
不要混淆抽样标准差与样本标准差!
抽样平均误差的计算,样本平均数的抽样平均误差,当N500时,有,重复抽样时:
不重复抽样时:
样本成数的抽样平均误差,重复抽样时:
不重复抽样时:
当N500时,有,抽样平均误差的计算公式,关于总体方差的估计方法,用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。
抽样平均误差的计算公式,影响抽样误差的因素,总体各单位标志值的差异程度(即标准差的大小):
越大,抽样误差越大;样本单位数的多少:
越大,抽样误差越小;抽样方法:
不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:
简单随机抽样的误差最大。
抽样极限误差,指在一定的概率保证程度下,抽样指标与总体指标之间抽样误差的最能范围,也称作抽样允许误差。
常用大可表示。
上式表明:
样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。
由于总体成数和总体平均数是未知的,它要求靠实测的抽样平均数和抽样成数来估计,因而抽样误差的实际意义是希望总体平均数(成数)落在某个已知的范围内。
抽样极限误差,所以前面的不等式应变换为:
在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。
即抽样极限误差通常表示为抽样平均误差的多少倍。
由于t值与样本估计值落入允许误差范围内的概率有关,因此,t也称为概率度。
抽样估计的置信度,抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率保证程度,也叫抽样估计的置信度,一般用F(t)表示。
即:
置信度,t值与相应的概率保证程度存在一一对应关,常用t值及相应的概率保证程度为:
t值概率保证程度1.000.68271.960.95002.000.95453.000.9973,在大样本下,68.27%,95.45%,99.73%,抽样极限误差,以样本统计量为中心,以抽样平均误差为距离单位,可以构造一个区间,并可以一定的概率保证待估计的总体参数落在这个区间之中。
区间越大,则概率保证程度越高。
区间估计原理,区间估计原理,0.6827,落在范围内的概率为68.27%,区间估计原理,0.9545,落在范围内的概率为95.45%,样本抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件 第七 抽样 推断