抽样与抽样分布概论.pptx
- 文档编号:30846394
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:43
- 大小:1.23MB
抽样与抽样分布概论.pptx
《抽样与抽样分布概论.pptx》由会员分享,可在线阅读,更多相关《抽样与抽样分布概论.pptx(43页珍藏版)》请在冰豆网上搜索。
第第44章抽样与抽样分布章抽样与抽样分布4.1三种不同性质的分布4.1.1总体分布4.1.2样本分布4.1.3抽样分布总体中各单位的观测值所形成的相对频数分布。
分布通常是未知的可以假定它服从某种分布4.1.1总体分布(populationdistribution)总体从总体中抽取一个容量为的样本,由这个观测值形成的相对频数分布,称为样本分布,也称经验分布。
当样本容量n逐渐增大时,样本分布逐渐接近总体的分布4.1.2样本分布(sampledistribution)样本nn4.1.3抽样分布(SamplingDistribution)抽样分布的形成过程(samplingdistribution)总体计算样本统计量如:
均值、比例、方差等。
样本4.2大数定律与中心极限定理4.2.1大数定律1.独立同分布大数定律2.伯努利大数定律4.2.2中心极限定理独立同分布大数定律设独立随机变量服从同一分布,且存在数学期望和方差,对于任意给定的有u个别现象受到偶然因素的影响,对总体的大量观察后进行平均,能使偶然因素的影响相互抵消,样本平均数会稳定在附近,为样本平均数估计总体均值提供理论依据。
11lim()1niniPxnme=-伯努利大数定律在独立试验序列中,是事件在次试验中发生的次数,是事件发生的概率,对于任意给定的有当多次重复观察某个现象时,该现象发生的频率与该现象发证的概率之间的差距是非常小的,是用频率去代替概率提供理论依据。
lim()1nmPpne-4.2.2中心极限定理(CentralLimitTheorem)设总体均值为,且存在有限方差,从中抽取样本容量为nn的样本。
当样本容量足够大时(n30),样本平均数的抽样分布近似地服从正态分布,这就是著名的中心极限定理。
x2(,)xNnsm:
m2s4.3常用抽样分布及其特点4.3.1Z4.3.1Z分布及其特点4.3.2t4.3.2t分布及其特点4.3.34.3.3分布及其特点4.3.4F4.3.4F分布及其特点2c4.3.1Z分布及其特点当连续型随机变量X的密度函数为时,称X服从正态分布,有时也称X为正态随机变量。
设则Z是一个服从标准正态分布的连续型随机变量,其密度函数为22()21()()2xfxexmsps-=-XZms-=(0,1)N221()()2zfzezp-=-2(,)NmsZ分布及其特点E(z)=0D(z)=11、z分布以Y轴为中心,左右对称2、服从标准正态分布的随机变量Z的概率,与一般的正态随机变量原理相同。
标准正态分布概率密度函数图4.3.2t分布及其特点若随机变量,随机变量,且随机变量X与Y相互独立,则随机变量服从自由度为的t分布,记为其密度函数为(0,1)XN2()Ync/XtYn=n()ttn12212()
(1)()2nnnxfxxnnp+-+G()=+-2)1、t分布是对称分布,均值为02、当自由度n,方差极限为1t分布的形状和自由度n有关系,自由度越小,t分布曲线较为扁平,与标准正态分布差异越大;自由度越大,t分布曲线与标准正态分布曲线的差异逐渐缩小。
-6.0-4.0-2.00.02.04.06.0y=f(t,4)y=f(t,10)y=f(t,180)N(0,1)图图4-24-2标准正态分布以及各种自由度的标准正态分布以及各种自由度的tt分布的密度函数的曲线分布的密度函数的曲线4.3.3分布及其特点若随机变量独立且同为标准正态分布,则它们的平方和服从自由度为nn的分布,记为。
其概率密度函数为:
1,nXX(0,1)N221niiXc=221()niiXnc=122210()2()200nxnxexnfxx-=G2c2c分布及其特点E(x)=nD(x)=2n自由度增大,期望和方差随之增大。
是一种不对称偏峰分布,值域区间(0,+)随自由度增大,曲线的最高点逐渐下移并向右移动,趋于对称。
2c2c图4-3不同自由度的分布2c4.3.4F分布及其特点若随机变量、相互独立,且分别服从自由度为、的分布,则随机变量服从第一自由度为,第二自由度为的FF分布,记为其密度函数为:
XY1n2n2c12/XnFYn=1n2n12(,)FFnn1112121112221222()2()
(1)0()()()2200nnnnnnnnxxxnnfxnnx+-+G+=GGF分布及其特点E(F)=n2/(n2-2)D(F)=2n22(n1+n2-2)/n1(n2-2)2(n2-4)非对称的正偏分布,值域(0,+)F分布的极限是正态分布,随第一自由度n1的增大,分布曲线逐渐趋于对称,随两个自由度的增大,分布曲线逐渐趋于正态分布。
F(2,50)F(4,100)F(8,200)0.2.4.6.81012345xF_2_50F_4_100F_8_200图4-4不同自由度的F分布4.4常用统计量的抽样分布4.4.1样本均值的抽样分布4.4.2样本比率的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,一种理论概率分布。
推断总体均值的理论基础4.4.1样本均值的抽样分布样本均值的抽样分布(例题分析)【例4-1】设一个总体,含有4个元素(个体),即总体单位数N=4。
4个个体分别为X1=1,X2=2,X3=3,X4=4。
从总体中采取重复抽样方法抽取容量为2的随机样本,写出样本均值的抽样分布。
总体分布14230.1.2.3均值和方差12.5NiiXN221()1.25NiiXN样本均值的抽样分布(例题分析)现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。
所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布(例题分析)计算出各样本的均值,如下表。
并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5样本均值的抽样分布(数学期望与方差)1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n221222()(1.02.5)(4.02.5)0.62516nxiixxMnM为样本数目11.01.54.02.516niixxM样本均值的分布与总体分布的比较(例题分析)=2.52=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x5.2x625.02x两个重要结论:
1.样本统计量抽样分布的平均数等于总体平均数,即2.样本统计量抽样分布的标准差等于总体标准差除以样本单位数的平方根。
即又称为抽样标准误差,用表示。
x样本均值的抽样分布xnx以上两个结论具有普遍意义这一等式可以看出一项重要事实抽样平均误差比总体标准差小的多,仅为其。
例如一个县的粮食亩产高低悬殊,亩产标准差为80公斤,如果随机抽取100亩求平均亩产,那么样本平均亩产量的差异就显著减小,平均误差只及总体亩产标准差的,即8斤。
样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1n1110n=样本抽样分布原总体分布XxX样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为,方差为2/n。
即xN(,2/n)5x50x5.2x中心极限定理(CentralLimitTheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:
设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个任意分布的总体xnxx中心极限定理(CentralLimitTheorem)x的分布趋于正态分布的过程抽样分布与总体分布的关系总体分布正态分布非正态分布大样本大样本小样本小样本正态分布正态分布非正态分布样本分布样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)()Ex22xn221xNnnN教材P88总体(或样本)中具有某种属性的单位与全部单位总数之比,称为比率。
不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比率可表示为样本比率可表示为4.4.2样本比率的抽样分布011NNNN或011nnppnn或在重复选取容量为nn的样本时,由样本比率的所有可能取值形成的相对频数分布,一种理论概率分布。
当样本容量很大时,样本比率的抽样分布可用正态分布近似。
推断总体比率的理论基础样本比率的抽样分布样本比率的数学期望.样本比率的方差重复抽样不重复抽样样本比率的抽样分布(数学期望与方差)(pEnp)1(21)1(2NnNnp謝謝觀賞謝謝觀賞
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 概论