统计学第6章统计量与抽样分布.pptx
- 文档编号:30846515
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:71
- 大小:877.04KB
统计学第6章统计量与抽样分布.pptx
《统计学第6章统计量与抽样分布.pptx》由会员分享,可在线阅读,更多相关《统计学第6章统计量与抽样分布.pptx(71页珍藏版)》请在冰豆网上搜索。
统计学-ch5suyl1第6章统计量与抽样分布统计量与抽样分布总体和样本的分布统计量统计量抽样分布及抽样分布及抽样分布定理抽样分布定理统计学-ch5suyl26.1总体和样本的分布总体和样本的分布l6.1.1统计推断中的总体及总体分布统计推断中的总体及总体分布l要了解研究对象的整体情况要了解研究对象的整体情况,最理想的方法似乎最理想的方法似乎是进行普查是进行普查,但实际上这样做往往是不必要、不但实际上这样做往往是不必要、不可能或不允许的可能或不允许的.l如如,要研究灯泡寿命要研究灯泡寿命,由于寿命试验是破坏性的由于寿命试验是破坏性的,逐个试验是不允许的逐个试验是不允许的.l数理统计的方法:
从所研究的全体对象中数理统计的方法:
从所研究的全体对象中,抽取抽取一小部分来进行试验一小部分来进行试验(称为抽样称为抽样),根据这一小部根据这一小部分所显示的统计特性分所显示的统计特性,来推断整体的统计特性来推断整体的统计特性.统计学-ch5suyl3总体是根据一定的目的确定的所要研究的事物的全体,总体是根据一定的目的确定的所要研究的事物的全体,它是由客观存在的、具有某种共同性质的众多个别事物它是由客观存在的、具有某种共同性质的众多个别事物构成的整体。
总体是构成的整体。
总体是研究对象的全体。
在具体的统计推断中,我们感兴趣的是总体单位的某个或某些数量特征。
例如研究某种型号灯泡的寿命这一数量特征。
总体的含义抽象为所感兴趣的变量的所有取值,我们可以想象,这些值的出现有不同的频率,假设这批灯泡有无限多个,那么频率就收敛到了概率,从而有了使用寿命这个随机变量的概率分布。
这个分布称为总体或总体分布。
总体(总体分布)是对客观对象变量取值情况的数学描述。
总体所含个体的数目称为总体容量总体容量.这样要研究的总体实质上是某个概率分布这样要研究的总体实质上是某个概率分布,因此我们将因此我们将总体定义为一个随机变量总体定义为一个随机变量X.数理统计学中“总体”这个基本概念从本质上讲:
总体就是一个随机变量总体就是一个随机变量。
我们对总体的研究我们对总体的研究,就是对就是对相应的随机变量相应的随机变量X的研究的研究.统计学-ch5suyl4从社会统计到数理统计总体的演化从社会统计到数理统计总体的演化实物总体实物总体数字总体数字总体分布总体分布总体组成元素组成元素具体对象具体对象组成元素组成元素重复数字重复数字组成元素组成元素数字的取值数字的取值及其概率:
及其概率:
分布分布研究的标志数字的取值和重复的频率例:
研究班级同学的身高例:
研究班级同学的身高班级的同学的集合(全体同学)组成元素:
每位同学(具体对象)同学身高的集合组成元素:
身高的数字(重复数字)身高的取值及其概率组成元素:
身高的分布统计学-ch5suyl5对所研究的对象对所研究的对象,我们常常关心某一项或几项指标我们常常关心某一项或几项指标.总体:
总体:
研究对象的某项变量值的全体.个体:
个体:
组成总体的每一个基本元素.例如例如:
某工厂生产的灯泡的使用寿命的全体是一个总体,而每一个灯泡的使用寿命是一个个体.而每个男生的身高是一个个体.我校男生的身高的全体是一个总体,总体所含个体的数目称为总体容量总体容量.统计学-ch5suyl6一般地,我们是从总体中抽取一部分,比如说n个进行观测,再根据这n个观测值去推断总体的性质.在总体X中,抽取n个个体这n个个体称为总体X的一个样本样本.抽样抽样就是抽取样本的过程.样本中所含个体的数目n称为样本容量样本容量.由于是从总体X中随机抽取出来的可能结果,是n个随机变量,但是在一次一次抽取之后,它们都是具体的数值,样本样本通过观测或试验的方法,获得的总体中一部分个体的集合,称为样本,每个个体的取值称为样本点。
6.1.1统计推断中的样本及样本分布12,.,nXXX12,.,nXXX统计学-ch5suyl7l如随机抽取n只灯泡,试验得到其使用寿命(x1,x2,xn),称这n个确定的数值(x1,x2,xn)是灯泡使用寿命总体的一个样本。
但是,当灯泡样本点的使用寿命还未观测出来时,只能将每个样本点看作与总体同分布的随机变量,这是因为每个样本点的可能取值范围和某个值出现的可能性与总体是一样的,这时样本记为(X1,X2Xn)。
统计学-ch5suyl8l在相同的条件下对总体X进行n次重复独立的观察。
将n次观察结果按试验的次序记为X1,X2,Xn(大写英语字母表示)。
由于X1,X2,Xn是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,所以有理由认为X1,X2,Xn是相互独立的相互独立的,且都是与总体X具有相同分布的相同分布的随机变量。
这样得到的X1,X2,Xn称为来自总体X的一个简单随机样本,n称为这个样本的容量。
以后无另外说明,所得的样本都是指简单随机样本统计学-ch5suyl9n次观察一经完成,我们就得到一组实数x1,x2,xn(小写英语字母表示),它们依次是随机变量X1,X2,Xn的观察值,称为样本观测值。
对于有限总体,采用放回抽样就能得到简单随机样本,但放回抽样使用起来不方便,当个体的总数N比样本的容量n大得多时,在实际中可将不放回抽样近似地当作放回抽样来处理统计学-ch5suyl10简单随机样本的两个最基本的特性:
(1)独立性是相互独立的随机变量.即中各个随机变量的取值互不影响,这时称
(2)代表性(同分布性)即样本中的每个样本点都与总体同分布;即中每一个随机变量都与总体X有相同的概率分布.6.1.2统计推断中的样本及其性质12,.,nXXX12,.,nXXX12,.,nXXX统计学-ch5suyl11总体和样本的关系总体和样本的关系数理统计中,样本和总体具有相同的分布数理统计中,样本和总体具有相同的分布取值取值1概率概率0.2取值取值2:
概率概率0.4取值取值3:
取值取值0.1分布分布总体总体样品样品X1总体的分布:
总体中重复数字取各值的概率总体的分布:
总体中重复数字取各值的概率l分布总体分布总体总体各个值的概率可以认为是有相应比重的个体取该值。
l随机样本随机样本由于每一个体都有均等被抽中的概率,因而样本取总体各个值的概率即样本分布与总体分布相同。
样品样品X2样品样品Xn。
统计学-ch5suyl12总体样本样本观察值?
理论分布统计统计是从手中已有的资料样本观察值,去推断总体的情况总体分布.总体分布总体分布决定了样本取值样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体推断总体.样本样本是联系两者的桥梁.总体、样本、样本观察值的关系如下总体、样本、样本观察值的关系如下:
统计学-ch5suyl136.2统计量统计量统计量统计量分布的概念统计量分布的概念在统计推断中,总体信息是未知的,但从总体中抽取的样本中含有总体的信息,统计推断就是利用样本的信息来推测总体的信息。
然而样本的信息是隐蔽的,不明显的,必须要经过必要的加工处理才能用来推断总体信息,构造样本统计量是加工样本提出总体信息的有效手段之一。
统计学-ch5suyl146.2.1统计量及统计量的分布如果如果样本X1,Xn的函数T(X1,Xn)不含未知参数,则称不含未知参数,则称T(X1,Xn)是总体X的一个统计量。
统计量。
统计量有以下两个特征:
统计量是样本的函数;统计量不能含有未知的总体参数。
统计学-ch5suyl15判断下列是否为统计量是是是是是是1,nXXK21()niiTXm=-2211()1niiSXXn=-0XZms-=1211nniiXXXXXnn=+=L
(1)(),nXXK12XX+0.5m统计学-ch5suyl16是是不是不是是是是是是是是是?
),(,22321哪些不是哪些不是些是统计量些是统计量判断下列各式哪判断下列各式哪为未知为未知为已知为已知其中其中样本样本的一个的一个是来自总体是来自总体设设NXXX,11XT,3212XeXXT),(313213XXXT),max(3214XXXT,2215XXT.),(),(,21212121的观察值是则称的样本值是相应于样本设nnnnXXXfxxxfXXXxxx222612321()TXXXs=+统计学-ch5suyl172.本样k矩阶6.2.2几常用的量个统计nikiknikikXXnBXnA11,)(11中心矩原点矩,1.11niiXnX样本均值,)()(112122SSXXnSnii标准差样本均方差样本方差统计学-ch5suyl18样本均值和方差的性质l1.均值的性质l2.方差的性质bxaybaxyii则设,)
(1)(),()(XDnXDXEXE22211()nniiiiXXXnX=-=-邋)()(2XDsE统计学-ch5suyl19证明:
)
(1)(),()()1(XDnXDXEXEununEXnXEnXnEXEnii1)
(1)
(1)1()(1nnnXDnXnDXDniinii2221211)
(1)1()(niiniiXnXXX1212)()2(22222222221212221)()()
(2)(222)(XnXnXXnXnXXnXnXnXXXnXXXXXXXXXiiiiiniiniiinii统计学-ch5suyl20)()()3(2XDsE)(111)(2222XnXnnXXSii22222222222222222)1(11)(11)(11)()()(11)()(11)(11)(nnnununnunnnunnXnEEXXDnXnEEXnXnXEnSEii统计学-ch5suyl213.3.顺序统计量顺序统计量顺序统计量顺序统计量:
对于样本X1,X2,Xn,如果按照升幂排列,得到称称X
(1),X
(2),X(n)为顺序统计量。
)()2()1(nXXX统计学-ch5suyl22l利用顺序统计量可以计算一些常用的统计量:
l
(1)最大顺序统计量和最小顺序统计量l
(2)样本中位数l(3)样本极差l(4)样本的p分位数l(5)样本的切尾均值统计学-ch5suyl23统计量的分布统计量的分布统计量分布的概念统计量分布的概念统计量既然是随机变量的函数,那么它也应该是随机变量,并有其概率分布,统计量的分布也称为抽样分布。
抽样分布和统计推断有着密切的联系。
统计量提出以后,必须要知道其分布才能在统计推断中使用,因为只有知道了统计量的分布,才能利用概率论对总体的特征进行推断,并得到相应的推断的置信度。
所以在统计推断中,一项重要的工作就是寻找统计量和导出统计量的分布。
我们从一个简单的例子来讨论统计量分布的概念。
统计学-ch5suyl24例例6.3设有一总体设有一总体N=3(2,4,6)。
以样本容量。
以样本容量n=1、n=2、n=4及及n=8,从总体中进行复置抽样,抽出全,从总体中进行复置抽样,抽出全部可能的样本于表部可能的样本于表6.1。
表表6.1中列出这些不同样本容量的抽样分布,并中列出这些不同样本容量的抽样分布,并在图在图4.1用方柱形图表示其分布形状。
用方柱形图表示其分布形状。
由表中第一列当由表中第一列当N=3,n=1的总体平均数和方差为:
的总体平均数和方差为:
当样本容量依次为当样本容量依次为2、4、8时,其相应为时,其相应为4、4、4;其相应为;其相应为4/3、2/3、1/3。
即。
即,。
,。
yy2yyny22383)46()44()42()(222122/NyNii43123)642(1/NyNii统计学-ch5suyl25n=11n=22n=44n=88yffff224466111111223344556611223322112.02.02.52.53.03.03.53.54.04.04.54.55.05.05.55.56.06.011441010161619191616101044112.002.002.252.252.502.502.752.753.003.003.253.253.503.503.753.754.004.004.254.254.504.504.754.755.005.005.255.255.505.505.755.756.006.00118836361121122662665045047847841016101611071107101610167847845045042662661121123636881139816561平均数4444方差8/34/32/31/3表表6.1各种不同样本容量的样本平均数各种不同样本容量的样本平均数()的抽样分布的抽样分布yyyy统计学-ch5suyl26n=1n=2图6.1各种不同样本容量的分布方柱形图分布方柱形图y统计学-ch5suyl27图66.1各种不同样本容量的分布方柱形图分布方柱形图n=4n=8y统计学-ch5suyl28从这个例子我们可以了解关于样本均值的分布,即所有可能样本计算出的均值所服从的分布(直方图验证了中心极限定理)。
但是在实际工作中,总体的容量远不止3,总体的分布也是十分复杂的,统计量也各有不同,象这样一一列举给出统计量的分布是行不通的,我们必须借助于总体分布的类型来讨论统计量的分布的情况。
后面我们将集中讨论正态总体的统计量分布的问题,通常称为样本的精确分布。
统计学-ch5suyl29统计学-ch5suyl306.3抽样分布及抽样分布定理抽样分布及抽样分布定理主要内容2分布t分布F分布抽样分布的重要定理抽样分布的重要定理统计学-ch5suyl31为了讨论统计量的分布,本节首先介绍数理统计中的三个著名分布,它们是t分布,2分布和F分布。
参数估计和假设检验等统计推断问题中这三个分布有广泛的应用。
统计学-ch5suyl326.3.16.3.1分布的定义为独立同分布于标准正态总体N(0,1)的随机变量列,则称随机变量:
所服从的分布为自由度是n的分布,记为2c分布21,nXXL2221nXXc=+L22()ncc2c统计学-ch5suyl332(n)分布实质上就是参数为n/2,1/2的分布,即2(n)的密度函数为/211222(/2),0()0,0nnxnxexfxx统计学-ch5suyl342分布随着自由度增加,分布渐近于正态。
图4-12的概率密度曲线统计学-ch5suyl35
(1)期望与方差)期望与方差若X2(n),则E(X)=n,D(X)=2n。
2.2分布的性质特征分布的性质特征22242241()13122xiiiDXEXEXxedxp+-=-=-=-=)(12niiXD22211()()nniiiiiEEXDXEXnc=+=邋()22211()()2nniiiiDnDXDXnc=邋统计学-ch5suyl36
(2)分布可加性若X2(n1),Y2(n2),X,Y独立,则X+Y2(n1+n2)。
统计学-ch5suyl37(3)关于自由度)关于自由度统计学-ch5suyl38统计学-ch5suyl39l(4)为便于今后的应用,现在我们引入上侧分位数的概念.所谓一个分布的上侧分位数就是指这样一个数,它使相应分布的随机变量不小于该数的概率为,比如,若记2变量的上侧分位数为,则满足)(2n)(xfnx2ac22()pacca=统计学-ch5suyl40通过Excel查分位点,函数为CHIINV统计学-ch5suyl411.t分布构造和密度函数构造和密度函数t(n)称为自由度为n的t分布。
6.3.2t分布t(n)的率密度概为若N(0,1),2(n),与独立,则).n(tn/Tt,)nt1()2n(n)21n()t(f21n2统计学-ch5suyl42分子是标准正态随机变量分子是标准正态随机变量分母是自由度为分母是自由度为n的卡方随机变量的卡方随机变量分子分母相互独立,且满足构造公式分子分母相互独立,且满足构造公式新随机变量服从新随机变量服从自由度为自由度为n的的t分布分布t分布的三个要点:
统计学-ch5suyl43t分布的图像统计学-ch5suyl44t分布和标准正态分布类似,他们都是对称分布。
但是t分布与标准正态分布也是有区别的。
t分布尾部厚,即服从分布的随机变量取到尾部值的概率比标准正态分布略大。
而对于接近原点的坐标点,t分布的值比标准正态分布的值小。
因而t分布曲线尾部又厚于标准正态分布,而峰低于标准正态分布。
图图4-2t(n)密度函数曲线密度函数曲线统计学-ch5suyl452.2.tt分布的性质特征分布的性质特征
(1)f(t)于关t=0(纵轴)。
对称
(2)f(t)的限极为N(0,1)的密度函,数即(3)(3)t分布的数学期望与方差t分布的数学期望与方差分别是,x,e21)t()t(flim2tn2)(nt()0Et=()/
(2)2Dtnnn=-统计学-ch5suyl46)()10(nttP,称满足条件:
对于给定的()tntaa的点为分的上布分位点。
)()(1ntnt:
由概率密度的对称性知.)(45zntn时,当)(nt)(1nt统计学-ch5suyl47通过Excel可得分位点,函数为TINVl如查对话框写0.2,2525,1.0n统计学-ch5suyl48统计学-ch5suyl496.3.3F分布若12(n1),22(n2),1,2独立,则称为第一自由度为n1,第二自由度为n2的F分布,其概率密度为1.F分布构造和密度函数构造和密度函数).n,n(Fn/n/F2122110y,00y,)ynn1)(2n()(y)n/n)(2nn()y(h2/)nn(2122n12n2/n212121111统计学-ch5suyl50分子是自由度为分子是自由度为n1的卡方随机变量的卡方随机变量分母是自由度为分母是自由度为n2的卡方随机变量的卡方随机变量分子分母相互独立,且满足构造公式分子分母相互独立,且满足构造公式新随机变量服从新随机变量服从第一自由度为第一自由度为n1第二自由度为第二自由度为n2的的F分布分布F分布的三个要点:
统计学-ch5suyl511234560.20.40.60.81234560.20.40.60.8m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=15,n=10F分布密度函数图统计学-ch5suyl522.F-分布性质特征分布性质特征
(1)F分布的数学期望和方差分布的数学期望和方差222()
(2)2nEFnn=-2212221222
(2)()(4)
(2)(4)nnnDFnnnn+-=-统计学-ch5suyl53
(2)自由度F分布有两个自由度,称为第一自由度和第二自由度,分别对应构成F分布的分子和分母的自由度。
两个自由度的不同组合和形成F分布曲线的不同形态,这在F分布的图形中已经清楚看到了。
F分布的两个自由度还有一个重要性质,它们是可以互相转化的。
统计学-ch5suyl54(3)F分布的分布的上侧临界值上侧临界值是指满足下式的是指满足下式的12(,)Fnna临界值121212(,)(,)(,)()FnnPFnnFnnfxdxaaa+=统计学-ch5suyl55).,(/1),(F1221nnFFnnF则若),(/1),(12211nnFnnF结论:
),()10(21nnFFP,称满足条件:
对于给定的12(,)FnnFaa的点为分的上布分位点),(21nnF统计学-ch5suyl56因为则.(,)(,)PFnmFnmaa=11(,)(,)PFnmFnmaa=1(,)(,)PFmnFnmaa0存在,当n较大时,近似地有2
(1)(,)
(2)(0,1)/XNnXNSnsmm-统计学-ch5suyl65定理定理6-3.6-3.两个总体的统计量的分布两个总体的统计量的分布1212111222221211121111()()11nniiiinniiiiXXYYnnSXXSYYnn=-=-邋邋22112222121212(,),(,)(,)XNYNXYNnnmsmsssmm-+设则统计学-ch5suyl66抽样分布定理定理定理6-3:
设两独立总体XN(1,12),YN(2,22),则统计量从而有:
22121212(,)XYNnnssmm-+12221212()(0,1)XYNnn统计学-ch5suyl67抽样分布定理定理定理6-4:
设两独立且等方差总体XN(1,2),YN(2,2),则统计量其中12121222112212211222()()
(2)11
(1)
(1)2
(2)(1,1)wwXYTtnnSnnnSnSSnnSFnnSmm-=+-+-+-=+-
(1)统计学-ch5suyl68在这三大分布确立之后,讨论统计量的分布就十分容易了。
比如统计学-ch5suyl69分布分布:
用途:
讨论某种工艺生产的产品质量是否稳定,是估计总体方差的问题。
对总体的方差进行估计时,必须利用样本的方差那么样本的方差服从什么分布?
2)1/()(122nxxSii统计学-ch5suyl70分布:
用途:
对总体的均值进行推断时,通常情况下总体方差是未知的,这就意味着,统计量中含有未知的参数,如果我们用样本的修正方差代换总体的方差,则上式变为它不服从标准正态分布,而服从分布。
在总体方差未知时,推断总体均值,需考虑统计量。
tnxz)1/()(122nxxSii2nSxttt统计学-ch5suyl71F分布用途:
在实际的统计分析工作中,我们常常遇到讨论两个总体的方差是否相等的问题。
比如某个工厂采用两种不同的工艺生产某种产品,欲了解哪一种工艺的质量稳定,则需要讨论起质量指标的方差是否相等。
?
2221?
12221
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 统计 抽样 分布