第6章统计量与抽样分布.pptx
- 文档编号:30846402
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:44
- 大小:412.09KB
第6章统计量与抽样分布.pptx
《第6章统计量与抽样分布.pptx》由会员分享,可在线阅读,更多相关《第6章统计量与抽样分布.pptx(44页珍藏版)》请在冰豆网上搜索。
第六章统计量与抽样分布第六章统计量与抽样分布n随机样本与统计量随机样本与统计量n分布分布t分布分布F分布分布1n正态总体下的抽样分布正态总体下的抽样分布2cn数理统计数理统计是一门以数据为基础的学科是一门以数据为基础的学科,可以定义为可以定义为收集数据收集数据,分析数据和由数据得出结论的一组概念、分析数据和由数据得出结论的一组概念、原则和方法原则和方法。
n例如:
若规定灯泡寿命低于例如:
若规定灯泡寿命低于10001000小时者为次品,如何确小时者为次品,如何确定次品率?
由于灯泡寿命试验是破坏性试验,不可能把整定次品率?
由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计研究的,以样本的信息来推断总体的信息,这是数理统计研究的问题。
问题。
26.16.1随机样本与统计量随机样本与统计量n总体:
研究对象的全体;总体:
研究对象的全体;n个体:
总体中的成员;个体:
总体中的成员;n总体的容量:
总体中包含的个体数;总体的容量:
总体中包含的个体数;n有限总体:
容量有限的总体;有限总体:
容量有限的总体;n无限总体:
容量无限的总体,通常将容量非无限总体:
容量无限的总体,通常将容量非常大的总体也按无限总体处理。
常大的总体也按无限总体处理。
3n例:
例:
1)了解某校“大学生的月消费水)了解某校“大学生的月消费水平”。
总体是该校大学生全体。
这是平”。
总体是该校大学生全体。
这是一个有限总体,每个大学生有许多指标一个有限总体,每个大学生有许多指标,我们关注的是学生“过去,我们关注的是学生“过去6个月平均个月平均每月的花费”这一指标。
每月的花费”这一指标。
4n2)了解某城市的空气质量情况,调查)了解某城市的空气质量情况,调查该城市的该城市的PM2.5值。
这是一个无限总值。
这是一个无限总体,描述空气质量有许多指标,而我们体,描述空气质量有许多指标,而我们仅关心仅关心PM2.5值。
值。
5n3)研究某种药物在人体中的吸收情况。
)研究某种药物在人体中的吸收情况。
这是一个有限总体,但数量非常巨大,这是一个有限总体,但数量非常巨大,我们常把它看出无限总体。
我们常把它看出无限总体。
6为了采用数理统计方法进行分析,首先要为了采用数理统计方法进行分析,首先要收集数据,数据收集方法一般有两种。
收集数据,数据收集方法一般有两种。
(1)通过调查、记录收集数据。
如为了调查大学)通过调查、记录收集数据。
如为了调查大学生“过去生“过去6个月平均每月的花费”,可以进行问卷个月平均每月的花费”,可以进行问卷调查;要了解调查;要了解PM2.5值,需要在城市设立若干值,需要在城市设立若干PM2.5监测站点,定时收集数据。
监测站点,定时收集数据。
(2)通过实验收集数据。
如为了了解药物吸收情)通过实验收集数据。
如为了了解药物吸收情况,要征集若干志愿者,把他们分成若干组,观察况,要征集若干志愿者,把他们分成若干组,观察他们服药后不同时间点药物含量数据。
他们服药后不同时间点药物含量数据。
关于调查数据和实验数据的收集可以根据关于调查数据和实验数据的收集可以根据数据本身的特点有多种不同的方法和设计,有专门数据本身的特点有多种不同的方法和设计,有专门的课程讲授,这里不作详细介绍。
的课程讲授,这里不作详细介绍。
n总体的某个指标总体的某个指标X,对于不同的个对于不同的个体来说有不同的取值体来说有不同的取值,这些取值构这些取值构成一个分布成一个分布,因此因此X可以看成一可以看成一个随机变量个随机变量.有时候就把有时候就把X称为称为总体总体.假设假设X的分布函数为的分布函数为F(x),也称也称F(x)为总体.7n数理统计主要任务是从总体中抽取数理统计主要任务是从总体中抽取一部分个体一部分个体,根据这部分个体的数根据这部分个体的数据对总体分布给出推断据对总体分布给出推断.被抽取的被抽取的部分个体叫做总体的一个样本部分个体叫做总体的一个样本.8随机样本:
随机样本:
从总体中随机地取从总体中随机地取n个个体个个体,称为称为一个随机样本。
一个随机样本。
简单随机样本:
满足以下两个条件的随机样本简单随机样本:
满足以下两个条件的随机样本(X1,X2,Xn)称为容量是称为容量是n的简单随机样本的简单随机样本。
1.1.代表性代表性:
每个每个Xi与与X同分布;同分布;2.2.独立性独立性:
X1,X2,Xn是相互独立的随机变量是相互独立的随机变量。
9说明说明:
后面提到的:
后面提到的样本样本均指均指简单随机样本简单随机样本。
注意注意:
一个容量为:
一个容量为n的样本的样本是指是指n个独立与总体分布相同的随机变量。
个独立与总体分布相同的随机变量。
一旦对样本进行观察,得到实际数值一旦对样本进行观察,得到实际数值称为样本观察值(或样本值)。
称为样本观察值(或样本值)。
两次观察,样本值可能是不同的。
两次观察,样本值可能是不同的。
12,nxxxL12,nXXXL10n如何取得的样本才称是简单随机样本如何取得的样本才称是简单随机样本?
对于有限总体对于有限总体,采用放回抽样就能得采用放回抽样就能得到简单随机样本到简单随机样本.但当总体容量很大的时候但当总体容量很大的时候,放回抽样放回抽样有时候很不方便有时候很不方便,因此在实际中当总体容量比较因此在实际中当总体容量比较大时大时,通常将不放回抽样所得到的样本近似当作通常将不放回抽样所得到的样本近似当作简单随机样本来处理简单随机样本来处理.对于无限总体对于无限总体,一般采取不放回抽样一般采取不放回抽样.1112(88,88)(88,75)(88,70)(88,63)(75,88)(75,75)(75,70)(75,63)(70,88)(70,75)(70,70)(70,63)(63,88)(63,75)(63,70)(63,63)例例1.11.1有有44个学生参加概率论与数理统计个学生参加概率论与数理统计课程考试,成绩分别为课程考试,成绩分别为88,75,70,63.88,75,70,63.现从中抽取容量为现从中抽取容量为22的样本,列出的样本,列出全部的样本全部的样本.答:
共有答:
共有1616个样本,分别为:
个样本,分别为:
统计量:
样本的不含任何未知参数的函数。
统计量:
样本的不含任何未知参数的函数。
常用统计量:
设(常用统计量:
设(X1,X2,Xn)为取自总体)为取自总体X的简单随机样本。
常用的统计量如下:
的简单随机样本。
常用的统计量如下:
111.niiXXn样本均值1113.1,2,1()1,2,nkkiinkkiikAXknkBXXkn样本矩阶矩:
阶中心矩:
22112.(),1niiSXXSn样本方差为样本标准差131222,(),()()(),3()()nkkkkkkXXXEXVarXEXEXXSAEXBEXmsmmsm=-K对于总体是来自总体的样本设下列数字特征存在,问:
(1)与,
(2)与,()与,(4)与都相等吗?
思考题思考题:
答:
不对。
前者是随机变量,观察两次得到答:
不对。
前者是随机变量,观察两次得到的统计量的值可能不一样;的统计量的值可能不一样;后者是数,可能已知也可能未知。
后者是数,可能已知也可能未知。
14一般一般,用样本均值用样本均值X作为总体均值作为总体均值()EX的估计的估计;用样本方差用样本方差2S作为总体方差作为总体方差22()EX的估计的估计;用样本用样本原点原点矩矩kA作为总体原点矩作为总体原点矩()kkEX的估计的估计;用样本用样本中心矩中心矩kB作为总体中心矩作为总体中心矩()kkEX的估计的估计.总体方差的估计可以用总体方差的估计可以用2S也可以也可以2B,主要的区别主要的区别涉及涉及到到“无偏无偏性性”(这个这个概念概念将在将在第第七七章章讨论讨论).当总体数字特征未知时当总体数字特征未知时(设各阶矩存设各阶矩存在在)1516例1.2接例1.1,总体为88,75,70,63,显然,总体均值为74.计算全部16个样本的样本均值.从中看到,用样本均值估计总体均值,可能估计过高,可能估计过低。
所有样本均值的平均值恰好是总体均值。
(无偏性)样本样本编号编号样本样本样本样本均值均值样本样本编号编号样本样本样本样本均值均值样本样本编号编号样本样本样本样本均值均值1(88,88)887(75,70)72.513(63,88)75.52(88,75)81.58(75,63)6914(63,75)693(88,70)799(70,88)7915(63,70)66.54(88,63)75.510(70,75)72.516(63,63)635(75,88)81.511(70,70)7016个样本均值的平个样本均值的平均为均为746(75,75)7512(70,63)66.5()222nccc分布记为,176.26.2分布分布t分布分布F分布分布2c2c(一一)分布分布定义:
设随机变量相互独立定义:
设随机变量相互独立,12,nXXXL()()0,11,2,iXNin=L则称则称221=
(1)niiXc=服从自由度为服从自由度为n的的其中,自由度指其中,自由度指
(1)
(1)式右端包含的独立变量式右端包含的独立变量个数个数.18()()()()2221101,0,2220,0,.nyxnyeyfynyxedxaca-+-骣琪=G桫G=分布的概率密度函数为:
其中,x()fx010n=1n=4n=2c分布的概率密度函数()2nac02c分布的分位数x()fxa192c分布的性质分布的性质21221212(),1,2,();iiYniYYYYnncc=+2.2.设且相互独立,则有设且相互独立,则有2222(),(),()2;nEnVarncccc=1.1.设则有设则有2c分布可加性分布可加性()212211,1,2,.iimmmiiiiYnimYYYYncc=骣琪桫邋LL一般地,若,相互独立,则()()()()()22222,01,nnfdynynnacaaccaaaaacc=为分布的上分对给定的概率称满足条件的点上分位数的值可查位数分布表20在在Excel表单的任一单元格输入“表单的任一单元格输入“=CHISQ.INV.RT(0.1,25)”;点击点击确定确定即在单元格中出现即在单元格中出现34.382.2120.1(25).c例例2.12.1利用利用ExcelExcel求求()()2212222122223452.2,1()5)
(2)(),nniiXNXXXXXnaXXbXXXkabkmsmscmsc=-=-+-L1例设总体已知,是取自总体的样本.求
(1)统计量的分布;
(2)设,若(则各为多少?
221,2,iiXYinms-=L解:
(1)作变换()12,0,11,2,niYYYYNin=LL显然相互独立,且()22211()nniiiiXYnmccs=-=邋2于是2321212
(2)(0,2),(0,1)2XXXXNNss-234534522(0,6),(0,1)6XXXXXXNNss-345122223451222226
(2)()
(2)26XXXXXXXXXXsscss-+与相互独立,故221,21,62.abkss=24()()()()1212226.41,nnnttnfttnnp+-+G骣=+-+琪桫G定理:
分布的概率密度为:
()()()()121222,1,nnnttnftntnnp+-+G骣=+-+琪桫G分布的概率密度函数为:
设)1,0(NX,nY2,并且假设YX,相互独立,则称nYXT/服从自由度为n的t分布.记为)(ntT25(二二)t分布分布()tn分布概率密度函数26()()()(),01,tnftndttntnttaaaaaaa=-分布的概率密度函数为:
中定:
其理()()()ababGG=G+.30()12,Fnn分分布布概概率率密密度度函函数数()12;,fxnn()()()()()1212,121212,01,;,FnnfxnndxFnnFnnFnnFaaaaaaa=对于给定的称满足条件的点为分布的上分位数.的值可查分布表.111221(,)(,)FnnFnnaa-=31在在Excel表单的任一单元格输入表单的任一单元格输入“=F.INV.RT(0.1,9,10)”定理定理6.3.1设设12,nXXX为来自正态总体为来自正态总体),(2N的简单随机样本的简单随机样本,X是样本均值是样本均值,2S是样本方差是样本方差,则有则有:
nNX2,.6.36.3正态总体下的抽样分布正态总体下的抽样分布33定理定理6.3.2设设12,nXXX为来自正态总体为来自正态总体),(2N的简单随机样本的简单随机样本,X是样本均值是样本均值,2S是样本方差是样本方差,则有则有:
(1)1()1222nSn(,
(2)X与与2S相互独立相互独立.342122212212,(,)()1()2nniiniiXXXNXSXXXmssms=-L设是来自正态总体的简单随机样本,和分别是样本均值和样本方差。
问:
()服从什么分布?
()服从什么分布?
思考题思考题:
22
(1)()nncc-答:
(1),
(2).35定理定理6.3.3设设12,nXXX为来自正态总体为来自正态总体),(2N的简单随机样本的简单随机样本,X是样本均值是样本均值,2S是样本方差是样本方差,则有则有:
(1).XtnSnm-3622=
(1).
(1)
(1)XXntnnSSnnmmss-注意到222211111222222222
(1)(1,1);SSFnnSSssss=-则37定理定理6.3.46.3.4设样本和分别设样本和分别来自总体和且相互独立,来自总体和且相互独立,样本均值分别为样本方差分别为样本均值分别为样本方差分别为()()1211,nnXXYYLL()()221122,NNmsms,XY2212,SS()()12221212
(2)(0,1);XYNnnmmss-+2222111122122222112222
(1)
(1)(1,1);
(1)
(1)SnSnSFnnnnSssss-=-注意到38()()()()()222121212122211222212(3),2.1111,.2wwwwXYtnnSnnnSnSSSSnnsssmm=-+-+-+-=+-当时其中,()()()()()1212122211222212112.11(+)
(2)XYnntnnnSnSnnmmsss-+-+-()()2122223.1,(),(),();
(2),()nXXXXXSEXVarXESXNVarSmsmsL例设总体的均值,方差存在,是取自总体的样本,为样本均值和样本方差;求:
(1)若,求.391111()()(),nniiiiEXEXEXnnm=邋解:
(1)221111()()(),nniiiiVarXVarXVarXnnns=邋22221111()()()11nniiiiESEXXEXnXnn=-=-邋2211()()1niiEXnEXn=-2222211()().1ninnnssmms=+-+=-4022
(1)2
(1)nSVarns轾-犏臌422().1VarSns-()2222
(1)
(2),
(1),nSXNnmscs-41()()()2141922121422213.2,(),
(2)()4iiXNXXYYXXSYSXYatkakSXSmsm=-LL例设总体,与是取自总体的两个独立样本,和分别为样本均值和样本方差;求
(1)若则各为多少?
服从什么分布?
4222
(1)(,),(,),49XNYNXYssmmQ且与相互独立,212161336(3)31313XYSXYttSss-=由分布定义,2221123(3),SXYScs-又且与相互独立,2136(0,),(0,13613XYXYNNss-()613,3.13ak=432422222214222181
(2)()(4),(8),()iiiiSXXSmccssm=-且与独立,24422222221181()()4(4,8).48iiiiFSXXSFmmss=-=-邋由分布定义知,44
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 分布
![提示](https://static.bdocx.com/images/bang_tan.gif)