第四章总体均数估计假设检验PPT资料.pptx
- 文档编号:15497876
- 上传时间:2022-11-02
- 格式:PPTX
- 页数:69
- 大小:6.69MB
第四章总体均数估计假设检验PPT资料.pptx
《第四章总体均数估计假设检验PPT资料.pptx》由会员分享,可在线阅读,更多相关《第四章总体均数估计假设检验PPT资料.pptx(69页珍藏版)》请在冰豆网上搜索。
样本均数的抽本均数的抽样分布具有如下分布具有如下特点:
特点:
132022/11/2142022/11/2例:
例:
2000年某研究者随机年某研究者随机调查某地健康成年男子某地健康成年男子27人,得到血人,得到血红蛋白量的均数蛋白量的均数为125g/L,标准差准差为15g/L。
试估估计该样本均数的抽本均数的抽样误差。
差。
所以所以该样本均数的抽本均数的抽样误差差为2.89g/L。
样本均数分布的常用性质样本均数分布的常用性质152022/11/2162022/11/2二、二、tt分布分布11、若某一随机变量、若某一随机变量XX服从总体均数为服从总体均数为,总体标准差为,总体标准差为的正态分布的正态分布N(N(,22),),则则可可通过通过uu变换变换()()将一般正态分布转化为将一般正态分布转化为标准正态分布标准正态分布N(0,N(0,1122),),即即uu分布。
分布。
172022/11/222、若某一随机变量服、若某一随机变量服从总体均数为从总体均数为,总体标准差为,总体标准差为的正态分布的正态分布N(N(,22),),则则可通过可通过uu变换将(变换将()一般正态分布)一般正态分布转化为标准正态分布转化为标准正态分布N(0,N(0,1122),),即即uu分布。
182022/11/2192022/11/2TT分布创始人分布创始人-WilliamGosset-WilliamGossetv英国英国统计学家学家WilliamGosset发现t分布与正分布与正态分布不同,曲分布不同,曲线下面下面积与抽与抽样例数有关。
例数有关。
v1980年他以笔名年他以笔名“student”发表了表了t分布。
v使依据小使依据小样本本进行行统计推断成推断成为可能。
可能。
202022/11/2212022/11/2例:
从13岁女学生身高这个正态总体中分别作样本量为3和50的随机抽样,各抽取1000份样本,并分别得到1000个样本均数及其标准误。
对它们分别作(4-4)式的t转变换,并将t值绘制相应的直方图。
222022/11/2如图5-12(a)、(b)所示。
可以看出,这两个t值分布图并不完全一样,样本量为3的图(a)较之样本量为50的图(b)显得矮胖,两侧尾部稍高。
232022/11/2vt值的分布与自由度有关(实际是是样本含量本含量n不同不同)。
t分布的图形不是一条曲线,而是一簇曲线。
=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3不同自由度下的t分布图242022/11/2t分布的图形有如下特征:
单峰分布,以0为中心,左右对称。
t分布与自由度有关。
df越小,则曲线的峰部越矮,尾部越高,t值越分散;
随着自由度逐渐增大,t分布逐渐逼近标准正态分布;
当df趋于时,t分布就完全成为标准正态分布,故标准正态分布是t分布的特例。
(3)t值越大,对应t值外侧面积(概率)就越小。
tt分布的规律分布的规律252022/11/2统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度下的t界值表(附表2)。
t界值表:
横标目为自由度,纵标目为概率P。
t临界值:
表中数字表示当和P确定时,对应的值。
单侧概率(one-tailedprobability):
用t,表示双侧概率(two-tailedprobability):
用t/2,表示正态分布概率呢?
正态分布概率呢?
两个分布尾部的界值和概率两个分布尾部的界值和概率262022/11/2统计中常用分布尾部面积,记为“”,对应的u值或t值,记为u/2或t/2,v界值。
通过与界值逼近,对抽样结果进行概率推断。
u0.05/2=1.96P(tt/2,v)=?
vt界界值表表P432:
272022/11/2df单侧0.25双双侧0.50.10.2.0.00050.00111.0003.078.636.61920.8161.886.31.599.100.7001.372.4.578282022/11/2v例如例如,当当=16=16,单侧概率,单侧概率P=0.05P=0.05时,由表中查得单侧时,由表中查得单侧tt0.05,160.05,16=1.746=1.746;
而当;
而当=16=16,双侧概率,双侧概率P=0.05P=0.05时,由表中时,由表中查得双侧查得双侧tt0.05/2,160.05/2,16=2.120=2.120。
按。
按tt分布的规律,理论上有分布的规律,理论上有单侧:
单侧:
PP(tttt0.05,160.05,16)=0.05=0.05和和PP(tttt0.05,160.05,16)=0.05=0.05双侧:
双侧:
PP(tttt0.05/2,160.05/2,16)PP(tttt0.05/2,160.05/2,16)=0.05=0.05t界值含义:
理论上在该总体抽样,抽到t值t界值的概率P。
292022/11/2更一般的表示方法如更一般的表示方法如图图(a)a)和和(b)(b)中阴影部分所示为:
中阴影部分所示为:
PP(tttt,)=和和PP(tttt,)=双侧:
PP(tttt/2,/2,)PP(tttt/2,/2,)=302022/11/2从从t界界值表表中亦可中亦可看出:
看出:
(1)在在相同自由度相同自由度时,t值越大,概率越大,概率P越小;
越小;
(2)而而在相同在相同t值时,双,双侧概率概率P为单侧概率概率P的两倍,即的两倍,即t0.10/2,16=t0.05,16=1.746。
(3)同同样的尾部面的尾部面积,t分布的界分布的界值大于大于标准正准正态分布的界分布的界值。
df趋于于,t分布界分布界值逼近正逼近正态分布界分布界值。
=(标准正态分布)=15012345-1-2-3-4-5f(t)0.10.20.3不同自由度下的t分布图三、总体均数的估计三、总体均数的估计312022/11/2统计推断参数估计假设检验点估计区间估计参数估计:
用样本指标(统计量)去估计总体指标(参数)322022/11/2332022/11/2v置信区置信区间:
区:
区间估估计所所给出的范出的范围称称为该参数的参数的(1-)可信区可信区间或置信区或置信区间(confidenceinterval,CI)。
v这个区个区间包含参数包含参数值的可信程度的可信程度为(1-),称称为可信度或置信度或可信概率。
可信度或置信度或可信概率。
342022/11/2v95%的可信区的可信区间的理解:
的理解:
v
(1)所要估)所要估计的的总体参数有体参数有95%的可能在我的可能在我们所估所估计的可信区的可信区间内。
内。
v
(2)从正)从正态总体中随机抽取体中随机抽取100个个样本,可算得本,可算得100个个样本均数和本均数和标准差,也可算得准差,也可算得100个均数的可信区个均数的可信区间,平均平均约有有95个可信区个可信区间包含了包含了总体均数体均数。
v(3)但在)但在实际工作中,只能根据一次工作中,只能根据一次试验结果估果估计可可信区信区间,我,我们就就认为该区区间包含了包含了总体均数体均数。
352022/11/2v可信可信区区间具有两个要素具有两个要素
(1)准确度(准确度(accuracy),即可信区),即可信区间包含的概包含的概率的大小,一般而言概率越大越好率的大小,一般而言概率越大越好。
v反映在反映在(1-)的大小,即区的大小,即区间包含包含总体参数的可能体参数的可能性性(概率概率)的大小,准确度越接近的大小,准确度越接近1越好。
越好。
v例如例如;
99%比比95%犯犯错误的的风险小小vv
(2)精确度(精确度(precision),反映区),反映区间的的长度,区度,区间的的长度越窄,估度越窄,估计的精确度越好,反之越差。
的精确度越好,反之越差。
v精确度与精确度与资料的料的样本含量、本含量、标准差和准差和(1-)的大小有关,的大小有关,在在标准差不准差不变,(1-)确定的情况下,增大确定的情况下,增大样本含量是控本含量是控制置信区制置信区间的的宽度的有效度的有效办法,法,n增大,相增大,相应的界的界值(如如s界界值)减少,减少,标准准误也减小,可提高精确度。
也减小,可提高精确度。
v在在样本含量确定的情况下本含量确定的情况下.(1-)愈大,愈大,总体参数估体参数估计的的准确度愈高,但精确度愈差。
准确度愈高,但精确度愈差。
为兼兼顾准确度和精确度,常准确度和精确度,常用用95%置信区置信区间。
362022/11/2372022/11/2v总体均数可信区体均数可信区间的的计算算v需考需考虑:
v
(1)总体体标准差准差是否已知,是否已知,v
(2)样本含量本含量n的大小的大小v通常有两通常有两类方法:
方法:
v
(1)t分布法分布法
(2)u分布法分布法382022/11/21.1.单一总体单一总体均数未知的均数未知的可信区间可信区间392022/11/2例例5-3:
已知某地:
已知某地27名健康成年男子的血名健康成年男子的血红蛋白量蛋白量均数均数=125g/L,标准差准差S=15g/L。
试问该市地市地健康正常成年男子血健康正常成年男子血红蛋白血清胆固醇平均含量蛋白血清胆固醇平均含量的的95%置信区置信区间和和99%置信区置信区间各是多少各是多少?
解:
本例n=27,=271=26,查t界值表(附表2),=0.05时,双侧t0.05/2,26=2.056,=0.01时,t0.01/2,26=2.779;
按公式计算402022/11/2412022/11/2422022/11/2432022/11/2v例例某地抽取正常成年人某地抽取正常成年人200名,名,测得其血清胆固得其血清胆固醇的均数醇的均数为3.64mmol/L,标准差准差为1.20mmol/L,估,估计该地正常成年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 总体 估计 假设检验