医学统计学第4讲抽样误差与t分布.pptx
- 文档编号:30803630
- 上传时间:2024-01-29
- 格式:PPTX
- 页数:44
- 大小:619.11KB
医学统计学第4讲抽样误差与t分布.pptx
《医学统计学第4讲抽样误差与t分布.pptx》由会员分享,可在线阅读,更多相关《医学统计学第4讲抽样误差与t分布.pptx(44页珍藏版)》请在冰豆网上搜索。
,第三章抽样误差与t分布,如:
总体均数总体标准差,如:
样本均数样本标准差S,总体,样本,抽取部分观察单位,统计量,参数,统计推断,统计推断,在医疗卫生实践和医学研究中,往往难以对所要研究的总体进行全部观察,通常从总体中随机抽取样本进行观察,然后由样本的信息去推断总体特征,这种研究方法叫做抽样研究方法。
用样本的信息去推断总体特征,这种分析方法称为统计推断。
总体参数的估计,均数的抽样误差t分布总体均数的估计,抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。
为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。
119.41cm=4.38cm,三次抽样得到了不同的结果!
原因何在?
如果没有个体变异,NoVariation!
NoSamplingError!
NoRandomsampling!
NoSamplingError!
如果没有抽样研究,三次抽样得到了不同的结果,原因何在?
个体变异,随机抽样,不同男童的身高不同,每次抽到的人几乎不同,抽样误差,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(samplingerror)。
各种参数估计都有抽样误差,这里我们以均数为研究对象,抽样误差产生的条件,抽样研究个体变异,抽样误差的表现,样本均数和样本均数间的差别,抽样误差是不可避免的,可以通过保证总体的同质性及增大样本含量来缩小抽样误差。
从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。
按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。
抽样误差的规律性正态分布抽样,抽样试验(n=5),抽样试验(n=10),抽样试验(n=30),1000份样本抽样计算结果,3个抽样实验结果图示,非正态分布抽样,分别从各总体中抽取10000个样本含量为n的样本,计算每个样本的均数,并绘制频数分布图。
n分别取2、4、10、25。
偏三角分布抽样,均匀分布,指数分布,双峰分布,从正态总体中随机抽样,其样本均数服从正态分布;从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;样本均数之均数的位置始终在总体均数的附近;随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。
中心极限定理,从正态总体中随机抽取例数为n的样本,样本均数x也服从正态分布,即使从偏态总体中抽样,只要样本例数足够大,如n50,样本均数x也近似正态分布。
从均数为,标准差为的正态总体中随机抽取例数为n的样本,样本均数的总体均数为,标准差为x,中心极限定理,标准误的定义,样本统计量(如均数)也服从一定的分布。
与描述观测值离散趋势的指标类似,样本统计量的标准差就反映了从某个总体中随机抽样所得样本之均数分布的离散程度。
用样本统计量的标准差来反映抽样误差的大小。
又称标准误(standarderror)。
x,标准误,标准误的意义,反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。
标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。
反之亦然。
标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。
说明我们可以通过增加样本含量来减少抽样误差的大小。
用途:
(1)衡量样本均值的可靠性,
(2)估计总体均值的可信区间,(3)用于均数的假设检验,t分布,随机变量XN(m,s2),标准正态分布N(0,12),u变换,标准正态分布N(0,12),均数,Studentt分布自由度=n-1,t变换,由W.S.Gosset提出,对于不同的n,有不同的t分布曲线。
(n-1)称为t分布的自由度,自由度分别为1、5、时的t分布,t分布的特征:
t分布为一簇单峰分布曲线。
t分布以0为中心,左右对称。
t分布与自由度有关,自由度越小,t分布的峰越低,而两尾越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。
t分布曲线下面积规律,t分布曲线下总面积仍为1或100%t分布曲线下面积以0为中心左右对称由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,其通式为单侧:
P(t-t,)=或P(tt,)=双侧:
P(t-t/2,)+P(tt/2,)=图中非阴影部分面积的概率为,P(-t/2,tt/2,)=1-,t分布的界值,t,检验水准(尾端概率),自由度,t界值表横标目:
自由度,纵标目:
尾端概率,p,即曲线下阴影部分的面积;表中的数字:
相应的|t|界值。
附表2,t分布表的特点,附表2的横标目为自由度,纵标目为概率P,表中数值为其相应的t界值,记作t,。
附表2只列出正值,若计算的t值为负值时,可用其绝对值查表。
附表2右上附图的阴影部分表示t,以外尾部面积的概率。
单侧t0.05,30=1.697,表示=30时,t1.697的概率或t-1.697的概率为0.05,记作P(t-1.697)=0.05或P(t1.697)=0.05;,双侧t0.05,30=2.042,表示=30时,t2.042的概率和t-2.042的概率之和为0.05,记作P(t-2.042)+P(t2.042)=0.05,图中非阴影部分面积的概率为:
P(-/2,tt/2,)=1-从附表2中还可以看出,双侧概率P为单侧概率的两倍,如双侧t0.10/2,30=单侧t0.05,30=1.697,标准误与标准差的关系,区别标准差s标准误sx意义个体变异统计量的抽样误差用途正常值范围总体均数的可信区间(x1.96s)(xt,sx)与n关系ns趋于稳定nsx趋于0,联系1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。
2.当样本含量不变时,标准差大,标准误亦大,均数的标准差与标准误成正比。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 抽样误差 分布