5终身模块-统计学-抽样误差-假设检验.pptx
- 文档编号:30846287
- 上传时间:2024-02-03
- 格式:PPTX
- 页数:75
- 大小:3.14MB
5终身模块-统计学-抽样误差-假设检验.pptx
《5终身模块-统计学-抽样误差-假设检验.pptx》由会员分享,可在线阅读,更多相关《5终身模块-统计学-抽样误差-假设检验.pptx(75页珍藏版)》请在冰豆网上搜索。
计量资料的统计推断statisticalinferenceofmeasurementdata张建军汕大医学院预防医学教研室Tel:
0754-88900445统计推断:
参数估计,假设检验“世上有三种哄人的东西:
谎言、该死的谎言、统计数据”-英国政治家迪斯雷里。
“世上有三样激动人心的东西:
宣传、要命的宣传、统计数据”。
均数的抽样误差和标准误均数的抽样误差samplingerrorofmean概念:
由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),样本均数之间也互不相等,这种由抽样引起的差异称为均数的抽样误差。
即:
|iijXXXXmm构-称为抽样误差。
12中心极限定理:
如果随机变量的总体均数及方差有限,中心极限定理:
如果随机变量的总体均数及方差有限,当样本容量趋于无穷大时,样本均数的分布趋近于均数为当样本容量趋于无穷大时,样本均数的分布趋近于均数为总体均数,方差为的正态分布。
总体均数,方差为的正态分布。
22XN(,),N(,/n)Xmsms如果:
那么,2/ns如何估计?
用样本均数的标准差来估计,称标准误(standarderror)。
标准误越大,均数的抽样误差越大,样本均数与总体均数间的差异越大。
计算公式:
即:
由总体标准差,样本例数求得。
但通常以样本标准差作为总体标准差的估计值。
因此:
XSSn=Xnss=与标准差的区别:
标准差:
表示一般变量值的离散程度;均数标准误特别说明样本均数这一变量值离散程度的指标。
标准误的应用:
(1)用来衡量抽样误差的大小,标准误越小,样本均数与总体均数越接近,样本均数的可信度越高;
(2)结合标准正态分布与t分布曲线下的面积规律,估计总体均数的置信区间。
(3)用于假设检验。
假定2003年汕头市15岁女学生的身高(cm)服从N(155.4,5.32)。
用计算机做抽样模拟试验,每次抽出10个数字,组成一个样本,求出样本均数、样本标准差S。
再求得此100个样本均数的均数、样本均数的标准差(标准误)。
100个样本均数构成一个新的分布,也是正态分布(即使原分布为偏态分布,当样本含量足够大时,新分布也近似正态分布)。
新分布的集中趋势用均数的均数来表示,离散趋势用标准误表示N(,)。
各样本均数的均数等于总体均数。
Xm2Xs正态总体中抽样(样本量5)正态总体中抽样(样本量10)正态总体中抽样(样本量30)抽样时样本量大小决定了样本均数分布的形状,当样本量足够大时,均数分布趋向正态分布。
050100150200250300350400450均数频数050100150200250300350400450均数频数050100150200250300350400450500均数频数t分布(t-distribution)u分布:
u转换将正态分布转换为标准正态,N(0,1)。
同理:
将样本均数的分布也可以转换为标准正态分布即:
实际工作中,总体标准差往往未知,常用S代替计算标准误,因此:
就变为:
xums-=2,()(0,1)XNNmsXXums-=/XXXtSSnmm-=也就是说:
正分布态:
准正分布标态正量态变一实现这转变:
x-+2()1()21()2xfxemssp-=u-+2()21()2uuejp-=2,(,)(0,1)xuNNmmss-=均数的分布也是这样如果我们采用另一个正态变量:
于是,均数的分布变成了标准正态分布:
XXums-=2,()(0,1)XNNmsxums-=但是,条件发生变化我们通常用代替然而,随着样本量的变化而变化,所以,我们称之为t-分布,虽然它是正态分布,但只有当样本量(自由度)无穷大的时候,它才是标准正态分布,此时,u=t/XXXtSSnmm-=XXums-=XsXSXStt分布是一簇对称于0的单峰分布曲线。
自由度越小(相当于标准差大),曲线的中间越低,两边越高;随自由度增大,tt分布曲线逐渐逼近于标准正态分布曲线。
当自由度无穷大时,tt分布就是标准正态分布曲线。
每一条tt分布曲线,都对应于相应的自由度。
tt分布曲线下的面积规律:
与标准正态曲线下的面积规律相似:
在某一个自由度下,两侧外部总面积为5%5%的界限的tt值称为t0.05/2t0.05/2(),(),把两侧外部总面积为1%1%的界限的tt值称为t0.01t0.01/2()/2()。
中部占95%95%面积的tt值范围:
t0.05/2()-t0.05/2(),t0.05/2()-t0.05/2(),中部占99%99%面积的tt值范围:
-t0.01/2()-t0.01/2()-t0.01/2()-t0.01/2()。
当自由度确定时,占一定面积的t界限值,可以查表得出。
参考附表6(p436)。
例如:
查当自由度=20,两侧概率之和为0.05时,对应的t值:
t0.05/2(20)=2.086,单侧概率为0.05时,对应的t值:
t0.05(20)=1.725,t分布的主要应用:
(1)总体均数置信区间估计;
(2)t检验;使用t值表注意:
同一自由度下,P越小,t值越大;P值相同时,自由度越大,t越小;当自由度无穷大时,t值与u值相等。
这也是u分布与t分布的区别。
总体均数置信区间的估计参数估计:
点估计(pointestimation):
用样本统计量作为对总体参数的估计值()。
比如均数的估计。
区间估计(intervalestimation):
根据选定的置信度估计总体均数所在的区间(a50)足够大也可参考u分布进行95%置信区间:
99%置信区间:
2.58,2.58XXXSXS-+1.96,1.96XXXSXS-+3、总体标准差未知,样本例数较小按t分布原理,依据相应的自由度,查出该自由度下某个概率相应的界值,再按照中部占95%95%面积的tt值范围:
-t0.05/2()-t0.05/2()-t0.05/2()-t0.05/2(),中部占99%99%面积的tt值范围:
-t0.01/2-t0.01/2()-t0.01/2()()-t0.01/2()进行估计。
因为:
所以:
95%95%置信区间:
99%99%置信区间:
XXtSm-=0.05/2,0.05/2,XXXtSXtSnn-+0.01/2,0.01/2,XXXtSXtSnn-+例子:
p236课堂练习95%置信区间的意义:
理论上,用一次抽样所得的样本均数估计总体均数,犯错误的概率为5%.或进行100次抽样,可算得100个置信区间,平均有95个置信区间包括客观存在的总体均数,只有5个置信区间未包括总体均数。
估计置信区间的注意事项:
(1)区间是以上、下可信限为界的一个范围。
通常用表示置信限,用表示置信区间
(2)置信区间与正常值范围的意义、算法不同:
95%正常值范围一般是指同质总体内包括95%个体值的估计范围,若总体为正态分布,常用:
计算;95%置信区间是指按照95%置信度估计的总体参数的可能范围,按照下式计算。
前者用标准差,后者用标准误。
/2,()/2,()(,)XXXtSXtSanan-+/2,()XXtSan1.96XS0.05/2,()0.05/2,(),XXXtSXtSnn-+假设检验的基本思想和步骤假设检验(hypothesistesting):
亦称显著性检验(significancetest).是统计推断的另一个方面。
先对总体的参数或分布作出某种假设,如假设总体均数(或总体率)为一定值,两总体均数(或总体率)相等,总体服从正态分布或两总体分布相同等。
然后,用适当方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。
其结果将有助于研究者作出决策,采取措施。
在实际情况下:
由于抽样误差,从某总体中随机抽得的样本,得到的样本均数与该总体的均数不同;同一总体中两次抽样的样本均数也不相同。
这种差别的原因在于:
要么总体均数不同;要么总体均数相同,差别仅由抽样误差所致。
那么,当我们遇到这种情况时,如何判断?
可以通过某种方法来判断差别属哪种情况,这种方法就是假设检验。
假设检验HypothesisTesting假设检验的反证思想两种说法非A即B。
要证明B真,只要证明A伪即可。
无效假设Nullhypothesis(H0)意在推翻的假设(说法A)。
备择假设Alternativehypothesis(H1)意在接受的假设(说法B)。
从无效假设出发,找出不支持这一假设的证据,从而推翻它。
小概率事件smallprobabilityevent事件A发生的概率是如此之小,以至于在一次试验(抽样)时,我们往往认为它(事件A)不会发生。
统计学中,小概率事件一般是指发生概率0,0,(,则认为是大概率事件,本次的差异仅为抽样误差所致,因此,接受H0,拒绝H1,认为两均数来自同一总体。
称差异无统计学意义。
本例t=0.844,而相应的t界值:
t0.05/2,25=2.0640.8440.05按照=0.05水平,不拒绝H0,不能认为男性健康管理人员的血糖均数与一般成年男性的血糖均数不同。
两均数比较时常用的判断标准统计量u:
单侧:
u1.645,双侧:
u0.05,不拒绝H0;单侧:
u1.645,双侧:
u1.96,P0.05,拒绝H0;统计量t:
单侧;双侧P0.05,不拒绝H0;单侧:
双侧P0.05,拒绝H0;0.05,ttn0.05/2,ttn0.05,ttn0.05/2,ttn第一类错误与第二类错误typeIerror&typeIIerror假设检验的判断,并非百分之百正确,有两种可能错误:
假阳性错误(falsepositiveerror),称为第一类错误(typeIerror),用表示,即检验水准(levelofsignificance),通常取:
0.05。
即:
无效假设(H0:
u=u0)原本是正确的,但被拒绝,误判为有差别(弃真错误)。
当无效假设正确时,在100次抽样中,可以有5次推断是错误的。
统计上有意义的界限是允许犯第一类错误的界限。
假阴性错误(falsenegativeerror),称为第二类错误(typeIIerror)。
即,无效假设(H0:
u=u0)原本是错误的(实际上应是H1:
u=u1),但所得统计量t没有超过t0.05的水平从而接受了无效假设,错误地得出无差别的结论(取伪错误)。
用表示。
检验效能(poweroftest):
1-当两个总体存在差异时,所使用的统计检验能够发现这种差异(拒绝H0)的能力。
尽管是小概率事件,它还是有可能发生的。
I型错误:
虽然无效假设为真,但由于抽到了较大检验统计量的样本,使得P值小于检验水准而导致被拒绝。
是否为小概率事件是由检验水准而定,所以犯错误的概率也由检验水准而定。
II型错误:
虽然无效假设为假,但由于抽到了较小检验统计量的样本,使得P值大于检验水准而导致不被拒绝。
选择统计意义水平,应考虑两类错误对所要研究的事物的影响哪一个重要。
一般来说,定0.05为有统计学意义的水平是比较适宜的。
两类错误的关系:
在样本含量固定的条件下,减少I类错误,会增大II类错误;增大I类错误,会减少II类错误。
其他条件不变,增大样本含量可使第二类错误的概率减小。
同时正确的实验设计能够减少抽样误差,提高检验效能。
ta实际差别与统计意义统计意义:
抽到这样大统计量的可能性很小,可以拒绝H0。
但并不意味两总体均数差别很大。
样本量很大时,即使均数差别不大,统计学意义却显著。
样本小时,即使均数差别很大,统计学意义却不显著。
理解检验统计量观察到的量可以是一个样本的均数、两个样本均数的差、一个样本的百分构成、两个样本百分构成的差;检验统计量所服从的分布不一定是正态分布。
但只要是已知的理论分布,都可以通过该分布求得P值。
理解P值P值是指在无效假设的前提下,得到观察到的量(或更极端的量)的概率。
P值越小说明无效假设越不可靠。
或者说,P值越小我们就越有理由推翻无效假设。
至于P值是否属于“小”,一般的,我们是根据事先确定的检验水准来判断的。
当P时非小概率事件在无效假设的前提下,得到观察到的量(或更极端的量)的可能性还是相当大的,我们尚不能拒绝无效假设或者说拒绝无效假设的证据不足。
具体问题,专业判断P=0.70与P=0.07“差别有显著性”与“差别显著”“差别有高度显著性”与“差别极为显著”二者之间不存在必然的联系。
“差别显著”不一定导致“差别有显著性”,“差别不显著”倒是有很大可能导致“差别有显著性”。
即使“差别有显著性”,临床上也不一定有意义。
单侧检验还是双侧检验?
One-sidedortwo-sidedtest?
双侧检验永远是正确的单侧检验只有在少数情况下才是合适的即使要做单侧检验,也必须事先确定t检验和u检验是两种常见的假设检验的方法,因其统计量为t,u而得名。
u检验条件:
总体标准差已知,资料服从正态分布情况下
(1)样本均数与总体均数比较
(2)两大样本均数的比较;t检验条件:
用于样本量小、总体标准差未知时
(1)样本与总体均数比较
(2)配对设计资料比较(3)两样本均数比较(同时要求两样本的总体方差相同,服从正态分布)一、样本均数与总体均数的比较总体均数:
大量观测得到的稳定值或理论值,0比较的目的是推断样本所代表的未知总体均数与已知总体均数是否相同。
样本均数与总体均数比较的t检验P240例题14.10注意步骤、符号写法样本均数与总体均数比较的u检验例题:
若通过以往大规模调查,已知某地婴儿出生体重均数为3.20kg,标准差0.39kg,今随机查得25名难产儿平均出生体重为3.42kg,问:
出生体重与难产是否有关?
假定难产儿出生体重的标准差与一般儿童相同。
解题步骤据题意:
要检验的是,难产儿出生体重总体均数是否等于3.20kg(),0.39看作总体标准差,样本均数3.42,样本含量25。
1.建立假设:
H0,假设难产儿出生体重总体均数和一般婴儿出生体重总体均数相等,即:
0m0010:
HHmmmm=m2.计算合适的统计量:
在总体标准差已知,对样本均数和总体均数的差别做统计意义检验,可用公式:
u值服从均数为0,标准差为1的标准正态分布。
本例:
0XXums-=003.20,0.39,3.42,250.390.078253.423.202.820.078XXXnnXumsssms=-=则:
于是:
3.从正态分布表查临界值:
本例:
所以:
拒绝无效假设,接受备择假设。
认为难产和出生体重是有关的。
可以为,难产儿的出生体重平均来说是比较大一些。
0.050.011.962.58uu=,0.010.01uupP0.01,结论同前二、配对资料的比较配对设计:
两样本中的观察值由于存在某种联系而一一对应结成对子(matching)的情况.1、同一受试对象处理前后的比较:
高血压治疗前后的血压值,或每一名病人有一对数据;2、同一对象身体不同部位测定值比较:
如左右臂皮肤的敏感试验,测得红斑直径;3、同一样品两种不同方法测定结果:
两种仪器,两名化验员,两种条件等;4、成对设计:
动物配对后随机分到两组后的测定结果;这些资料的均数比较用t检验。
目的是验证差值的总体均数是否为零的假设。
P241例14.11计算两组资料的差值以及差值的均数,标准差,并将其差值转化为t分布,假设差值的总体均数为0,做配对t检验。
三、两样本均数比较推断两样本所代表的两个总体均数是否相同。
分两种情况:
1、大样本。
两样本含量均50,用u检验。
121212122222121212XXXXXXXXXXuSSSSSnn-=+2、两个小样本均数的比较(正态总体,方差齐)由专用公式计算合并方差,均数差值的标准误,再计算t值。
用合并自由度查t界值表。
确定概率,作出统计推断。
p243例14-121212xxxxtS-=122211221212()()11()
(1)
(1)xxxxxxSnnnn-+-=-+-邋t检验的条件:
正态总体,两总体方差相等。
如果:
两样本方差不齐,则应该用t检验。
3、方差不齐时均数差别的统计学意义检查(t检验)如何检验方差齐性?
方差齐性检验查F界值表,若大于相应的界值,则有统计学意义。
方差齐性检验:
p244例14-14,例14-15,检验总体变异程度2122(SFS大)小)t检验的过程1、计算两个样本均数之差的标准误,t值12(12)XXXXtS(12)1222221212XXXXSSSSSnn2、计算临界值:
220.05
(1)0.05
(2)120.052212XXXXStSttSS220.01
(1)0.01
(2)120.012212XXXXStSttSS3、将t分别与两个临界值比较,大于临界值,则P小于临界概率。
反之,大于临界概率。
4、做出两均数是否有区别的判断。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 终身 模块 统计学 抽样误差 假设检验