第9章t检验.docx
- 文档编号:3481044
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:25
- 大小:1.23MB
第9章t检验.docx
《第9章t检验.docx》由会员分享,可在线阅读,更多相关《第9章t检验.docx(25页珍藏版)》请在冰豆网上搜索。
第9章t检验
第9章t检验
t检验(t—tests)又称Studentt检验(学生氏t检验),它用以检验单样本均数与总体均数间
的差异性,两独立样本均数的差异性(独立样本t检验,又称成组t检验,团体t检验)和两样
本配对样本t检验(自身对照)。
它以t分布为其理论基础,具体假设依各种问题的不同而异。
9.1单样本均数t检验
单样本均数t检验(one—Samplet-testforaMean)可以对单样本均数与已知总体均数(一
般为理论值、标准值或经过大量观察所得的稳定值等)进行比较,目的是推断样本所代表的未知总体均数与已知的总体均数有无差别(即样本均数与总体均数的比较)。
[例9—1]已知某水样中含CaC03的真值(均数)为20.7mg/L,现用某方法重复测定该水样11次,CaC03的含量(mg/L)如下:
20.99,20.41,20.10,20.00,20.91,22.60,20q99,20.41,20,00,23.00,22.00
问该方法测得的均数是否偏高?
(杨树勤。
中国医学百科全书/医学统计学。
上海:
上海科学
技术出版社,1985.10.3)
(1)进入SAS/Win(v8)系统,单击Solutions-Analysis-Analyst,显示分析家窗口。
建立
如图9—1所示的SAS数据集文件Sasuser.CaCO3。
A为变量CaCO3;,并保存为Sasuser.CaCO3。
(2)单击Statistics-Hypothesis(假设检验)-one—Samplet-testforaMean(单样本均数t检验),得到图9.2所示对话框。
图9.1数据文件(部分)图9—2one—Samplet-testforaMean:
Cac03(单样本均数t检验)对话框
在图9—2所示对话框中可进行如下设置。
、
Variable,待选变量为A(CaCO3)(单击A—Variable)。
Hypotheses,假设检验。
Null(零假设):
Mean(均数)=20.7,本例的真值。
A1ternate(备择假设):
Mean“=0(非零),本例选择此项;Mean>0(大
‘o(小于零)。
Tests,检验。
Plots,作图。
Titles,标题。
Variables,变量。
(3)单击Tests按钮,得到图9—3所示对话框的ConfidenceIntervals(可信区间)
)单击Tests按钮,得到图9—3所示对话框的ConfidenceIntervals(可信区间)
图9—3ConfidenceIntervals(可信区间)选项卡
在ConfidenceIntervals选项卡可进行如下设置。
None,不选择可信区间。
Interval,选择可信区间(本例选择此项)。
Lowerbound,选择可信区间的下限。
Upperbound,选择可信区间的上限。
ConfidenceLevel(可信水平)95.0%,用户可根据需要选择不同的可信水平。
(4)在图9.3中,单击PowerAnalysis(功效分析)标签,得到图9—4所示对话框
Analysis选项卡。
在此选项卡选择Performpoweranalysis(执行功效分析)复选框
图9—4Poweranalysis(功效分析)选项卡
(5)单击0K按钮,返回图9.2所示对话框,单击Plots按钮,得到图9—5所示对话框,在此对话框中可进行如下设置。
Typeofplots,图形的类型(本例全选)。
Box—&—whiskerplot,箱形与触须线图。
Barchart,条形图。
tdistributionplot,t分布图。
图9—5one—Samplet-testforaMean:
Plots(图形)对话框
(6)单击0K按钮,返回图9—2所示对话框。
单击Titles按钮,得到图9—6所示对话框。
在此对话框中可进行如下设置。
Global,全局标题。
one—Samplet-testforaMean,单样本均数t检验,本例选择此项。
Settings,设置标题。
Overrideglobaltitles,优先于全局标题。
图9—6Titles(标题)对话框
(7)单击OK按钮,返回图9—2所示对话框。
单击0K按钮,得到如下结果。
主要结果分析
P=0.3125,按α=0.05水准,不拒绝H0,因此,尚不认为该方法测得的均数偏高。
9.2两样本配对均数t检验
两样本配对均数t检验(Two-samplePairedt-testforMeans),即配对设计两样本均数比较,或称自身对照,或称相关样本t检验,它用于检验两相关样本或成对样本所得均数间是否有显著性差异,输出结果有均数(Mean),标准差(Std.Dev.),标准误差(Std.Error.),假如检验(HypothesisTests,无效假设,备择假设),t统计量与P值及箱形—触须线图(Box-&-whisker:
plot),条形图(Barchart),均数图(Meansplot),t分布图(tdistributionplot)等。
[例9-2]为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将20名女年龄面成10对。
每对中随机抽取一人服新药,另一人服用安慰剂。
经过一定时间后,测得总胆固醇含量(mmol/L),结果示于表9-1药是否影响女性血清总胆固醇含量(倪宗瓒,卫生统计学。
第4版,北京:
人民卫生出版社,2001.35~37)(本例为配对设计的定量资料,可用配对t检验)
表9-1新药组与安慰剂组血清总胆固醇含量[mmol/L]
A
4.4
5.0
5.8
4.6
4.9
4.8
6.0
5.9
4.3
5.1
B
6.2
5.2
5.5
5.0
4.4
5.4
5.0
6.4
5.8
6.2
(1)进入SAS/Win(8)Solutions->Analysis->Analyst,进入分析家窗口。
将表9-1的数据依次键入图9-7所示数据表中,单击File->Save->Sasuser,在MemberName中设置文件名Paired1,在MemberTypeData中选择Tables(DATA),单击Save,将数据保存为Paired1文件。
(2)单击Statistics->Hypothesis->Tests->Two->SamplePairedt-testforMeans,得到图9-8所示对话框。
本例待检验分析的变量为A(新药组),B(安慰剂组)。
假设检验(Hypothesis)的无效假设(Null,或称零假设)为Mean(Groupl-Group2)=0。
在A1ternative(备择假设)选项区域可进行如下设置。
Mean(Group1-GrouP2)=0(非零,默认格式,本例选择此项)。
Mean(Groupl-Group2)>0(大于零)。
Mean(Groupl-Group2)<0(小于零)。
图9-7数据表
图9-8Two-SamplePairedt-testforMeans:
Pairedl(均数t检验)对话框
本例检验的第1组(Groupl)变量为A(单击A->Groupl),第2组(Group2)检验的变量
为B(单击B->Group2)。
设置后的效果如图9-9所示。
图9-9Two-SamplePairedt-testforMeans:
Pairedl(已选均数t检验)对话框
(3)单击Tests按钮,得到图9-10所示对话框的ConfidenceIntervals选项卡。
在ConfidenceIntervals(可信区间)选项卡中可进行如下设置。
None,不选可信区间(默认格式)。
Interval,可信区间(本例选择此项)。
Lowerbound,可信区间的下限。
Upperbound,可信区间的上限。
Confidencelevel,可信区间的水平。
可选择90%,95%,97.5%,99%。
默认本例选择此项。
(4)在图9-10所示对话框中,单击PowerAnalysis标签,得到图9-11所示对话框的PowerAnalysis(功效分析)选项卡。
图9-10ConfidenceIntervals(可信区间)选项卡
图9-11PowerAnalysis(功效分析)选项卡
在PowerAnalysis选项卡中可进行如下设置。
Performpoweranalysis,执行功效分析。
A1phas,
值(Values)。
用户可任意选择,例如0.001。
默认为0.05,本例选择此项。
Samplesizes,样本大小可选择Values(值),并可指明从(From)多少到(To)多少,步长(By)多少。
(5)单击OK按钮,返回图9-9所示对话框,单击Plots按钮,得到图9-12所示的对话框。
在图9-12所示对话框中可进行如下设置。
Typesofplots,作图的类型(本例全选)。
Box-&-whiskerplot,箱形与触须线图。
Barchart,条形图。
Meansp1ot,均数图。
tdistributionplot,t分布图。
Meansp1otoptions,均数图的选择项。
BarType,条形图类型。
Standarderrorofmean,均数的标准误差。
Standarddeviation,标准差。
Heightofbarsinstd.units,条形图标准单位的高度,可选1,2,3(倍),本例选择l。
Usepooledvariance,选用合并方差,本例选择。
Startverticalaxisat0,从零位置开始的起始垂直坐标轴,本例选择。
图9-12Two-SamplePairedt-testforMeans:
P1ots(作图)对话框
(6)单击OK按钮,返回图9-9所示对话框。
单击Titles按钮,得到图9-13所示对话框。
全局标题(G1obal)与设置标题(Settings)是隐含的。
图9-13Titles(标题)对话框
(7)分别单击Global,Settings标签,得到图9-14和图9-15所示选项卡。
图9-14G1oba;(全局性标题)选项卡
图9-15Settings(设置标题)选项卡
本例G1obal(全局性标题)(见图9-14)未选择,而Setting(设置标题)(见图9-15)只选择Includefilterdescription(包含过滤描述),其余不选择。
(8)单击OK按钮,返回图9-13所示对话框。
单击OK按钮,返回图9-9所示对话框。
单击OK按钮,完成计算与作图,得到经中文编辑整理后的结果。
结果分析‘
按
=0.05水准,由于P>0.15,新药组(A)与安慰剂组(B)的均数间没有显著性差异,尚不能认为该新药对女性血清总胆固醇含量有影响。
图形结果
本例操作在完成第(8)步以后,不仅完成了选择的统计检验计算,而且也完成了选择全部作图工作,但其结果隐藏于图9-16中,为了获得图形的真貌,还必须选择其中的相应指令。
在图9-16中,分别单击Boxplot,Barchart,Meansplot与tdistributionplot,得到相应图9-17、图9-18、图9-19和9-20所示图形结果。
还可以对这些图形作进一步的编辑。
图9-16配对分析
图9-17Box-&-whiskerplot(箱形与触须线图)
图9-18Barchart(条形图)
图9-19Meansplot(均数图)
图9-20tdistributionplot(t分布图)
[例9-3]将20名某病患者随机分为2组,分别将甲、乙两药治疗前和治疗1个月后的血沉(mm/h)列于表9-2。
问甲、乙两药治疗前后是否有疗效?
(倪宗瓒.卫生统计学.第4版,北京:
人民卫生出版社.2001.271)
表9-2甲、乙两药治疗前后的血沉[单位:
mml/h]
甲药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
治疗后
20
16
23
19
16
13
21
20
20
20
17
14
18
12
18
15
15
13
19
13
乙药
病人号
1
2
3
4
5
6
7
8
9
10
治疗前
治疗后
19
16
20
13
19
15
23
13
18
13
16
15
20
18
21
12
20
17
20
14
本例可用配对t检验,首先对甲药治疗前后的疗效进行推断。
(1)进人SAS/Win(v8)系统,单击So1utions->Analysis->Analyst,进入分析家窗口。
建立并保存如图9-21所示的SAS数据集文件Sasuser.treat,在SAS数据集文件Sasuser.treat个A为甲药治疗前的血沉(单位mm/h),B为甲药治疗后的血沉(单位mm/h);C为乙药治疗前的血沉(单位mm/L),D为乙药治疗后的血沉(单位mm/h)。
(2)单击So1utions->ASSIST->WorkPlace->Continue->DataAnalysis->Anova->T-tests->
PairedComparison,得到图9-22所示界面。
图9-21数据集文件treat
图9-22SAS/ASSIST:
PairedComparisonsT-test
(配对比较t检验)界面
(3)单击Table按钮,得到图9-23所示对话框。
本例SAS数据库(Libraries)选择SASUSER,数据表(Table)选择TREAT。
图9-23SAS/ASSIST:
Selecttable(选用数据表)对话框
(4)单击OK按钮,返回图9-22所示对话框。
单击Pairedcolumns按钮,得到图9-24所示对话框。
本例选择(Selected)的甲药治疗前的变量为A,甲药治疗后的变量为B。
图9-24Selectedtwocolumns(选用两个列变量)对话框
(5)单击OK按钮,得到图9-25所示界面。
本例选择的数据表(Table)为SASUSER.TREAT,配对列变量(Pairedcolumns)为AB。
图9-25SAS/ASSTST:
PairedComparisonsT-test(配对比较t检验)界面
(6)单击Run->Submit,得到如下结果。
结果分析
本例t=5.24,P<0.001,按
=0.05水准,拒绝
,接受
,可认为甲药也有疗效。
可以再用配对t检验,对乙药治疗前的疗效进行推断。
类似于以上操作,只需在图所示对话框中,选择列变量(乙药治疗前),(乙药治疗后),其他不变,即可得到以下结果。
本例t=5.30,P<0.001,按
=0.05水准,拒绝
,接受
,可认为乙药也有疗效。
换句话说,甲、乙两药都有疗效。
小结
SAS/Win(v8)中的配对t检验有SAS/Analyst(分析家)和SAS/ASSIST两个模块可以调用,例9-2是调用SA5/Analyst(分析家)模块,而例9-3是调用SAS/ASSIST模块,可见SAS/Analyst(分析家)模块有较详细的输出结果,并有图形,而SAS/ASSIST模块的输出结果较简捷。
值得一提的是,SAS/Win(v8)系统还可以用编程的方法获得配对t检验结果。
9.3两独立样本均数t检验
两独立样本均数t检验(Two-Samplet-testforMeans)用于比较两组样本均数(CompareTwoGroupMeans)差异显著性所需的Studentt统计量。
[例9-4]分别将测得的14例老年慢性支气管炎病人和11例健康人的尿中17酮类固醇排出量(mg/d1)示于表9-3。
试比较两组的均数有无差别?
(杨树勤.中国医学百科全医学统计学.上海:
上海科学技术出版社,1985.104)。
表9-3老年慢性支气管炎病人及健康人的尿中17酮类固醇排出量
病人
2.905.415.484.604.035.104.974.244.362.722.372.097.105.92
健康人
5.188.793.146.463.726.645.604.577.714.994.01
(1)进入SAS/Win(v8)系统,单击So1utions->Analysis->Analyst,进入分析家窗口。
建立SAS数据文件Sasuser.oldage(见图9-26),并保存。
其中,变量A为老年慢性支气管炎病人尿中17酮类固醇排出量,变量B为健康人的尿中17酮类固醇排出量。
(2)单击File->OpenBySASName->Sasuser->Oldage->0K,调人数据文件。
单击Statistics->HypothesisTests->Two-Samplest-testforMeans,得到图9-27所示对话框。
第一组变量(Groupl)选择A,第二组变量(Group2)选择B。
图9-26数据表文件
图9-27Two-Samplest-testforMeans:
Oldage(均数比较)对话框
(3)单击Tests按钮,得到图9-28所示对话框。
在ConfidenceIntervals(可信区间)选项卡中选择Interval选项。
图9-28ConfidenceIntervals(可信区间)选项卡
(4)单击PowerAnalysis标签,得到图9-29所示对话框的PowerAnalysis选项卡,具体设置见图9-29。
图9-29PowerAnalysis(功效分析)选项卡
(5)单击OK按钮,返回图9-27所示对话框,单击P1ots按钮,得到图9-30所示对话框。
图9-30Two-Samplest-testforMeans:
Plots(图形)对话框
(6)单击OK按钮,返回图9-27所示对话框。
单击OK按钮,得到如下结果。
图形结果如图9-31所示
主要结果分析
不论方差相等与否,P>0.05,按
=0.05水准,不拒绝
,尚不能认为老年慢性支气管炎病人与健康人的尿中17酮类固醇排出量不同。
其他分析方法
(1)如果表9-3的数据按图9-32所示格式建立,SAS数据文件为Oldagel。
其中,A为病人与健康人的尿中17酮类因醇排出量(mg/dl)。
B为分组变量:
1为病人组,2为健康人组。
也可以用此模块进行分析,这时,两样本均数比较(Two-Samplet-testforMeans)的假设如图9-33所示。
其他不变,也可以得到上述结果。
图9-31MeansPlot(均数图)
图9-32SAS数据文件Oldage1
图9-32Two-Samplet-testforMeansOldage1(均数比较)对话框。
(2)本例也可在程序编辑器(ProgramEditor)中编写如下程序:
optionsnodatenonumber;
datagtest;
inputgn@@;
doi=1ton;
inputx@@;
output;
end:
Cards;
114
2.905.415.484.604.035.104.974.244.362.722.372.097.105.92
211
5.188.793.146.463.726.645.604.577.714.994.01
;
procttestcochran;
c1assg;
varx;
run;
然后,单击Run->Submit,可以得到如下结果。
可见,这些输出结果与上述结果基本相同。
9.4u检验
当两样本含量较大时(即所谓大样本资料),除仍可用t检验(t--tests)外,还可以根据正近似原理,用u检验。
下面用一个程序对例9-5和例9-6进行分析。
[例9-5]测得30岁以上的冠心病患者142人的血清胆固醇,另以506名年龄相仿的
患者作对比(见表9-4)。
试分析冠心病患者的血清胆固醇是否较高?
(郭祖超.医用数理统
计方法.第3版,北京:
人民卫生出版社,1998.107)
表9-4冠心病患者的血清胆固醇(mg%)与非患者比较
例数(n)
均数(x)
标准差(s)
冠心病患者
非患者
142
506
223.6
180.6
45.8
34.2
[例9-6]某市于1957年和1973年抽查部分12岁男童的身高,初步计算结果如下:
1957年:
=120,
=139.9cm,
=7.5cm
1973年:
=153,
=143.7cm,
=6.3cm
试比较这两个年度12岁男童的身高均数有无差别?
(杨树勤.中国医学百科全书/医学统计
学.上海:
上海科学技术出版社,1985.105)
(1)进入SAS/Win(v8)系统,在主窗口的程序编辑器(ProgramEditor)中,将例9-5与例9-6的数据编写程序(见图9-34),或将已编辑好的并保存在d:
\sasdata中的源程序(含数据)utest1.sas调入程序编辑器,单击File->Open->d:
\sasdata\utest1.sas即可打开源程序。
图9-34源程序(含数据)utest1.sas
(2)单击Run->Submit,得到如下结果。
结果分析
(1)例9-5由于
=10.4035,P<0.01,在
=0.05水准上拒绝
,接受
l,故可认
为冠心病患者的平均胆固醇含量比非患者高。
(2)例9-6由于
=4.4532,P<0.0l,按
=0.05水准,拒绝
,接受
,故可认为该市两年度12岁男童身高均数不等,1973年男童的平均身高比1957年高。
9.5两独立样本(几何)均数t检验
│
本节将讨论比较两独立样本几何均数的方法,计算几何均数的变量多数是等比级数,而且不服从正态分布,因而不能直接对两个几何均数进行比较,一般取其对数(自然对数或常用对数)的变换值计算均数,当对数变换值服从正态分布或服从近似正态分布时,适于用t检验或u检验。
[例9-7]将钩端螺旋体病人的血清分别用标准株和水生株进行试验,结果示于表9-50试比较两组的平均效价。
(郭祖超.医用数理统计方法.第3版,北京:
人民卫生出版社。
1998.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验