第四讲 两组计量资料平均水平的统计检验.docx
- 文档编号:25988569
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:13
- 大小:19.19KB
第四讲 两组计量资料平均水平的统计检验.docx
《第四讲 两组计量资料平均水平的统计检验.docx》由会员分享,可在线阅读,更多相关《第四讲 两组计量资料平均水平的统计检验.docx(13页珍藏版)》请在冰豆网上搜索。
第四讲两组计量资料平均水平的统计检验
Stata软件基本操作和数据分析入门
第四讲两组计量资料平均水平的统计检验
一、配对设计的平均水平检验
统计方法选择原则:
如果配对的差值服从近似正态分布(小样本)或大样本,则用配对t检验
小样本的情况下,配对差值呈明显偏态分布,则用配对秩符号检验(matched-pairssigned-rankstest)。
例110例男性矽肺患者经克矽平治疗,其血红蛋白(g/dL)如下:
表10例男性矽肺患者血红蛋白值(g/dL)
病例号
1
2
3
4
5
6
7
8
9
10
治疗前
11.3
15.0
15.0
13.5
12.8
10.0
11.0
12.0
13.0
12.3
治疗后
14.0
13.8
14.0
13.5
13.5
12.0
14.7
11.4
13.8
12.0
问:
治疗前后的血红蛋白的平均水平有没有改变
这是一个典型的前后配对设计的研究(但不提倡,因为对结果的解释可能会有问题)
Stata数据输入结构
X1
X2
11.3
14
15
13.8
15
14
13.5
13.5
12.8
13.5
10
12
11
14.7
12
11.4
13
13.8
12.3
12
操作如下:
gend=x1-x2产生配对差值的变量d
sktestd正态性检验
正态性检验结果如下:
.sktestd
Skewness/KurtosistestsforNormality
-------joint------
Variable|Pr(Skewness)Pr(Kurtosis)adjchi2
(2)Prob>chi2
-------------+-------------------------------------------------------
d|0.2790.7741.430.4885
正态性检验的无效假设为:
资料正态分布
相应的备选假设为:
资料非正态分布
=0.05,由于正态性检验的P值=0.4885>>,故可以认为资料近似服从正态分布。
ttestd=0配对t检验:
H0:
d=0vsH1:
d0,=0.05
结果如下:
One-samplettest
------------------------------------------------------------------------------
Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
---------+--------------------------------------------------------------------
d|10-.6799999.52042721.645735-1.857288.4972881
------------------------------------------------------------------------------
Degreesoffreedom:
9
Ho:
mean(d)=0
Ha:
mean<0Ha:
mean~=0Ha:
mean>0
t=-1.3066t=-1.3066t=-1.3066
P
P值=0.2237>,故认为治疗前后的血红蛋白的平均数差异没有统计学意义。
即:
没有足够的证据可以认为治疗前后的血红蛋白的总体平均数不同。
如果已知差值的样本量,样本均数和样本标准差,可以用立即命令如下。
设:
已知样本量为10,差值的样本均数为-0.66,差值的标准差为1.65,则输入命令如下:
ttesti样本量样本均数样本标准差0
本例为:
ttesti10-0.661.650
得到下列结果如下:
.ttesti10.661.650
One-samplettest
------------------------------------------------------------------------------
|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
---------+--------------------------------------------------------------------
x|10.66.52177581.65-.52033891.840339
------------------------------------------------------------------------------
Degreesoffreedom:
9
Ho:
mean(x)=0
Ha:
mean<0Ha:
mean~=0Ha:
mean>0
t=1.2649t=1.2649t=1.2649
P
结果解释与结论同上述相同。
如果对于小样本的情况下,差值不满足正态分布,则用Match-Sign-ranktest,操作如下:
signrank差值变量名=0
假如本例不满足正态分布(为了借用上例资料,而假定的,实际上本例满足正态分布)则
H0:
差值的中位数=0
(其意义是治疗前的血红蛋白配大于治疗后的血红蛋白的概率=治疗前的血红蛋白小于治疗后的血红蛋白的概率)
H1:
差值的中位数0
=0.05
本例为signrankd=0
Wilcoxonsigned-ranktest
sign|obssumranksexpected
-------------+---------------------------------
positive|41827
negative|53627
zero|111
-------------+---------------------------------
all|105555
unadjustedvariance96.25
adjustmentforties0.00
adjustmentforzeros-0.25
----------
adjustedvariance96.00
Ho:
d=0
z=-0.919
Prob>|z|=0.3583
P值=0.3583>>,故没有足够的证据说明两个总体不同。
二、平行对照设计的两组资料平均水平统计检验
统计方法选择原则:
如果两组资料的方差齐性和相互独立的,并且每组资料服从正态分布(大样本资料可以忽略正态性问题),则用成组t检验,否则可以用成组Wilcoxon秩和检验。
例2为研究噪声对纺织女工子代智能是否有影响,一研究人员在某纺织厂随机抽取接触噪声95dB(A)、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工,其子女(学前幼儿)作为研究对象,按韦氏学前儿童智力量表(中国修订版)测定两组幼儿智商,结果如下。
问噪声对纺织女工子代智能有无影响?
(接触组group=0,不接触组group=1)
资料及其结果如下:
group
x
0
79
0
93
0
91
0
92
0
94
0
77
0
93
0
74
0
91
0
101
0
83
0
73
0
88
0
102
0
90
0
100
0
81
0
91
0
83
0
106
0
84
0
78
0
87
0
95
0
101
1
101
1
100
1
114
1
86
1
106
1
107
1
107
1
94
1
89
1
104
1
98
1
110
1
89
1
103
1
89
1
121
1
94
1
95
1
92
1
109
1
98
1
98
1
120
1
104
1
110
方差齐性检验
H0:
1=2vsH1:
12
=0.1
两组方差齐性的检验命令(仅适合两组方差齐性检验)
sdtestx,by(group)
Varianceratiotest
------------------------------------------------------------------------------
Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]
---------+--------------------------------------------------------------------
0|2589.081.8229289.1146485.3176692.84234
1|25101.521.9009829.50491197.59657105.4434
---------+--------------------------------------------------------------------
combined|5095.31.57745611.154392.1299898.47002
------------------------------------------------------------------------------
Ho:
sd(0)=sd
(1)
F(24,24)observed=F_obs=0.920
F(24,24)lowertail=F_L=F_obs=0.920
F(24,24)uppertail=F_U=1/F_obs=1.087
Ha:
sd(0) (1)Ha: sd(0)~=sd (1)Ha: sd(0)>sd (1) P P值=0.8389>>,因此可以认为两组方差齐性的。 正态性检验: H0: 资料服从正态分布vsH1: 资料偏态分布 =0.05 每一组资料正态性检验 sktestxifgroup==0 Skewness/KurtosistestsforNormality -------joint------ Variable|Pr(Skewness)Pr(Kurtosis)adjchi2 (2)Prob>chi2 -------------+------------------------------------------------------- x|0.9270.3261.050.5926 .sktestxifgroup==1 Skewness/KurtosistestsforNormality -------joint------ Variable|Pr(Skewness)Pr(Kurtosis)adjchi2 (2)Prob>chi2 -------------+------------------------------------------------------- x|0.4740.6750.730.6948 P值均大于,因此可以认为两组资料都服从正态分布 H0: 1=2vsH1: 12 =0.05 ttestx,by(group) Two-samplettestwithequalvariances ------------------------------------------------------------------------------ Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval] ---------+-------------------------------------------------------------------- 0|2589.081.8229289.1146485.3176692.84234 1|25101.521.9009829.50491197.59657105.4434 ---------+-------------------------------------------------------------------- combined|5095.31.57745611.154392.1299898.47002 ---------+-------------------------------------------------------------------- diff|-12.442.633781-17.73557-7.144429 ------------------------------------------------------------------------------ Degreesoffreedom: 48 Ho: mean(0)-mean (1)=diff=0 Ha: diff<0Ha: diff~=0Ha: diff>0 t=-4.7232t=-4.7232t=-4.7232 P P值(<0.0001)<,并且由0-1的95%可信区间为(-17.73557,-7.144429)可以知道,不接触组幼儿的平均智商高于接触组的幼儿平均智商,并且差别有统计学意义。 如果已知两组的样本量、样本均数和样本标准差,也可以用立即命令进行统计检验 ttesti样本量1样本均数1样本标准差1样本量2样本均数2样本标准差2 例如: 本例第1组n1=25均数1=89.08标准差1=9.115 第2组n2=25均数2=101.52标准差2=9.505 则ttesti2589.089.11525101.529.505 Two-samplettestwithequalvariances ------------------------------------------------------------------------------ |ObsMeanStd.Err.Std.Dev.[95%Conf.Interval] ---------+-------------------------------------------------------------------- x|2589.081.8239.11585.3175192.84249 y|25101.521.9019.50597.59653105.4435 ---------+-------------------------------------------------------------------- combined|5095.31.57748211.1544892.1299398.47007 ---------+-------------------------------------------------------------------- diff|-12.442.633843-17.7357-7.144303 ------------------------------------------------------------------------------ Degreesoffreedom: 48 Ho: mean(x)-mean(y)=diff=0 Ha: diff<0Ha: diff~=0Ha: diff>0 t=-4.7231t=-4.7231t=-4.7231 P 结果解释同上。 对方差不齐的情况,(小样本时,资料正态分布)还可以用t’检验 命令: ttest观察变量名,by(分组变量名)unequal 立即命令为ttesti样本量1均数1标准差1样本量2均数2标准差2,unequal 假定本例的资料方差不齐(实际为方差不齐的),则要用t’检验如下 ttestx,by(group)unequal Two-samplettestwithunequalvariances ------------------------------------------------------------------------------ Group|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval] ---------+-------------------------------------------------------------------- 0|2589.081.8229289.1146485.3176692.84234 1|25101.521.9009829.50491197.59657105.4434 ---------+-------------------------------------------------------------------- combined|5095.31.57745611.154392.1299898.47002 ---------+-------------------------------------------------------------------- diff|-12.442.633781-17.73581-7.144189 ------------------------------------------------------------------------------ Satterthwaite'sdegreesoffreedom: 47.9159 Ho: mean(0)-mean (1)=diff=0 Ha: diff<0Ha: diff~=0Ha: diff>0 t=-4.7232t=-4.7232t=-4.7232 P 结果解释同上。 t’检验有许多方法,这里介绍的Satterthwaite方法,主要根据两个样本方差差异的程度校正相应的自由度,由于本例的两个样本方差比较接近,故自由度几乎没有减少(t检验的自由度为48,而本例t’自由度为47.9159)。 由于t检验要求的两组总体方差相同(称为方差齐性),以及由于抽样误差的原因,样本方差一般不会相等,但是方差齐性的情况下,样本方差表现为两个样本方差之比1。 (注意: 两个样本方差之差很小,仍可能方差不齐。 如: 第一个样本标准差为0.1,样本量为100,第2个样本标准差为0.01,样本量为100,两个样本标准差仅差0.09,但是两个样本方差之比为100。 故用方差齐性检验的结果如下: 方差齐性的立即命令为sdtesti样本量1.标准差1样本量2.标准差2 sdtesti100.0.1100.0.01 Varianceratiotest ----------------------------------------------------------------------------- |ObsMeanStd.Err.Std.Dev.[95%Conf.Interval] ---------+------------------------------------------------------------------- x|100..01.1.. y|100..001.01.. ---------+------------------------------------------------------------------- combined|200..... ----------------------------------------------------------------------------- Ho: sd(x)=sd(y) F(99,99)observed=F_obs=100.000 F(99,99)lowertail=F_L=1/F_obs=0.010 F(99,99)uppertail=F_U=F_obs=100.000 Ha: sd(x) sd(x)~=sd(y)Ha: sd(x)>sd(y) P P值<0.0001,因此认为两组的方差不齐。 故方差齐性是考察两个样本方差之比是否接近1。 如果本例的资料不满足t检验要求(注: 实际是满足的,只是想用本例介绍成组秩和检验),则用秩和检验(WilcoxonRanksumtest)。 H0: 两组资料所在总体相同 H1: 两组资料所在总体不同 =0.05 命令: ranksum观察变量名,by(分组变量) 本例为ranksumx,by(group) .ranksumx,by(group) Two-sampleWilcoxonrank-sum(Mann-Whitney)test group|obsranksumexpected -------------+--------------------------------- 0|25437637.5 1|25838637.5 -------------+--------------------------------- combined|5012751275
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四讲 两组计量资料平均水平的统计检验 第四 计量 资料 平均水平 统计 检验