医学统计学 讲义.docx
- 文档编号:10581866
- 上传时间:2023-02-21
- 格式:DOCX
- 页数:96
- 大小:66.99KB
医学统计学 讲义.docx
《医学统计学 讲义.docx》由会员分享,可在线阅读,更多相关《医学统计学 讲义.docx(96页珍藏版)》请在冰豆网上搜索。
医学统计学讲义
医学统计学讲义.txt27信念的力量在于即使身处逆境,亦能帮助你鼓起前进的船帆;信念的魅力在于即使遇到险运,亦能召唤你鼓起生活的勇气;信念的伟大在于即使遭遇不幸,亦能促使你保持崇高的心灵。
医学统计学之1--平均数与标准差(在医科院皮研所统计培训班编写的讲义)2008年05月06日星期二06:
51 平均数是分析测量资料常用的一种统计指标。
它说明一组观察值的平均水平或集中趋势。
在麻风病统计中常用的有算术均数、几何均数和中位数。
标准差也是分析测量资料常用的统计指标,它说明一组观察值的离散程度。
在应用中,常常把平均数和标准差结合运用,综合表达一组观察值的集中和离散特性。
(一)小样本均数、标准差直接计算法
1、公式
_ ∑X
X= ──── (1.1)
N
┌─────
│ _
│∑(X-X)2
S=│──────(1.2)
√N-1
┌────────
│ (∑X)2
│∑X2-───
│N
S=│──────(1.3)
√N-1
_
X:
观察值 X:
算术均数
N:
观察值个数 S:
标准差
∑X:
观察值总和
∑X2:
观察值平方的总和
_
∑(X-X)2:
观察值的离均差平方和
2、应用范围及注意事项
(1).观察值必须是同质的。
(2).观察值资料必须大体符合正态分布才能计算均数,而偏态分布的资料不宜用均数描述其集中趋势。
(3).标准差越大,表示观察值的分布越分散、标准差越小,说明观察值分布越集中。
(4).常以“均数±标准差”的写法综合表达一组观察值的集中和离散特征。
3、实例
[例1.1] 10例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位,求GPT的平均值和标准差。
计算步骤:
∑X=43+50+36+32+……+40=412
∑X2=432+502+362+322+……+402=17228
代入公式(1.1)求均数得
_412
X=───=41.2
10
代入公式(3.2)求标准差得
┌─────────
│4122
│17228-────
│10
S=│───────────=5.308
√10-1
故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为:
41.2±5.308。
(二)、大样本均数、标准差的计算法
1、公式
_∑fx
X=────(1.4)
∑f
┌──────────
│(∑fx)2
│∑fX2-────
│∑f
S=│──────────(1.5)
√∑f-1
_
X:
均数 X:
各组的组中值
f:
频数 S:
标准差
2、应用范围及注意事项
(1)样本观察值与小样本资料一样,必须同质并呈正态分布。
(2)大样本资料应先整理成频数表后再进行计算。
频数表一般以8—15个组段为宜。
3、实例
[例1.2]某地在1975年调查麻风发病情况,共发现640例麻风病人,其年龄分布如表1.1所示,求麻风病人发现时平均年龄。
表1.1 某地麻风病人发现年龄统计(1975)
─────────────────────
年龄组 组中值 病人数
─────────────────────
0-2.53
5-7.511
10-12.546
15-17.595
20-22.5110
25-27.5181
30-32.590
35-37.568
40-42.530
45-47.513
50-52.58
55-6057.57
─────────────────────
合计 640
─────────────────────
计算步骤:
(1).首先将数据分组,整理成如表1.1所示的频数分布表。
可利用函数型电子计算器的统计计算功能,方便地求得均数及其标准差。
不同的计算器其操作方法有些差别,本书均以CASIOfx-180P为例,其它种类计算器请参考说明书。
(2).将计算器置于“SD”工作状态,即按下MODE3,液晶屏显示“SD”,然后按下INV AC,清除内存中遗留的数字。
在每次进行新的运算之前,都应进行上述操作。
(3).输入数据:
2.5×3RUN7.5×11RUN12.5×46RUN……57.5×7RUN。
(4).取出结果:
INV3,显示:
9.6137(标准差SD),INV 1, 显示:
27.145(均数值)。
医学统计学之2--平均数与标准差,t检验(在医科院皮研所统计培训班编写的讲义)2008年05月07日星期三14:
20(三)几何均数
1、公式
∑lgX
G=lg-1(────)(1.6)
N
∑flgX
G=lg-1(────)(1.7)
∑f
G:
几何均数 X:
观察值
N:
观察值个数 f:
频数
2、应用范围及注意事项
(1).当样本观察值呈等比关系或对数正态分布而求均数时,如计算抗体平均滴度、传染病平均潜伏期等,可用几何均数。
(2).一般采用以10或e为底的对数进行计算。
(3).公式(1.6)适用于未分组小样本资料,公式(1.7)适用于分组的大样本资料。
3、实例
[例1.] 8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年,求其平均潜伏期。
计算步骤:
(1) ∑lgX=lg2+lg3+lg5+……+lg31
=7.2730
7.2730
(2) G=lg-1(────)
8
=lg-1(0.9091)
=8.1(年)
(四)中位数计算法
1、公式
小样本未分组资料计算法:
一组观察值按大小顺序排列,如个数为单数,则居中的一个观察值即为中位数;如个数为双数,则居中的两个观察值的平均数为中位数。
大样本分组资料计算法:
N
──-C
2
M=L+─────────(i)(1.8)
fm
M:
中位数 N:
总频数
L:
中位数所在组段的下限i:
组距
fm:
中位数组段内的频数 C:
小于L的各组段的累计频数
2、应用范围及注意事项
(1).中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。
这种资料的算术均数易受极端值的影响,而对中位数则影响很小。
(2)大样本资料应先编制频数表再计算中位数。
3、实例
[例1.4]有204例麻风病人血中大单核细胞百分数资料,制成频数分布表如表1.2所示,计算其中位数。
表1.2 204例麻风病人大单核细胞百分数中位数计算表。
───────────────────
分组 频数 累积频数
───────────────────
0-2424
2-4064
4-55119
6-37
8-27
10-18
12-1
14-0
16-1
18-0
20-1
──────────────────
204
──────────────────
计算步骤:
(1).自上而下累计各组段频数。
(2).找中位数所在组段。
本例中位数在第3组。
(3).本例:
L=4,N=204,i=2,fm=55,C=64
204
──-64
2
M=4+────────·2=5.38%
55
二、t检验
用计算t值进行差异显著性检验的方法称做t检验。
检验适用于服从正态分布而且符合随机抽样原则的资料。
t检验习惯上按下列标准判定检验结果:
t<t(0.05)P>0.05无显著性差异
t(0.05)≤t<t(0.01)0.05≥P>0.01有显著性差异
t≥t(0.01)P≤0.01有高度显著性差异
检验有显著性差异并不等于有实际意义,还需要根据专业知识判断,谨慎地下结论。
(一)、样本均数的标准误
1、公式
S
Sx=────(2.1)
┌───
√N
Sx:
样本均数的标准误
S:
样本标准差
N:
样本例数
2、应用范围及注意事项
(1).标准误是样本均数的标准差,表示样本平均数分布的离散程度。
可用于估计总体均数的可信区间和进行均数间的差异显著性检验。
(2).表示样本均数离散情况时,可以写成“均数±标准误”的形式。
但必须标明是标准误,或用符号SE表示,以便和标准差相区别。
医学统计学之3--t检验(在医科院皮研所统计培训班编写的讲义)2008年05月08日星期四06:
40
(二)、配对资料的t检验
1,公式
_
d
t=── (2.2)
Sd
_
d:
差数均数 Sd:
差数均数标准误
2、应用范围及注意事项
(1).医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。
(2).配对资料t检验比用两个分组均数的差异显著性检验法的效率高,但事先未经配对设计的资料不能用本法检验。
3,实例
[例2.1] 用DDS、RFP和B663联合用药治疗10例瘤型麻风病人,治疗前及治疗一年后的BI值如表2.1所示,试问治疗前后的BI值是否有显著性差异?
表2.1 10例麻风病人联合化疗前后BI变化
──────────────────────────
例号 治疗前 治疗后 差数(d) d2
──────────────────────────
1 5.4 4.01.41.96
23.22.50.70.49
32.52.6-0.10.01
43.01.91.11.21
54.23.30.90.81
64.63.70.90.81
73.42.70.70.49
84.13.40.70.49
93.62.80.80.64
102.72.10.60.36
──────────────────────────
7.77.27
──────────────────────────
1、检验假设:
治疗前后BI值无差异。
2、计算步骤:
(1).求治疗前后BI差数d和d2(见表2.1第4和第5列),计算其总和,∑d=7.7,∑d2=7.27。
_
(2).把数据代入公式(1.1)和(1.3)计算差数的均数d和标准误Sd得:
7.7
d=───=0.77
10
┌─────────
│7.72
│7.27-────
│10
Sd=│────────────=0.3860
√ 10—1
(3).把数据代入公式(2.1)求标准误Sd得
0.3860
Sd=───────=0.1221
┌───
√10
(4)把数据代入公式(2.2)求t值得:
0.77
t=────=6.308
0.1221
3、确定P值
计算自由度(df),df=10—1=9,
查t值表(见附表 ),t(0.01(9))=3.250,
本例t>t(0.01(9)),故P<0.01。
4、统计判断:
该组病例在治疗前与治疗一年后,BI有非常显著性差别(P<0.01),所以可以认为该疗法有显著降低BI的作用。
(三)、两样本均数差别的t检验
1,公式
_ _
∑(X1-X1)+∑(X2-X2)
Sc2=─────────────────
N1+N2-2
(∑x1)2(∑x2)2
∑X12-────+∑X12-────
N1N2
=──────────────────────────(2.3)
N1+N2-2
┌─────────
│11
Sx1-x2=│Sc2(──+──)(2.4)
√N1N2
_ _
│X1-X2│
t=──────(2.5)
Sx1-x2
__
X1:
样本I的均数X2:
样本II的均数
S2c:
合并方差 X1:
样本I的观察值
X2:
样本II的观察值 N1:
样本I的例数
N2:
样本II的例数 Sx1-x2:
两样本均数之差的标准误
2、应用范围及注意事项
(1).两个样本均数差别的t检验,适用于按完全随机化设计的两样本均数的差异显著性检验。
(2).两样本例数不相等也可以检验,但当两样本例数相等时,检验的效率最高。
(3).如每组例数大于10,而两标准差的平方相差5倍以上时,不能直接用t检验,可考虑用非参数统计方法。
3、实例
[例2.2] 为研究正常成年男、女血液红细胞均数之差别,检查了某地25—29岁正常成年男子156名,正常女子74名,男性红细胞均数为465.13万/mm3,标准差为54.80万/mm3。
问两组均数差别有无显著意义?
1、检验假设:
两性间红细胞数无差异。
2、计算步骤:
将数值代入公式(2.3)、(2.4)和(2.5):
(156-1)(54.80)2+(74-1)(44.20)2
Sc2=────────────────────────
156+74-2
=2667.05(万/mm3)
┌─────────
│156+74
Sx1-x2=│2667.05×────=7.29(万/mm3)
√156×74
465.13-422.16
t=────────=5.89
7.29
3、确定P值:
计算自由度df=156+74-2=228,
查t值表t(0.01(120))=2.67,n'越大则t的临界值越小,本例t>t(0.01(120)),则必大于t(0.01(228)), 故P<0.01。
4、统计判断 25—29岁正常男女间红细胞数之差别有极显著意义。
(四)、两样本含量较大时均数差别的t检验
1、公式
_ _
│X1-X2│
u=──────(2.6)
┌─────
√S2x1+S2x2
_ _
u:
u值, X1:
样本I的均数,X2:
样本II的均数
Sx1:
样本I的标准误
Sx2:
样本II的标准误
2、应用范围及注意事项
(1).样本量大于100时,t分布近似正态分布,可用u检验。
(2).按下列标准判定结果:
u<1.96,P>0.05差异不显著
1.96≤u<2.58,0.05≥P>0.01 差异显著
u≥2.58,P≤0.01 差异非常显著
(3).其它条件与(三)相同。
3、实例
[例2.3]某院测定200例银屑病人的血清铜含量均数为110.49ug%,标准差为29.13ug%;健康对照组165例,平均值为125.91ug%,标准差为17.74ug%。
比较两组的血清铜值是否有差异?
1、检验假设:
两者血清铜值无差异。
2、计算步骤:
将数值代入公式(2.6)
|110.49-125.91|
u=────────────=4.224
│29.1317.74
│(───)2+(───)2
√ √100√65
3、确定P值:
u>2.58,故P<0.01
4、统计判断 本例两样本均数差别非常显著(P<0.01),说明银屑病人的血清铜含量比正常人偏低。
(五)、关于t检验的说明
1、显著性检验有双侧检验和单侧检验之分,请读者参考有关统计书。
2、t检验只有在两个样本均数的方差没有显著差别的前提下,才可使用,否则须改用t'检验。
3、例2.1是对配对资料BI进行t检验,BI属半定量资料,有些BI值并不服从正态分布,所以使用t检验时要慎重;但目前国内外普遍使用t检验来比较治疗前后BI均数差异,故在此举一例。
医学统计学之4--卡方检验(在医科院皮研所统计培训班编写的讲义)2008年05月10日星期六09:
31 X2检验是一种用途广、简单常用的差异显著性检验方法之一。
主要可以用于计数资料(Enumerationdata)的两组或两组以上的两类属性、两类或两类以上现象之间的比较,如检验两个样本率、构成比等之间的差别。
一、基本原理和步骤:
X2检验的基本原理是假设各个样本(Sample)来自同一属性的总体(Population),各组中实际数之间的差别仅仅由于抽样误差造成的;通过分别计算各组实际数与理论数的离散情况,求得总的误差X2值,从而测定假设存在的概率(Probability),即可能性P,如果假设成立,那么X2值就不会很大,而保持在一定范围内,相应的P值就大于5%(P>0.05),即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5%,说明各样本间的差别本质上无明显差异,它们来之于同一属性的总体,假设被肯定。
。
反过来说,如果推算出的X2值很大,而超出了一定范围,相应的P
值就小于5%或1%,即由于抽样误差造成样本之间如此大的差别的可能性小于5%或1%;说明各组间差别不是由于抽样造成的,可能两者的确有差别,它们不是来之于同一属性的总体,假设被否定。
具体步骤:
(一)、建立2×2的四格表(Fourboldtable)或r×c的行×列表:
分析资料,将实验组(Exporimentalgroup)和对照组(Controlgroup)资料,按两类属性分类,组成如下计算表格:
│属性Ⅰ│属性Ⅱ│合 计
──────┼──────┼────┼──────
实验组 │αTa│bTb│α+b
──────┼──────┼────┼──────
对照组 │c Tc│dTd│c+d
──────┼──────┼────┼──────
合 计 │α+c│b+d│N=α+b+c+d
a│b
表格中 ─┼─以a、b、c、d四个数为基础计算统计量,故称四格表。
c│d
(二)、建立检验假设:
假设两组间无显著差异。
(三)、计算理论数:
同行合计数×同列合计数
任何一格理论数=────────────
总 合 计 数
T代表理论数(theoretical),那么a、b、c、d分别有四个理论数:
Ta,Tb,Tc,Td,
(a+b)(a+c)
Ta=─────────
N
(a+b)(b+d)
Tb=─────────=(a+b)-Ta
N
(a+c)(c+d)
Tc=─────────=(a+c)-Ta
N
(b+d)(c+d)
Td=─────────=(c+d)-Tc
N
用字母表达写成通式为:
NrNc
T=──────
N
Nr:
为行合计数,(N:
number r:
row)。
Nc:
为列合计数,(c:
Column)。
(四)、计算X2值:
(A-T)2
基本公式:
X2=∑──────
(1)
T
∑:
(Sigma)即总和的意思,表示各个格子实际数与理论数之间的误差总和。
A:
代表a、b、c、d实际数(actual)。
上式展开:
(a-Ta)2(b-Tb)2(c-Tc)2(d-Td)2
X2=──────+──────+──────+──────
TaTbTcTd
(五)、求自由度:
自由度(n')=(行数-1)(列数-1)
n'=(r-1)(c-1)
(六)、差X2表,确定P值:
X2<X2(0.05(n')),P>0.05,无显著性差异。
X2(0.05(n'))≤X2<X20.01(n'),0.05≥P>0.01,有显著性差异。
X2≥X20.01(n'),P≤0.01,有高度显著性差异。
(七)、 结论:
1、有否显著性。
2、P值为多少。
3、由本资料推论总体,应当从实际出发,谨慎地下结论。
二、四格表资料的X2检验。
(一)、计算X2值的四格表基本公式:
例1:
某研究所进行HLA与麻风的相关研究,随机选取32例瘤型病人和65例健康人为对照组。
病人组中18例HLA—DR2抗原阳性,健康人组中有14例HLA—DR2阳性。
是否可以认为HLA—DR2抗原阳性率在瘤型麻风病人比健康人中为高?
表1.HLA—DR2在瘤型麻风病人和健康人中的测定结果
──────────────────────────────────────
瘤型病人 健康人 合 计
──────────────────────────────────────
+ 18 14 32
HLA—DR2
- 14 51 65
──────────────────────────────────────
合 计 32 6597
──────────────────────────────────────
(徐可愚等:
中华皮肤科杂志,Vol.16
(1):
24,1983)
1、检验假设:
LA—DR2抗原在瘤型麻风病人和正常健康人中分布无显著性差别。
32×32
2、求X2值:
Ta=────=10.557(小数点后保留三位有效数字)
97
Tb
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学 讲义 医学 统计学