书签分享收藏举报版权申诉 / 96

立即下载加入VIP,免费下载

当前位置：首页 > 高中教育 > 理化生 > 医学统计学讲义.docx

医学统计学讲义.docx

文档编号：10581866
上传时间：2023-02-21
格式：DOCX
页数：96
大小：66.99KB

医学统计学讲义.docx

《医学统计学讲义.docx》由会员分享，可在线阅读，更多相关《医学统计学讲义.docx（96页珍藏版）》请在冰豆网上搜索。

医学统计学讲义.docx

医学统计学讲义

医学统计学讲义.txt27信念的力量在于即使身处逆境，亦能帮助你鼓起前进的船帆；信念的魅力在于即使遇到险运，亦能召唤你鼓起生活的勇气；信念的伟大在于即使遭遇不幸，亦能促使你保持崇高的心灵。

医学统计学之1--平均数与标准差（在医科院皮研所统计培训班编写的讲义）2008年05月06日星期二06:

51　　平均数是分析测量资料常用的一种统计指标。

它说明一组观察值的平均水平或集中趋势。

在麻风病统计中常用的有算术均数、几何均数和中位数。

标准差也是分析测量资料常用的统计指标，它说明一组观察值的离散程度。

在应用中，常常把平均数和标准差结合运用，综合表达一组观察值的集中和离散特性。

（一）小样本均数、标准差直接计算法

　　1、公式

_　∑X

　X＝　────　　　　　　　　　　　（1.1）

　N

┌─────

│　_

│∑（X－X）2

S＝│──────（1.2）

√N－1

┌────────

│　（∑X）2

│∑X2－───

│N

S＝│──────（1.3）

√N－1

_

X:

观察值　　　　　　　X:

算术均数

　N:

观察值个数　　　　　S:

标准差

　∑X:

观察值总和

　∑X2:

观察值平方的总和

_

　∑（X－X）2:

观察值的离均差平方和

　　2、应用范围及注意事项

（1）.观察值必须是同质的。

（2）.观察值资料必须大体符合正态分布才能计算均数，而偏态分布的资料不宜用均数描述其集中趋势。

　　（3）.标准差越大，表示观察值的分布越分散、标准差越小，说明观察值分布越集中。

　　（4）.常以“均数±标准差”的写法综合表达一组观察值的集中和离散特征。

　　3、实例

　　［例1.1］　10例麻风病人空腹测定转氨酶GPT的结果为43、50、36、32、40、38、47、41、45、40单位，求GPT的平均值和标准差。

　　计算步骤:

　　∑X＝43＋50＋36＋32＋……＋40＝412

∑X2＝432＋502＋362＋322＋……＋402＝17228

　　代入公式（1.1）求均数得

_412

　　X＝───＝41.2

10

代入公式（3.2）求标准差得

┌─────────

│4122

　　│17228－────

│10

S＝│───────────＝5.308

√10－1

　　故可用均数与标准差综合表示10名麻风病人转氨酶测定结果为:

41.2±5.308。

（二）、大样本均数、标准差的计算法

　　1、公式

_∑fx

X＝────（1.4）

∑f

　　　┌──────────

│（∑fx）2

│∑fX2－────

│∑f

S＝│──────────（1.5）

√∑f－1

_

　X:

均数　X:

各组的组中值　

　　　f:

频数　　　　S:

标准差　　　　　　　　　　

　　2、应用范围及注意事项

（1）样本观察值与小样本资料一样，必须同质并呈正态分布。

（2）大样本资料应先整理成频数表后再进行计算。

频数表一般以8—15个组段为宜。

　　3、实例

　　[例1.2］某地在1975年调查麻风发病情况，共发现640例麻风病人，其年龄分布如表1.1所示，求麻风病人发现时平均年龄。

表1.1　某地麻风病人发现年龄统计（1975）

─────────────────────

　年龄组　　　组中值　　　病人数

─────────────────────

　　0－2.53

5－7.511

10－12.546

15－17.595

20－22.5110

25－27.5181

30－32.590

35－37.568

40－42.530

45－47.513

50－52.58

55－6057.57

─────────────────────

合计　　640

─────────────────────

　　计算步骤:

（1）.首先将数据分组，整理成如表1.1所示的频数分布表。

可利用函数型电子计算器的统计计算功能，方便地求得均数及其标准差。

不同的计算器其操作方法有些差别，本书均以CASIOfx－180P为例，其它种类计算器请参考说明书。

（2）.将计算器置于“SD”工作状态，即按下MODE3，液晶屏显示“SD”，然后按下INV　AC，清除内存中遗留的数字。

在每次进行新的运算之前，都应进行上述操作。

　　（3）.输入数据:

2.5×3RUN7.5×11RUN12.5×46RUN……57.5×7RUN。

　　（4）.取出结果:

INV3，显示:

9.6137（标准差SD），INV　1，　显示:

27.145（均数值）。

医学统计学之2--平均数与标准差，t检验（在医科院皮研所统计培训班编写的讲义）2008年05月07日星期三14:

20（三）几何均数

　　1、公式

　　　　　　∑lgX

G＝lg－1（────）（1.6）

N

∑flgX

G＝lg－1（────）（1.7）

∑f

G:

几何均数　　　　　　　　X:

观察值

　　N:

观察值个数　　　　　　　f:

频数

　　2、应用范围及注意事项

（1）.当样本观察值呈等比关系或对数正态分布而求均数时，如计算抗体平均滴度、传染病平均潜伏期等，可用几何均数。

（2）.一般采用以10或e为底的对数进行计算。

　　（3）.公式（1.6）适用于未分组小样本资料，公式（1.7）适用于分组的大样本资料。

　　3、实例

　　［例1.］　　8例麻风病人的估计潜伏期分别为2、3、5、8、9、14、20、31年，求其平均潜伏期。

　　计算步骤:

（1）　∑lgX＝lg2＋lg3＋lg5＋……＋lg31

＝7.2730

7.2730

（2）　G＝lg－1（────）

8

＝lg－1（0.9091）

＝8.1（年）

（四）中位数计算法

　　1、公式

　　小样本未分组资料计算法:

　　一组观察值按大小顺序排列，如个数为单数，则居中的一个观察值即为中位数；如个数为双数，则居中的两个观察值的平均数为中位数。

　　大样本分组资料计算法:

　　　　　N

──－C

2

M＝L＋─────────（i）（1.8）

fm

M:

中位数　　　N:

总频数

　　L:

中位数所在组段的下限i:

组距

　fm:

中位数组段内的频数　　　C:

小于L的各组段的累计频数

　　2、应用范围及注意事项

（1）.中位数适用于表示大多数观察值分布比较集中、少数极大值或极小值分布两端的样本的集中趋势。

这种资料的算术均数易受极端值的影响，而对中位数则影响很小。

（2）大样本资料应先编制频数表再计算中位数。

　　3、实例

　［例1.4］有204例麻风病人血中大单核细胞百分数资料，制成频数分布表如表1.2所示，计算其中位数。

　　表1.2　204例麻风病人大单核细胞百分数中位数计算表。

───────────────────

分组　　频数　累积频数

───────────────────

　　0－2424

　　2－4064

　　4－55119

　　6－37

　　8－27

　10－18

12－1

14－0

16－1

18－0

20－1

──────────────────

204

──────────────────

计算步骤:

（1）.自上而下累计各组段频数。

（2）.找中位数所在组段。

本例中位数在第3组。

　　（3）.本例:

L＝4,N＝204,i＝2,fm＝55,C＝64

204

──－64

2

M＝4＋────────·2＝5.38％

55

　　二、t检验

　　用计算t值进行差异显著性检验的方法称做t检验。

检验适用于服从正态分布而且符合随机抽样原则的资料。

t检验习惯上按下列标准判定检验结果:

　　t＜t（0.05）P＞0.05无显著性差异

　　t（0.05）≤t＜t（0.01）0.05≥P＞0.01有显著性差异

　　t≥t（0.01）P≤0.01有高度显著性差异

　　检验有显著性差异并不等于有实际意义，还需要根据专业知识判断，谨慎地下结论。

（一）、样本均数的标准误

　　1、公式

　　　　　　　S

　　　Sx＝────（2.1）

　　　　　┌───

√N

Sx:

样本均数的标准误

S:

样本标准差

　　N:

样本例数

　　2、应用范围及注意事项

（1）.标准误是样本均数的标准差，表示样本平均数分布的离散程度。

可用于估计总体均数的可信区间和进行均数间的差异显著性检验。

（2）.表示样本均数离散情况时，可以写成“均数±标准误”的形式。

但必须标明是标准误，或用符号SE表示，以便和标准差相区别。

医学统计学之3--t检验（在医科院皮研所统计培训班编写的讲义）2008年05月08日星期四06:

40

（二）、配对资料的t检验

　　1，公式

_

　　　　　d

　　　t＝──　　　　　　　　　　　　　　（2.2）

Sd

_

　　d:

差数均数　　　Sd:

差数均数标准误

　　2、应用范围及注意事项

（1）.医学研究中常采用的自身对照和配对比较设计得到的都是配对资料。

（2）.配对资料t检验比用两个分组均数的差异显著性检验法的效率高，但事先未经配对设计的资料不能用本法检验。

　　3，实例

　　[例2.1]　用DDS、RFP和B663联合用药治疗10例瘤型麻风病人，治疗前及治疗一年后的BI值如表2.1所示，试问治疗前后的BI值是否有显著性差异?

　表2.1　　10例麻风病人联合化疗前后BI变化

──────────────────────────

例号　治疗前　治疗后　差数（d）　　d2

──────────────────────────

1　　　5.4　4.01.41.96

23.22.50.70.49

32.52.6-0.10.01

43.01.91.11.21

54.23.30.90.81

64.63.70.90.81

73.42.70.70.49

84.13.40.70.49

93.62.80.80.64

102.72.10.60.36

──────────────────────────

7.77.27

──────────────────────────

　　1、检验假设:

治疗前后BI值无差异。

　　2、计算步骤:

（1）.求治疗前后BI差数d和d2（见表2.1第4和第5列），计算其总和，∑d＝7.7，∑d2＝7.27。

　　　　　　　　　　　　　　　　_

（2）.把数据代入公式（1.1）和（1.3）计算差数的均数d和标准误Sd得:

　　　　7.7

　d＝───＝0.77

　　　　　10

　　　　　┌─────────

│7.72

│7.27－────

│10　

Sd＝│────────────＝0.3860

√　　　　10—1

　　（3）.把数据代入公式（2.1）求标准误Sd得

　　　　　　　　0.3860

　　　　Sd＝───────＝0.1221

┌───

　　　　　√10

　　（4）把数据代入公式（2.2）求t值得:

　　　　　0.77

　　　t＝────＝6.308

　　　　　0.1221

　　3、确定P值

　　　计算自由度（df）,df＝10—1＝9,

查t值表（见附表　），t（0.01（9））＝3.250，

　　　本例t＞t（0.01（9）），故P＜0.01。

　　4、统计判断:

　　　该组病例在治疗前与治疗一年后，BI有非常显著性差别（P＜0.01），所以可以认为该疗法有显著降低BI的作用。

　　（三）、两样本均数差别的t检验

　　1，公式

　　　_　_

　∑（X1－X1）＋∑（X2－X2）

　　　　Sc2＝─────────────────

　　　N1＋N2－2

　　（∑x1）2（∑x2）2

　　　　∑X12－────＋∑X12－────

　　N1N2

　　＝──────────────────────────（2.3）

　N1＋N2－2

　　　　　　　　　┌─────────

　　│11

　Sx1－x2＝│Sc2（──＋──）（2.4）

√N1N2

　　　_　　_　

│X1－X2│

t＝──────（2.5）

Sx1－x2

__

X1:

样本I的均数X2:

样本II的均数　

S2c:

合并方差　　　　　　X1:

样本I的观察值

　X2:

样本II的观察值　　　N1:

样本I的例数

　N2:

样本II的例数　　　Sx1－x2:

两样本均数之差的标准误

　2、应用范围及注意事项

（1）.两个样本均数差别的t检验，适用于按完全随机化设计的两样本均数的差异显著性检验。

（2）.两样本例数不相等也可以检验，但当两样本例数相等时，检验的效率最高。

　　（3）.如每组例数大于10，而两标准差的平方相差5倍以上时，不能直接用t检验，可考虑用非参数统计方法。

　　3、实例

　　［例2.2］　为研究正常成年男、女血液红细胞均数之差别，检查了某地25—29岁正常成年男子156名，正常女子74名，男性红细胞均数为465.13万/mm3，标准差为54.80万/mm3。

问两组均数差别有无显著意义?

　　1、检验假设:

　两性间红细胞数无差异。

　　2、计算步骤:

　　将数值代入公式（2.3）、（2.4）和（2.5）:

（156－1）（54.80）2＋（74－1）（44.20）2

Sc2＝────────────────────────

156＋74－2

＝2667.05（万/mm3）

　　　　　　　┌─────────

│156＋74

Sx1－x2＝│2667.05×────＝7.29（万/mm3）

√156×74

465.13－422.16

　　　t＝────────＝5.89

7.29

3、确定P值:

　计算自由度df＝156＋74－2＝228，

　　查t值表t（0.01（120））＝2.67，n'越大则t的临界值越小，本例t＞t（0.01（120）），则必大于t（0.01（228））,　故P＜0.01。

　4、统计判断　　25—29岁正常男女间红细胞数之差别有极显著意义。

　　（四）、两样本含量较大时均数差别的t检验

　　1、公式　　　

　　_　_　　　　　　　　　　

　　　│X1－X2│

u＝──────（2.6）

┌─────

√S2x1＋S2x2

　　　　　　　　_　　　　　　　　_

u:

u值,　　X1:

样本I的均数,X2:

样本II的均数　

　　Sx1:

样本I的标准误

　　Sx2:

样本II的标准误

　　2、应用范围及注意事项

（1）．样本量大于100时，t分布近似正态分布，可用u检验。

（2）．按下列标准判定结果:

　　u＜1.96，P＞0.05差异不显著

　　1.96≤u＜2.58，0.05≥P＞0.01　差异显著

　　u≥2.58，P≤0.01　　差异非常显著

　　（3）．其它条件与（三）相同。

　　3、实例

　　［例2.3］某院测定200例银屑病人的血清铜含量均数为110.49ug％，标准差为29.13ug％；健康对照组165例，平均值为125.91ug％，标准差为17.74ug％。

比较两组的血清铜值是否有差异?

　　1、检验假设:

两者血清铜值无差异。

　　2、计算步骤:

　　将数值代入公式（2.6）

|110.49－125.91|

u＝────────────＝4.224

│29.1317.74

│（───）2＋（───）2

　√　√100√65

　3、确定P值:

　　u＞2.58，故P＜0.01

　　4、统计判断　　本例两样本均数差别非常显著（P＜0.01），说明银屑病人的血清铜含量比正常人偏低。

　　（五）、关于t检验的说明

　　1、显著性检验有双侧检验和单侧检验之分，请读者参考有关统计书。

　　2、t检验只有在两个样本均数的方差没有显著差别的前提下，才可使用，否则须改用t'检验。

　　3、例2.1是对配对资料BI进行t检验，BI属半定量资料，有些BI值并不服从正态分布，所以使用t检验时要慎重；但目前国内外普遍使用t检验来比较治疗前后BI均数差异，故在此举一例。

医学统计学之4--卡方检验（在医科院皮研所统计培训班编写的讲义）2008年05月10日星期六09:

31　　X2检验是一种用途广、简单常用的差异显著性检验方法之一。

主要可以用于计数资料（Enumerationdata）的两组或两组以上的两类属性、两类或两类以上现象之间的比较，如检验两个样本率、构成比等之间的差别。

　　一、基本原理和步骤:

　　X2检验的基本原理是假设各个样本（Sample）来自同一属性的总体（Population），各组中实际数之间的差别仅仅由于抽样误差造成的；通过分别计算各组实际数与理论数的离散情况，求得总的误差X2值，从而测定假设存在的概率（Probability），即可能性P，如果假设成立，那么X2值就不会很大，而保持在一定范围内，相应的P值就大于5％（P＞0.05），即仅仅由于抽样误差而造成样本之间这么大小差别的可能性大于5％，说明各样本间的差别本质上无明显差异，它们来之于同一属性的总体，假设被肯定。

。

反过来说，如果推算出的X2值很大，而超出了一定范围，相应的P

值就小于5％或1％，即由于抽样误差造成样本之间如此大的差别的可能性小于5％或1%；说明各组间差别不是由于抽样造成的，可能两者的确有差别，它们不是来之于同一属性的总体，假设被否定。

　　具体步骤:

（一）、建立2×2的四格表（Fourboldtable）或r×c的行×列表:

分析资料，将实验组（Exporimentalgroup）和对照组（Controlgroup）资料，按两类属性分类，组成如下计算表格:

　　　　│属性Ⅰ│属性Ⅱ│合　　计

──────┼──────┼────┼──────

实验组　│αTa│bTb│α＋b

──────┼──────┼────┼──────

对照组　│c　Tc│dTd│c＋d

──────┼──────┼────┼──────

合　计　│α＋c│b＋d│N＝α＋b＋c＋d

　　　　a│b　

表格中　─┼─以a、b、c、d四个数为基础计算统计量，故称四格表。

　　　　c│d

（二）、建立检验假设:

假设两组间无显著差异。

　　（三）、计算理论数:

　　　　　　　　　　同行合计数×同列合计数

　　任何一格理论数＝────────────

　　　　　　　　　　　　总　合　计　数

　　T代表理论数（theoretical），那么a、b、c、d分别有四个理论数:

　　Ta,Tb，Tc，Td，

（a＋b）（a＋c）

Ta＝─────────

N

（a＋b）（b＋d）

　　Tb＝─────────＝（a＋b）－Ta

N

（a＋c）（c＋d）

Tc＝─────────＝（a＋c）－Ta

N

（b＋d）（c＋d）

Td＝─────────＝（c＋d）－Tc

N

　　用字母表达写成通式为:

　　NrNc

　　　T＝──────

N

Nr:

为行合计数，（N:

number　r:

row）。

　　Nc:

　为列合计数，（c:

Column）。

　　（四）、计算X2值:

　　　　　　　　　　（A－T）2

　　基本公式:

X2＝∑──────　　　　　　　　　　

（1）

T

　　∑:

（Sigma）即总和的意思，表示各个格子实际数与理论数之间的误差总和。

　　A:

代表a、b、c、d实际数（actual）。

　　上式展开:

（a－Ta）2（b－Tb）2（c－Tc）2（d－Td）2

X2＝──────＋──────＋──────＋──────

TaTbTcTd

（五）、求自由度:

　　　　自由度（n'）＝（行数－1）（列数－1）

n'＝（r－1）（c－1）

（六）、差X2表，确定P值:

　　　　X2＜X2（0.05（n'）），P＞0.05，无显著性差异。

　　　　X2（0.0５（n'））≤X2＜X20.0１（n'），0.05≥P＞0.0１，有显著性差异。

　　　　X2≥X20.01（n'），P≤0.01，有高度显著性差异。

　　（七）、　结论:

　1、有否显著性。

2、P值为多少。

3、由本资料推论总体，应当从实际出发，谨慎地下结论。

　　二、四格表资料的X2检验。

（一）、计算X2值的四格表基本公式:

　　例1:

　某研究所进行HLA与麻风的相关研究，随机选取32例瘤型病人和65例健康人为对照组。

病人组中18例HLA—DR2抗原阳性，健康人组中有14例HLA—DR2阳性。

是否可以认为HLA—DR2抗原阳性率在瘤型麻风病人比健康人中为高?

表1．HLA—DR2在瘤型麻风病人和健康人中的测定结果

──────────────────────────────────────

　　瘤型病人　　　健康人　合　计

──────────────────────────────────────

　　　　　　　＋　18　　　　　14　　　　32　

　HLA—DR2

　　　　　　　－　　14　　　　　51　　　　65

──────────────────────────────────────

　合　　计　　　　32　6597

──────────────────────────────────────

　　（徐可愚等:

中华皮肤科杂志，Vol.16

（1）:

24,1983）

　　1、检验假设:

LA—DR2抗原在瘤型麻风病人和正常健康人中分布无显著性差别。

　　　　　　　　　　32×32

　　2、求X2值:

Ta＝────＝10.557（小数点后保留三位有效数字）

　　　　　　　97

　　　Tb

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 医学统计学讲义医学统计学

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：医学统计学讲义.docx
链接地址：https://www.bdocx.com/doc/10581866.html

医学统计学 讲义.docx

热门标签

医学统计学讲义.docx