医学统计学方法Word文档格式.docx
- 文档编号:20408346
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:53
- 大小:376.52KB
医学统计学方法Word文档格式.docx
《医学统计学方法Word文档格式.docx》由会员分享,可在线阅读,更多相关《医学统计学方法Word文档格式.docx(53页珍藏版)》请在冰豆网上搜索。
它是一类指标,统计中常用的平均数包括:
算术平均数、几何平均数、中位数。
平均数的选取:
根据资料的分布类型
(一)算术平均数
算术平均数简称均数,总体均数—
,样本均数—
1.适用条件:
对称分布,特别适用于正态或近似正态分布资料
2.计算方法:
(1)直接法—观察单位较少
公式:
某市10名4岁女孩的身高(cm)分别为:
112.9,108.0,99.8,102.5,116.3,105.6,100.7,103.2,104.9,98.9,试求其均数。
(2)频表法—观察单位较多时
(二)几何均数
几何均数(geometricmean)用G表示。
观察值呈倍数关系或对数正态分布,多用于描述抗体的平均滴度等。
(一)直接法—观察单位较少
例题某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1:
10,1:
20,1:
40,1:
160,求抗体的平均滴度。
解:
平均指标选用几何均数(观察值呈倍数关系)
首先取观察值的倒数
5份血清抗体效价的平均滴度为1:
34.8
(2)加权法—频数表资料
例题:
69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布如下,求其平均抗体滴度。
某医院预防保健科用流脑疫苗为75名儿童进行免疫接种,1个月后测定其抗体滴度如下表所示,试求其平均滴度。
75名儿童的平均抗体滴度计算表
抗体滴度
滴度倒数X
lgX
频数f
flgX
1:
4
8
16
32
64
128
256
0.6021
0.9031
1.2041
1.5051
1.8062
2.1072
2.4082
9
21
20
12
5
4
2.4084
8.1279
25.2861
30.1020
21.6744
10.5360
9.6328
合计
—
75
107.7676
(三)中位数
中位数(median)用M表示,是一组观察值按由小到大的顺序排列后,位于中间位置上的那个数值。
(1)变量值中出现个别特小或特大的数值
(2)资料的分布呈明显的偏态
(3)变量值分布一端或两端无确定数值,只有小于或大于某个数值(<
90)。
(4)资料的分布不清
(1)当样本含量为奇数时,
1,8,2,4,12→1,2,4,8,12
(2)当样本含量为偶数时,
1,8,2,4,12,3→1,2,3,4,8,12
(四)百分位数
百分位数(percentile)用Px(第x百分位数)表示,也是一种位置指标,观察值按由小到大的顺序排列后,一个百分位数Px将全部变量值分为两部分,其中有x%的变量值比它小,(100-x)%变量值比它大。
P50=M
适用条件同中位数
频数表法:
L:
第X百分位数所在组段的组下限
i:
组距
fx:
第X百分位数所在组段对应的频数
ΣfL:
为小于L的各组段的累计频数
例题测得某地200名正常人发汞值(μg/g),试计算其平均水平及P75百分位数。
某地200名正常人发汞值频数分布
组段(μg/g)
(1)
频数f
(2)
频率(%)
(3)
累计频数
(4)
累计频率(%)
(5)
0.3~
0.7~
1.1~
1.5~
1.9~
2.3~
2.7~
3.1~
3.5~
3.9~4.3
50
46
30
25
6
2
1
10.0
25.0
23.0
15.0
12.5
8.0
3.O
2.0
1.0
0.5
70
116
146
171
187
193
197
199
200
35.0
58.0
73.0
85.5
93.5
96.5
98.5
99.5
100.0
三、定量资料的离散趋势
(变异程度)指标
离散趋势
(一)极差(全距)
1.定义:
极差(R)=最大值-最小值极差越大变异程度越大。
例:
甲乙两组球员身高资料如下:
甲组:
184,186,188,190,192
乙组:
180,184,188,192,196
甲乙两组的集中趋势相同(有相同的平均水平),但离散程度不同(乙组大于甲组)。
也就是说,即考虑集中趋势,又要考虑离散趋势,这样才能全面对数值变量资料进行描述。
2.应用范围:
适用于任何分布类型的资料,描述偏态分布资料。
3.优缺点
优点:
计算简单、概念清晰。
缺点:
(1)只考虑了最大值与最小值,容易受个别极端值的影响,且不能反应组内其它变量值的变异情况。
(2)受样本含量影响,不稳定(一般样本含量越大越有机会观察到偏小或偏大的数据)。
(二)四分位数间距
适用于任何分布类型的资料,主要和中位数一起描述偏态分布资料。
要比极差稳定
仍未考虑到全部观察值的变异程度
(三)方差
公式的由来
(四)标准差
由于方差的单位是原单位的平方,因此为了应用方便,对方差进行开方得到
,该公式就是样本的标准差。
标准差的简化公式
方差和标准差主要应用于正态分布
(五)变异系数
1.应用条件:
反映资料的相对变异程度。
常用于比较度量衡单位不同或均数相差悬殊的两组(或多组)资料的变异度。
2.公式:
例比较单位不同的几组资料的离散程度
某年某市城区120名5岁女孩身高均数为110.15cm,标准差为5.86cm,体重均数为17.71kg,标准差为1.44kg,比较其离散程度。
例比较均数相差悬殊的几组资料的离散程度
某年某市城区120名5岁女孩体重均数为17.71kg,标准差为1.44kg,同年该地120名5个月女孩体重均数为7.37kg,标准差为0.77kg,比较其离散程度。
【例题】正态分布资料宜用( )来描述其集中趋势
A.算术平均数
B.标准差
C.几何均数
D.变异系数
E.四分位数间距
『正确答案』A
【例题】变异系数越大说明
A.标准差越大
B.标准差越小
C.均数越大
D.均数越小
E.以均数为准变异程度大
『正确答案』E
【例题】数列8,-3,5,0,1,4,-1的中位数是
A.2
B.0
C.2.5
D.0.5
E.1
【例题】原始数据呈倍数关系的资料,宜用( )描述其分布的集中趋势
A.算数均数
B.几何均数
C.极差
D.中位数
E.百分位数
【例题】离散程度指标中,最容易受极端值影响的是
A.极差
C.变异系数
D.方差
正态分布
正态分布是医学和生物学中最常见,也是最重要的一种连续性分布,如正常人的身高,体重,红细胞数,血红蛋白等。
我们可以从频数表和频数图对正态分布进行研究。
120名正常成年男子红细胞计数的频数表(×
1012/L)
组段
(1)
频数
(2)
(3)
(4)
3.20~
2
1.7
3.50~
5
4.2
7
5.9
3.80~
10
8.3
17
14.2
4.10~
19
15.8
36
30.0
4.40~
23
19.2
59
49.2
4.70~
24
20.0
83
69.2
5.00~
21
17.5
104
86.7
5.30~
11
9.2
115
95.9
5.60~
3.3
119
99.2
5.90~6.20
0.8
120
合计
长方形的高度等于频数
频数分布以均数为中心,向两侧逐渐减少,并且基本对称
长方形的面积等于频率
所有长方形面积之和等于1或100%
利用正态分布曲线特点来描述正态分布的特征
(一)正态分布的概念和特征
1.概念
如果随机变量x的分布服从概率密度函数
,则称x服从正态分布,记作
,μ为x的总体均数,σ为总体标准差。
2.正态分布的特征
(1)在直角坐标的横轴上方呈钟形曲线,两端与x轴永不相交,且以x=μ为对称轴,左右完全对称。
(2)在x=μ处,f(x)取最大值,其值为
,并且x越远离μ,f(x)值越小。
(3)正态分布有两个参数:
一个为位置参数μ,一个为形态参数σ。
3.正态分布曲线下的面积分布规律
(二)标准正态分布
正态分布是一个分布组族,对应于不同的参数μ和σ会产生不同位置、不同形状的正态分布,为了应用方便,我们将正态分布转化成标准正态分布。
由于我们实际面对的大多是正态分布,因此可采用如下的方法求其曲线下面积:
正态分布的应用
调查某单位101名正常成年女子的血清总胆固醇,得其均数
,
标准差
。
试估计该单位正常女子血清总胆固醇在4.00mmol/L以下者及5.00mmol/L以下者各占正常女子总人数的百分比。
【例题】下列关于正态分布描述错误的是
A.是医学和生物学中常见的一种连续型分布
B.正态分布曲线的对称轴是x=μ这条直线
C.正态分布曲线有两个参数,μ为形态参数,σ为位置参数
D.正态分布曲线是一簇曲线
E.正态分布曲线下的总面积为1
『正确答案』C
【例题】在正态曲线下,区间
所包含的面积为
A.1%
B.1.5%
C.97%
D.2%
E.95%
『正确答案』D
【例题】下列关于标准正态分布的说法中错误的是
A.标准正态分布曲线下总面积为1
B.标准正态分布是总体均数为0,总体标准差为1的正态分布
C.标准正态分布的曲线是一簇曲线
D.标准正态分布是对称分布
E.不同的正态分布都可以通过变换转化为标准正态分布
四、定量资料的统计推断-总体均数的估计和假设检验
计量资料
总体均数的参数估计:
假设检验:
(四)假设检验的原理和步骤
(五)t检验
(一)均数的抽样误差和标准误(衡量抽样误差大小的指标)
例若某市1999年18岁男生身高服从均数μ、标准差σ的正态分布。
从该正态分布N(167.7,5.32)总体中随机抽样,共抽了100次,每次样本含量nj=10人,得到每个样本均数及标准差如下图
1999年某市18岁男生身高N(167.7,5.32)的抽样示意
其中为了与反映观察值离散程度的标准差
相区别,统计学中把样本均数的标准差
称为样本均数的标准误,简称为标准误(standarderror)。
标准误是描述均数的抽样误差大小的统计指标。
可证明均数标准误的计算公式为
均数标准误的用途
1.可用来衡量样本均数的可靠性
标准误—抽样误差—均数间的差异(样本和总体)—样本均数估计总体均数
小 小 小 可靠
2.与样本均数结合,可用于估计总体均数的置信区间
3.可用于进行均数的假设检验
(二)t分布
1.t分布的概念
实际工作中,由于
未知,用
代替,这样u不再服从标准正态分布,而服从t分布,即
统计量t的分布称为t分布。
t分布与自由度有关,不同的自由度对应着不同的t分布曲线。
2.t分布的图形与特征
t分布的图形:
t分布是一簇曲线,自由度不同,曲线的形状不同,t分布的图形与自由度有关。
当v→∞,t分布趋近于标准正态分布,但当自由度较小时,t分布与标准正态分布的差异较大。
其图形如下图
t分布特征:
(1)单峰分布,以0为中心,左右对称
(2)自由度v越小,峰部越矮,而尾翘得越高
(3)当v→∞,
t分布逼近u分布(标准正态分布),将标准正态分布看做t分布的特例。
t界值表简介:
横标目为自由度,纵标目为概率P,表中数字表示自由度为
,P为
(单侧或双侧概率)时,t的界值,单侧常记为
,双侧常记为
由于t分布是以0为中心的对称分布,表中只列出正值,查表示不管t正负都用绝对值。
自由度
概率
单尾
0.25
0.1
0.05
0.025
0.01
0.005
0.0025
0.001
0.0005
双尾
0.5
0.2
0.02
0.002
1
1.000
3.078
6.314
12.706
31.821
63.657
127.321
318.309
636.619
0.816
1.886
2.920
4.303
6.965
9.925
14.089
22.327
31.599
3
0.765
1.638
2.353
3.182
4.541
5.841
7.453
10.215
12.924
0.741
1.533
2.132
2.776
3.747
4.604
5.598
7.173
8.610
0.727
1.476
2.015
2.571
3.365
4.032
4.773
5.893
6.869
0.718
1.440
1.943
2.447
3.143
3.707
4.317
5.208
5.959
7
0.711
1.415
1.895
2.365
2.998
3.499
4.029
4.785
5.408
0.706
1.397
1.860
2.306
2.896
3.355
3.833
4.501
5.041
0.703
1.383
1.833
2.262
2.821
3.250
3.690
4.297
4.781
10
0.700
1.372
1.812
2.228
2.764
3.169
3.581
4.144
4.587
11
0.697
1.363
1.796
2.201
2.718
3.106
3.497
4.025
4.437
0.695
1.356
1.782
2.179
2.681
3.055
3.428
3.930
4.318
13
0.694
1.350
1.771
2.160
2.650
3.012
3.372
3.852
4.221
14
0.692
1.345
1.761
2.145
2.624
2.977
3.326
3.787
4.140
15
0.691
1.341
1.753
2.131
2.602
2.947
3.286
3.733
4.073
0.690
1.337
1.746
2.120
2.583
2.921
3.252
3.686
4.015
17
0.689
1.333
1.740
2.110
2.567
2.898
3.222
3.646
3.965
18
0.688
1.330
1.734
2.101
2.552
2.878
3.197
3.610
3.922
19
1.328
1.729
2.093
2.539
2.861
3.174
3.579
3.883
0.687
1.325
1.725
2.086
2.528
2.845
3.153
3.552
3.850
0.686
1.323
1.721
2.080
2.518
2.831
3.135
3.527
3.819
22
1.321
1.717
2.074
2.508
2.819
3.119
3.505
3.792
23
0.685
1.319
1.714
2.069
2.500
2.807
3.104
3.485
3.768
24
1.318
1.711
2.064
2.492
2.797
3.091
3.467
3.745
0.684
1.316
1.708
2.060
2.485
2.787
3.450
3.725
26
1.315
1.706
2.056
2.479
2.779
3.067
3.435
27
1.314
1.703
2.052
2.473
2.771
3.057
3.421
28
0.683
1.313
1.701
2.048
2.467
2.763
3.047
3.408
3.674
29
1.311
1.699
2.045
2.462
2.756
3.038
3.396
3.659
1.310
1.697
2.042
2.457
2.750
3.030
3.38
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 方法