生物医学研究的统计学第2410章答案Word文件下载.docx
- 文档编号:18705614
- 上传时间:2022-12-31
- 格式:DOCX
- 页数:9
- 大小:21.93KB
生物医学研究的统计学第2410章答案Word文件下载.docx
《生物医学研究的统计学第2410章答案Word文件下载.docx》由会员分享,可在线阅读,更多相关《生物医学研究的统计学第2410章答案Word文件下载.docx(9页珍藏版)》请在冰豆网上搜索。
6.6(天)
案例辨析首先观察资料的分布形式,由于呈正偏峰分布,选用上述结果描述住院天数的平均水平不合适。
正确做法宜选用不受定量资料分布情况限制的中位数来描述住院天数的平均水平。
本例计算结果为M=6.1(天)。
案例2-2某人编制了一张统计表(教材表2-15),你认为哪些需要改进?
教材表2-151976—1979年吉林市各型恶性肿瘤的死亡率
案例辨析原表格存在的问题:
①标题不准确;
②线条过多,出现了斜线、竖线和多余的横线;
③数字区域出现了文字;
④小数位数不统一,小数点没有纵向对齐;
⑤量纲的标注位置有误。
正确做法将原统计表中存在的上述错误纠正过来,修改后的统计表见案例表2-1。
案例表2-11976—1979年吉林市各年龄组人群部分恶性肿瘤死亡情况调查结果疾病胃癌食管癌肝癌肺癌
各年龄组死亡率(1/10万)
0~0.000.000.340.00
15~1.130.101.640.41
35~19.922.1825.3020.21
55~150.0035.2097.51125.10
75~313.4473.56134.33137.53
案例2-3某人绘制一张统计图(教材图2-11),你认为哪些需要改进?
教材图2-111952年与1972年某地肺结核、心脏病和恶性肿瘤的死亡率
案例辨析原图形存在的问题:
①缺标题;
②复式条图误用为单式条图;
③纵轴的量纲未注明;
④未正确给出图例。
正确做法将原图中存在的上述错误纠正过来,重新绘图(案例图2-1)。
案例图2-1某地三种疾病死亡率在1952与1972年间的变化
案例2-4以病死率为考察指标,对两所医院某病的治疗水平进行比较,结果见教材表2-16,由合计的病死率得出结论为乙医院治疗水平优于甲医院,请评述这个结论。
教材表2-162000年两所医院某病的病死率比较
病情严重程度
轻中重合计
案例辨析由教材表2-16可以看出,此表编制得不够规范,更为严重的是,虽然甲医院各种病情患者的病死率均低于乙医院,但总的病死率却是甲医院高于乙医院。
这个矛盾的出现,是由于甲医院收治的重病人多,轻病人少,乙医院则是重病人少,轻病人多。
两家医院收治患者的病情不均衡,不宜直接比较基于各自病情状况的病死率——“粗病死率”。
正确做法因各医院收治的患者在病情方面不均衡,直接进行比较是不正确的,而是要进行标准化处理后再比较。
标准化(standardization)有直接标准化法和间接标准化法两种。
(1)直接标准化首先确定一个标准组,将其病情分布视作标准分布,即两家医院理
甲医院
出院人数病死数
100
3006001000
83690134
病死率/%
8.012.015.013.4
乙医院
出院人数病死数6502501001000
654018123
10.016.018.012.3
论上共同的病情分布状况。
例如,某省内两家医院的对比,可以将全省、全国该类型患者入院时的病情分布作为标准组。
这里,将两家医院各种程度病情的患者数对应相加,“构造”出标准组,这是在不能获得参考文献关于全省、全国情况时的做法。
直接标准化计算过程见案例表2-2。
案例表2-2用直接标准化法对2000年两所医院某病的病死率作比较
病情严重程度轻中重合计
标准组人数Ni7505507002000
原病死率pi
甲医院8.012.015.013.4
乙医院10.016.018.012.3
预期病死率数Ni×
pi甲医院6066105231
乙医院7588126289
甲医院的标准化病死率:
p甲?
依照标准组的病情分布预期死亡数之和231
100%?
11.55%
标准组的总人数2000
乙医院的标准化病死率:
p乙?
依照标准组的病情分布预期死亡数之和289
14.45%
经标准化,甲医院的标准化病死率低于乙医院,正确反映了两组病死率水平的对比关系。
以甲医院的计算为例,粗病死率p甲是以甲医院实际病情分布为权重,对甲医院病死率水平的加权平均;
标准化的p甲'
则是以标准组病情分布为权重,对甲医院病死率水平的加权平均。
即
100?
8%?
300?
12%?
600?
15%100300600
15%
1000100010001000
13.4%
750?
550?
700?
15%750550700
20002?
00020002000
当进行对比的两组率为样本率时,下结论前需做假设检验,这里略去。
(2)间接标准化也需首先确定一个标准组(由文献获得),并给定标准组的各年龄别病死率及总的病死率。
由案例表2-3求出两家医院各自收治的患者按标准组的病死率水平将发生的总的死亡数。
标准组的选择依据同直接标准化法。
案例表2-3用间接标准化法对2000年两所医院某病的病死率作比较
标准组病死率pi9.014.016.013.5
出院人数
甲医院1003006001000
乙医院6502501001000
pi甲医院9.042.096.0147.0
乙医院58.535.016.0109.5
按标准组的病死率水平,甲医院有147例死亡,而实际甲医院仅有134例死亡,甲医院实际的病死发生程度低于标准组,两者程度之比134/147=0.91称作标化死亡比(standardmortalityratio,SMR),于是
SMR甲?
13.5%?
12.31%
同理,p乙?
SMR.5)?
1.12?
15.16%。
乙?
(123/109
结果,认为乙医院的病死率高于甲医院。
这是根据数值大小得出的直观判断结果。
若希望得出两医院标准化病死率之间的差别是否具有统计学意义,应进行假设检验,此处从略。
本题目是以“病死率”为例阐述了阳性率的标准化的问题,其余如死亡率、发病率、治愈率等同理。
第4章参数估计案例辨析及参考答案
案例4-1某研究者测得某地120名正常成人尿铅含量(mg·
L-1)如下:
尿铅含量0~例数
14
4~22
8~29
12~18
16~15
20~10
24~6
28~3
32~2
36~1
合计120
试据此资料估计正常成人平均尿铅含量的置信区间及正常成人尿铅含量的参考值范围。
由表中数据得到该例的n?
120,S?
8.0031,S?
0.7306,某作者将这些数据代入公式(4-20),即采用?
Z?
S计算得到正常成人平均尿铅含量100(1?
)%置信区间为(?
,14.0684);
采用公式?
S计算得到正常成人尿铅含量100(1?
)%参考值范围为(?
,26.0306)。
请问这样做是否合适?
为什么?
应当怎么做?
案例辨析该定量资料呈偏峰分布,不适合用正态分布法计算100(1?
)%参考值范围。
正确做法可以用百分位数法求正常成人尿铅含量100(1?
)%参考值范围的单侧上限。
例如,当?
=0.05时,可直接求P95分位数,(0,P95)就是所求的正常成人尿铅含量的95%正常值范围。
欲求正常成人尿铅含量总体均数的置信区间,当样本含量n较大(比如说,n大于30或50)时,样本均数就较好地接近正态分布(根据数理统计上的中心极限定理)。
本例,因为n?
120较大,不必对原始数据作对数变换就可以用?
S估计总体均数的置信区间。
案例4-2在BiPAP呼吸机治疗慢性阻塞性肺病的疗效研究中,某论文作者为了描述试验前的某些因素是否均衡,在教材表4-5中列出了试验前患者血气分析结果。
由于作者觉得自己数据的标准差较大,几乎和均数一样大,将标准差放在文中显得不雅观,于是他采用“均数±
标准误”(?
S),而不是“均数±
标准差”(?
S)来对数据进行描述。
问在研究论文中以教材表4-5方式报告结果正确吗?
教材表4-5试验组和对照组治疗前血气分析结果(组别试验组对照组
例数1210
年龄/岁
pH
pa(CO2)/kPa
S)
Sa(O2)/%85.12?
1.7386.45?
2.25
pa(O2)/kPa9.25?
0.559.16?
0.62
63.00?
4.337.36?
0.0563.00?
4.3362.50?
3.957.38?
0.0663.00?
4.33
案例辨析描述数据的基本特征不能采用?
S,因为S为反映抽样误差大小的指标,只表示样本均数的可靠性,而不能反映个体的离散程度。
不仅如此,因S仅为与其对应的S的1/n,有时,即使S很大(甚至大于),用S表示离散度时,不易被察觉出来,因此,用?
S表达定量资料时,往往具有欺骗性。
正确做法当各组定量资料服从或近似服从正态分布时,反映个体的离散程度应该采用标准差,即描述数据的基本特征必须采用?
S;
否则,需要采用M(Q1~Q3)描述数据的基本特征。
此处,M为中位数、Q1和Q3分别为第1四分位数和第3四分位数。
案例4-3某市往年的12岁男孩平均身高为140.0cm。
现在从该市的12岁男孩中随机抽得120名作为研究对象,得到平均身高为143.1cm,标准差为6.3cm。
请估计该样本对应总体均数的95%置信区间,并确定该均数是否与往年不同。
某学生的回答如下:
“该例12岁男孩平均身高的点估计值为143.1cm,按公式(4-21)计算得到该点估计值的95%置信区间为141.9~144.2cm。
因为往年12岁男孩平均身高为140.0cm,没有落在所计算的95%置信区间以内,所以可以认为现有男孩平均身高与往年身高有差异”。
请指出学生回答中的不恰当之处。
案例辨析不恰当之处有三:
①“点估计值的95%置信区间”的说法不对;
②“以往男孩平均身高没有落在所计算的95%置信区间以内”的说法不对;
③“现有男孩平均身高与往年身高有差异”的说法不对。
正确做法①应该说“点估计值对应总体均数的95%置信区间”;
②应该说“95%置信区间没有覆盖(包括)以往男孩平均身高”;
③应该说“现有男孩平均身高与往年男孩平均身高的差异有统计学意义”。
第10章简单线性回归分析
案例辨析及参考答案
案例10-1年龄与身高预测研究。
某地调查了4~18岁男孩与女孩身高,数据见教材表10-4,试描述男孩与女孩平均身高与年龄间的关系,并预测10.5岁、16.5岁、19岁与20岁男孩与女孩的身高。
教材表10-4某地男孩与女孩平均身高与年龄的调查数据
采用SPSS对身高与年龄进行回归分析,结果如表教材10-5和教材表10-6所示。
教材表10-5男孩身高对年龄的简单线性回归分析结果
ConstantAGE
估计值83.73635.2748
2
标准误1.88240.1676
t
44.483931.4798
P0.00000.0000
F=990.98R=98.5%
教材表10-6女孩身高对年龄的简单线性回归分析结果
估计值88.43264.5340
标准误3.28000.2920
26.961115.5290
F=241.15R=94.1%
经拟合简单线性回归模型,t检验结果提示回归方程具有统计学意义。
R2结果提示,拟合效果非常好,故可认为:
(1)男孩与女孩的平均身高随年龄线性递增,年龄每增长1岁,男孩与女孩身高分别平均增加5.27cm与4.53cm,男孩生长速度快于女孩的生长速度。
(2)依照回归方程预测该地男孩10.5岁、16.5岁、19岁和20岁的平均身高依次为139.1cm、170.8cm、184.0cm和189.2cm;
该地女孩10.5岁、16.5岁、19岁和20岁的平均身高依次为136.0cm、163.2cm、174.6cm和179.1cm。
针对以上分析结果,请考虑:
(1)分析过程是否符合回归分析的基本规范?
(2)回归模型能反映数据的变化规律吗?
(3)拟合结果和依据回归方程而进行的预测有问题吗?
(4)男孩生长速度快于女孩的生长速度的推断是否有依据?
案例辨析未绘制散点图,盲目进行简单线性回归分析;
若实际资料反映两变量之间呈现某种曲线变化趋势,用简单线性回归方程去描述其变化规律就是不妥当的。
正确做法分析策略:
作散点图,选择曲线类型,合理选择模型,统计预测。
(1)作散点图(案例图10-1)。
案例图10-1儿童身高对年龄的散点图
(a)男孩身高;
(b)女孩身高
由案例图10-1可见,随着年龄的增加,身高也增加,但呈曲线变化趋势,15~16岁后,增加趋势逐渐趋于平缓。
因此适合于拟合曲线回归方程。
(2)选择曲线类型,进行统计分析,几种曲线方程拟合结果如下。
ModelSummaryandParameterEstimatesDependentVariable:
男孩身高
Theindependentvariableis年龄。
DependentVariable:
女孩身高
上述曲线类型依次为线性、二次、三次多项式曲线和生长曲线,由拟合结果可知,曲线拟合效果较好,进一步得到曲线图(案例图10-1):
(3)选择合理的模型,列出回归方程。
以女孩身高二次曲线为例,方程如下:
a?
bX?
bX2?
bX3?
60.79?
10.81X?
0.29X2多项式曲线:
Y123
(4)统计预测:
预测19岁女孩身高为60.788+10.805×
18-0.292×
182=160.7,与实际趋势相符。
其他预测方法相同。
案例10-2贫血患者的血清转铁蛋白研究。
第6章例6-1中,为研究某种新药治疗贫血患者的效果,将20名贫血患者随机分成两组,一组用新药,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。
问新药与常规药治疗贫血患者后的血红蛋白增加量有无差别?
张医生用t检验比较新药与常规药治疗贫血患者后的血红蛋白增加量,计算得:
X1=27.99,X2=20.21,t=4.137。
王医生认为,可以作线性回归分析。
在该数据中涉及了两个变量,一是观察效应变量(连续性),即血红蛋白增加量,将之作为回归分析中的因变量Y;
另外一个变量为处理因素(二分类变量),即影响因素,将之作为自变量X,其中新药组X=1,常规药组X=0。
数据转
20.21?
7.78X,t=4.137。
换为双变量资料形式(教材表10-7),经分析得回归方程Y
教材表10-7两种药物治疗贫血患者结果
请考虑:
(1)王医生的分析方法对不对?
(2)回归分析能代行两样本均数t检验的任务吗?
(3)通过这个案例的实践,你得到哪些启发?
案例辨析王医生的分析方法是对的;
回归分析能代行两样本均数t检验的任务。
其理由如下。
正确做法两样本合并后,总例数为n?
n1?
n2=20。
进行直线回归分析,结果如下:
7.78X,R2=0.698。
经检验,贫血患者治疗后的血红蛋白增加量与治疗有Y
关。
bX=20.21+7.78×
0=20.21正常人均数:
Y1?
1=27.99患者均数:
Y1
截距与两样本均数的差值相等。
分别进行回归方程的方差分析与回归系数的t检验,得
F=17.112,t=4.137。
回归系数的t检验结果与两样本均数的t检验结果完全一致。
以上结
果说明,t检验的结果可以转化为直线回归方程分析。
当分组因素为k个组(样本)时,可以设置为k-1个指示变量,采用第11章的多重线性回归分析,这在多因素分析中是最常采用的办法。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物医学 研究 统计学 2410 答案