常见实验设计定量资料统计分析错误辨析.docx
- 文档编号:9575664
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:7
- 大小:19.25KB
常见实验设计定量资料统计分析错误辨析.docx
《常见实验设计定量资料统计分析错误辨析.docx》由会员分享,可在线阅读,更多相关《常见实验设计定量资料统计分析错误辨析.docx(7页珍藏版)》请在冰豆网上搜索。
常见实验设计定量资料统计分析错误辨析
常见实验设计定量资料统计分析错误辨析
【关键词】统计学医学统计分析交互作用定量资料
Keywords:
statistics;medicine;statisticalanalysis;interaction;quantitativedata
1引言
关于同一个资料或同一个分析目的,由于所采纳的统计分析方式不同,有时会得出不完全相同的结论,乃至有时会得出相反的结论。
因此,正确、合理地选用统计分析方式相当重要[1]。
那么,如何才能正确地实现定量资料的统计分析呢?
关键是两点:
其一,检查定量资料是不是知足参数查验的前提条件;其二,正确辨析定量资料所对应的实验(实验)设计类型[2]。
通过《中西医结合学报》前几期“医学统计学”栏目系列文章的介绍,咱们一起窗习了很多实验(实验)设计,了解了它们的特点、适用处合及如何正确分析这些实验(实验)设计定量资料。
固然,统计学水平的提高不能只依托于理论知识的学习,还需要理论联系实际,通过大量的“实战”练习来巩固和提高,以加深对理论知识的明白得。
本文就部份常见实验(实验)设计定量资料的统计学误用问题通过实例展现出来,并进行错误辨析,给出正确做法,帮忙广大科研工作者更好地提高统计学实际应用水平。
2实例辨析
检查参数查验条件参数查验的前提条件一样指独立性、正态性和方差齐性,固然对配对设计、重复测量设计定量资料不要求受试(实验)对象间知足独立性要求。
正态性要求各组定量资料别离取自正态散布的整体,方差齐性要求各实验(实验)因素的各水平组的整体方差相等;而关于具有重复测量设计的定量资料,还要检查其是不是知足HuynhFeldt(HF)条件,需做球性查验或用混合模型处置[3]。
例1某研究者为研究发生股骨头坏死的危险因素,从而为该病的预防提供依据。
采纳病例对照研究方式,以临床确诊的100例股骨头坏死患者作为病例组,按1∶3比例配对选取与病例同性别、同一年龄时期和同一居住地域的非股骨头坏死者(排除严峻的心、肝、肺、肾疾病)作为对照组,对劳动时刻和抽烟饮酒史等因素进行调查研究。
结果见表1。
研究者采纳成组设计定量资料的t查验分析此资料,妥否?
表1体质量指数、饮酒等因素与股骨头坏死的关系
(x±s)
因素病例组例数计量值对照组例数计量值tP体质量指数±天天重体力劳动时刻(h)±抽烟量(支/d)±±白酒(次/周)±黄酒(次/周)±啤酒(次/周)±体质量指数=体质量(kg)/身高2(m2)
辨析此表中的横标目“因素”事实上确实是观测指标,研究者采纳成组设计定量资料的t查验来分析病例组与对照组在这些指标上的取值的不同是不是存在统计学意义。
假设这些指标彼此之间没有专业上的联系,就可对每一个指标进行单独分析,那么对每一个指标来讲,此资料确为成组设计定量资料,但采纳成组设计定量资料的t查验来分析是不是适合呢?
认真观看表1中的数据,发觉除体质量指数外,病例组与对照组在其他指标上的取值均显现标准差大于均数的现象,因此该资料极可能不符合正态散布,故对所有指标一概采纳成组设计定量资料的t查验来分析是不妥的。
正确做法对资料的散布进行正态性查验,假设病例组与对照组在某个或某些指标上的取值不符合正态散布,应进行适合的变量变换或采纳Wilcoxon秩和查验进行处置;假设病例组与对照组在某个或某些指标上的取值符合正态散布,那么还应进行两组间方差齐性查验,知足方差齐性的条件可对那个或这些指标采纳成组设计定量资料的t查验来分析,不然须采纳成组设计定量资料的t'查验来分析。
假设希望由所考察的多项指标来预测股骨头坏死发生的概率,那么可采纳非条件多重logistic回归分析;假设病例与对照严格按某重要非实验因素(年龄或体质量)进行1∶1配对或m∶n匹配,那么可采纳条件多重logistic回归分析。
就这一具体问题而言,与多次采纳单因素分析相较,多重logistic回归分析的结论更具有可信性,也更有有效价值。
认清实验设计类型在生物医学实验中,应用比较多的实验设计是单因素κ(κ≥3)水平设计、析因设计和重复测量设计等。
另外,由于实验(实验)条件所限或研究者统计知识的缺乏,多因素非平稳组合实验(实验)应用也较多。
读者可结合《中西医结合学报》前几期“医学统计学”文章中对这些实验(实验)设计的论述及下面给出的部份实例,提高定量资料实验(实验)设计类型的辨析能力。
例2某研究者欲研究儿茶素对造血生长因子生物活性的刺激效应,选用24只大鼠,随机等分成两组:
对照组和儿茶素组,每组12只。
对照组大鼠天天腹腔内注射ml生理盐水,儿茶素组天天腹腔内注射2mg/ml规格的儿茶素溶液ml。
在给药后第一、3、五、7天别离处死3只大鼠,测量粒细胞巨噬细胞集落刺激因子活性(granulocytemacrophagecolonystimulatingactivity,GMCSA)。
实验结果见表2。
采纳t查验分析第一、3、五、7天测得的两组大鼠GMCSA的不同是不是有统计学意义。
请问:
如此分析适合吗?
表2儿茶素对GMCSA的阻碍
(x±s,n=3)
分组GMCSA(1×105骨髓细胞生成的粒单系造血祖细胞集落数)时刻:
第1天第3天第5天第7天对照组±儿茶素组±辨析本资料涉及2个因素:
“是不是注射儿茶素”和“处死时刻”。
前者有2个水平,后者有4个水平。
由于研究者在每一个时刻点上都处死3只动物,因此“处死时刻”不是重复测量因素。
所有实验条件由2个因素各水平全面组合而成,且每一个实验条件下都进行了3次独立重复实验,也无专业依据能够为2个实验因素对观测结果的阻碍存在主次之分,故此资料应为两因素析因设计定量资料。
采纳多次t查验分析此资料不但会增大犯假阳性错误的概率,且在两因素间存在交互作历时可能会得犯错误的结论。
正确做法假设资料知足参数查验的前提条件,可选用两因素析因设计定量资料的方差分析处置;假设不能同时知足参数查验的前提条件,那么应进行相应的变量变换,对变换后能知足此前提条件的数据再进行两因素析因设计定量资料的方差分析。
例3某研究者为观看奥美拉唑医治消化性溃疡并上消化道出血的酸性环境改善成效,选取80例因消化性溃疡并上消化道出血的患者,将其随机分为两组:
医治组和对照组,各40例。
医治组用奥美拉唑,对照组用法莫替丁。
测定用药前及用药后24、4八、72h空肚胃液pH值。
结果见表3。
统计分析方式采纳t查验。
请问:
采纳t查验分析此资料对吗?
辨析依照研究者的实验进程可知,在医治前和医治后24、4八、72h等4个时刻点上重复测量了同一受试者空肚胃液的pH值,因此“观看时刻”属于重复测量因素。
其实,表3是此资料表达的表现型,读者可能会误以为4个时刻点各不相干,而将其看成毫不相关的4个“指标”,因此对每一个“指标”采纳成组设计定量资料的t查验来分析,这么做的缘故是因为没有弄清楚资料的本质。
事实上,这4个时刻点是一个因素的4个水平,那个因素确实是“观看时刻”。
因此,咱们可对表3进行改良,给出该资料表达的标准型,从而清楚地呈现出资料的设计类型及其本质。
见表4。
能够看出,资料应为具有一个重复测量的两因素设计定量资料。
表3两组患者空肚胃液pH值转变表4两组患者空肚胃液pH值转变(标准型)
正确做法依照资料的设计类型,可采纳具有一个重复测量的两因素设计定量资料的方差分析处置此资料。
固然,在进行方差分析前,应先检查资料是不是知足参数查验的前提条件及HF条件。
假设这些前提条件不能全数同时知足,需进行适当的变量变换或采纳混合模型来分析。
当资料知足参数查验的前提条件时,最好以患者医治前空肚胃液的pH值作为“基础值”,采纳具有一个重复测量的两因素设计定量资料的一元协方差分析处置此资料。
例4某研究者选取10只家兔来研究某药物A对皮肤的损伤情形。
A有2个水平:
A1(高浓度),A2(低浓度)。
为排除实验部位对观测结果的阻碍,药物涂在兔的4个对称部位上,即部位因素B有4个水平:
B1(左前腿)、B2(右前腿)、B3(左后腿)、B4(右后腿)。
10只家兔被完全随机地均分到A一、A2两组中去,将药物涂在任何一只兔4条腿的对称部位,且涂的面积相等。
资料见表5[4]。
请问:
假设要分析两因素对观测结果的阻碍是不是有统计学意义,采纳析因设计定量资料的方差分析是不是合理?
表5家兔皮肤损伤直径
辨析实验中涉及2个实验因素:
药物浓度和涂擦部位。
前者有2个水平,后者有4个水平。
但由于对每只家兔来讲,涂擦药物的4个部位是对称的,具有可比性,且从这4个部位取得的实验数据具有必然的内在关联性,因此“涂擦部位”在那个地址是一个重复测量因素,此资料应为具有一个重复测量的两因素设计定量资料。
采纳析因设计定量资料的方差分析,不能有效地排除个体不同和对称部位上观测值之间的高度相关性对结果的干扰和阻碍,因此不能合理、有效地揭露因素及其交互作用的效应大小。
正确做法假设资料知足参数查验的前提条件及HF条件,可选用具有一个重复测量的两因素设计定量资料的方差分析处置此资料;如不能同时知足以上条件,那么需进行适当的变量变换或采纳混合模型来分析。
例5某研究者为研究刺五加皂苷对血管内皮生长因子蛋白及mRNA表达的阻碍,以人肝癌细胞株为研究对象,别离用酶联免疫吸附法检测刺五加皂苷对人肝癌HepG2细胞内皮生长因子蛋白表达的阻碍。
实验分组:
刺五加皂苷12五、250、500μg/ml组,丝裂霉素20μg/ml组,刺五加皂苷250μg/ml+丝裂霉素20μg/ml组,刺五加皂苷500μg/ml+丝裂霉素20μg/ml组,阴性对照组(不加处置因素)。
实验结果见表6。
研究者采纳单因素七水平设计定量资料的方差分析进行统计处置,适合吗?
表6各组内皮生长因子蛋白表达结果
辨析表6中“组别”下共有7个组,表面上看应为单因素七水平设计定量资料。
但认真研究发觉,“组别”下的7种实验条件事实上是2个因素组合而成,即“刺五加皂苷药物浓度”和“丝裂霉素药物用否”。
其中“刺五加皂苷药物浓度”有4个水平,别离为0、12五、250、500μg/ml;“丝裂霉素药物用否”有2个水平,即用与不用。
这2个因素的全面组合应有8种实验条件,而研究者只在其中的7种实验条件下做了6次独立重复实验,在“刺五加皂苷125μg/ml+丝裂霉素”条件下没有做实验。
因此那个资料的设计类型不是一个标准的实验设计,该资料应属于多因素非平稳组合实验定量资料。
而将“组别”看成唯一的实验因素,对资料采纳单因素七水平设计定量资料的方差分析是不妥的,与实际设计类型不符,也无法研究多个因素间可能存在的交互作用。
正确做法依照专业知识和统计学知识对此资料进行合理的拆分组合,然后对各类拆分组合依照其实验(实验)设计类型和资料是不是符合参数查验的前提条件选用适合的统计分析方式。
就本资料而言,可进行如下拆分。
组合1:
阴性对照组、刺五加皂苷125μg/ml组或刺五加皂苷250μg/ml组或刺五加皂苷500μg/ml组和丝裂霉素组。
组合2:
阴性对照组、刺五加皂苷125μg/ml组、刺五加皂苷250μg/ml组和刺五加皂苷500μg/ml组。
组合3:
阴性对照组、刺五加皂苷250μg/ml组、刺五加皂苷500μg/ml组、丝裂霉素组、刺五加皂苷250μg/ml+丝裂霉素组和刺五加皂苷500μg/ml+丝裂霉素组。
其中,组合1为单因素三水平设计定量资料,组合2为单因素四水平设计定量资料,组合3可视为实验因素“刺五加皂苷药物浓度”(包括0、250、500μg/ml3个水平)和“丝裂霉素药物用否”(包括用与不用2个水平)的全面组合,故为两因素析因设计定量资料。
在知足参数查验的前提条件下,组合一、组合二、组合3可别离采纳单因素三水平设计定量资料的方差分析、单因素四水平设计定量资料的方差分析和两因素析因设计定量资料的方差分析来处置资料;如资料不知足参数查验的前提条件,那么需对资料进行适当的转换或采纳非参数查验法处置上述3种组合下的定量资料。
【参考文献】
1HuLP.Commonstatisticsproblemsinlaboratorymedicineandcountermeasures.ZhonghuaJianYanYiXueZaZhi.2000;23(5):
299302.Chinese.
胡良平.查验医学中常见的统计学问题及其计谋.中华查验医学杂志.2000;23(5):
299302.
2HuLP,LiuHG.Discriminationandinterpretationoferrorsinstatisticalanalysisofquantitativedatainmedicalpapers.ZhongXiYiJieHeXueBao.2007;5(4):
481484.Chinese.
胡良平,刘惠刚.医学论文中定量资料统计分析方面的错误辨析与释疑.中西医结合学报.2007;5(4):
481484.
3HuLP,LiuHG.Discriminationofdesigntypesintheresearchofrehabilitationmedicine.ZhongguoLinChuangKangFu.2003;7(10):
15641566.Chinese.
胡良平,刘惠刚.康复医学研究中设计类型的辨析.中国临床康复.2003;7(10):
15641566.
4HuLP.Thegeneraltrainingofmedicalstatistics.Beijing:
PressofMilitaryMedicalSciences.2007:
400401.Chinese.
胡良平.医学统计实战练习.北京:
军事医学科学出版社.2007:
400401.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常见 实验设计 定量 资料 统计分析 错误 辨析