实验设计与数据处理论文2.docx
- 文档编号:3418859
- 上传时间:2022-11-22
- 格式:DOCX
- 页数:11
- 大小:298.94KB
实验设计与数据处理论文2.docx
《实验设计与数据处理论文2.docx》由会员分享,可在线阅读,更多相关《实验设计与数据处理论文2.docx(11页珍藏版)》请在冰豆网上搜索。
实验设计与数据处理论文2
医学中的实验设计与数据处理
摘要:
实验是一切自然学科的基础。
实验设计与数据处理在医学中更是发挥着不可估量的作用。
正交实验设计中,对实验进行改进,采用极差分析和方差分析法,研究不同改性条件对大豆蛋白乳化性的影响,并找出主要影响因素。
通过科学合理的实验设计过程加上严谨规范的数据处理方法,可以使医学中更多的生理机制被探索发现,使更多的药物疗法被发明应用,从而更好地拯救患者,造福人类。
关键词:
医学实验,实验设计,数据处理
一,引言
实验是自然学科的基础,任何自然科学都离不开实验。
科学界中大多数的公式定理都是由实验反复验证而推导出来的,只有经得起实验验证的定理定律才具有普遍实用性。
而科学的实验设计是利用已有的专业学科知识,以大量的实践经验为基础而得出的既能减少实验次数,又能缩短试验周期,从而迅速找到优化方案的一种科学计算方法。
这就必然涉及到实验的数据处理,也只有对实验得出的数据作出科学合理的处理,才能使实验结果更具说服力。
实验设计方法最早应用于农业、生物学、遗传学方面。
早在20世纪中期,就有一些欧美国家将实验设计应用于工业生产,以达到减少成本而获取最大利益的目的。
随着时间的推移,实验设计越来越受到人们的重视,也开始在各个领域开始广泛的应用。
医学是一门将科学和生活紧密结合的学科,因此医学中的实验设计显得尤为的重要。
科学的实验设计不仅能起到节约时间,节约成本的作用,还能使分析更具普遍适用性,或减少药物风险,或增强药物疗效,更加福泽患者。
二,.试验设计与数据分析
(一)完全随机试验设计与单因素方差分析
完全随机试验设计比较简单,处理数与重复数都不受限制,适用于试验条件,、环境、试验动物差异较小的试验【1】,完全随机试验设计只设置1个试验因素,可采取单因素方差分析,如果有协变量影响,则考虑单因素协方差分析。
方差分析的前提条件是样本独立性、正态性和方差齐性【2-3】,若不满足这3个条件,则需进行平方根转换#对数转换和反正弦转换(在Excel中通过插入函数或利用Spss的数据转换命令进行转换),或者选择非参数检验(如秩和检验、符号检验等)。
以上条件中,对独立性要求最严格,但一般都可满足,根据试验设计的随机化基本原则在试验设计和试验过程中已被充分考虑。
相互独立的随机样本才能保证变异的可加性(可分解性)。
单因素方差分析必须考虑正态性和方差齐性,但无重复数据的方差分析,如正交设计则不考虑这2个问题,正态性和方差齐性是以单元格为基本单位的,每个单元格若只有1个数据,则无法分析;对于有重复数据的多因素方差分析,真正分到每个格子中的样本例数一般都只有3-5例,很难检验出差别,或者极端情况,因为极个别格子方差不齐而导致检验不能通过,这种情况实际上对分析结果影响并不太严重,只要数据分布不是明显偏态,不存在极端值即可【4】,正态性检验的方法有多种,如图示法(概率图或分位数图),或计算法(如矩法、W检验法、D检验法)等,本文主要采用Spss中依据矩法原理的单样本K-S法进行正态性检验。
方差齐性是指相互比较的各样本的总体方差相等。
1,例1.为了比较5种不同配合饲料对猪的饲喂效果,选取了品种、性别、体重基本相同的仔猪25头,随机分成5组,投喂不同饲料,经30d试验后,各组的增重结果列于表1【5】,
(1)Spss操作(部分数据文件见图1)
正态性检验,Analyze—→NonparametricTest----→1-SampleK-S,净增重---→TestVariableList,TestDistribution中选择Normal→Ok。
5组饲料的P值分别为0.722、0.967、1.000、0.964、1.000,均服从正态分布。
单因素方差分析。
本题只有1个试验因素,无协变量影响,属于简单的单因素方差分析,选择Spss中针对单因素单向方差分析的One-wayANOVA命令进行快速分析。
Analyze→CompareMeans→One-wayANOVA,组别→Factor,净增重→DependentList,PostHoc→PostHocMultipleComparisons(多重比较)→Duncan→Continue→Options→Descriptive,Homogeneity-of-Variance(方差齐性检验)→Continue→Ok。
输出结果有描述性统计量、方差齐性检验、方差分析、多重比较。
方差齐性检验结果,P=0.579大于0.05即方差齐性。
方差分析结果,P=0.003小于0.01,表明不同配合饲料对猪的饲喂效果有极显著差异,且饲料5对猪增重效果最佳。
(2)Excel作图。
选择图表类型并生成初图。
复制Spss描述性统计结果→编辑(Excel中)→选择性粘贴→Unicode文本。
插入→图表→柱形图→子图表类型→簇状柱形图(右侧类型中的第一个)→下一步→数据区域(选定平均值一列数据区域)→完成。
图形初步编辑。
数据轴主要网格线→右键→清除,绘图区→右键→清除,图例→右键→清除;数据柱→数据系列格式→图案→边框→自定义→颜色→黑色,内部→颜色选白色;图表区→右键→图表区格式→图案→边框→无,区域→无→确定,字体→字体先选宋体,再选TimesNewRomen,字形→常规,字号→8号。
图表区左上角小正方图变为45度双向箭头时,向右下角方向拉动,将横坐标轴长度调整为Excel中3个单元格长度,将纵坐标轴长度调整为Excel中6个单元格长度(横、纵坐标轴长度视具体情况而定,图形美观即可),纵坐标→右键→坐标轴格式→刻度→主要刻度单位为4(视具体情况而定)→确定。
添加误差线。
若样本数相同,误差线既可选择标准偏差(SD),又可选择标准误差(SE),若样本数不同,则只能选择标准误差,通常都选择标准误差.。
数据柱→右键→数据系列格式→误差线→显示方式→正偏差→自定义:
(C)+(选定标准误那列数据区域)→确定"。
多重比较结果标注。
根据图2多重比较结果,不在同一列,表示差异显著(P<0.05),用不同字母表示,同列用相同字母表示,表示差异不显著(0.05
变成.JPG图片。
复制Excel中图形至Word中,编辑→选择性黏帖→图片(增强型图元文件)。
(3)Word编辑。
点击图片→右键→显示“图片”工具栏→裁剪→调节图片四边至合适大小→文字环绕→浮于文字上方→点击图片→图表区左上角空心圆变为45度双向箭头时向右下角方向拉动,调节至合适大小。
图表标题和坐标轴标目填写的通常做法是在Excel中完成:
图表区→右键→图表选项→将图表标题、横、纵坐标标目分别输入图表标题(T),分类(X)轴(C),数值(Y)轴(V)中。
但如果论文中图形较多,一旦图表标题和横、纵坐标轴标目出现错误会造成修改不便,或者几个图形组合在一起,为了美观,需使几个图形具有相同的横、纵坐标长度,则要反复调整,势必会增加工作量。
可通过插入文本框实现。
插入→文本框→横排→输入横坐标标目→点击文本框边缘→右键→设置文本框格式→颜色与线条→线条→颜色选为白色→确定。
若为纵坐标标目,点击所写的纵坐标标目→右键→文字方向→方向→选择第二行第1个.。
最后,按Shift将横、纵坐标标目与图形进行组合(见图3).。
(二)随机区组设计与2因素方差分析
随机单位组设计也称为随机区组(或窝组)设计。
它是根据局部控制的原则,如将同窝、同性别、体重基本相同的动物划归一个单位组,每一单位组内的动物数等于处理数,并将各单位组的试验动物随机分配各处理组[6]。
随机区组设计的数据分析中将区组作为1个因素,再考虑另一试验因素,因此通常采用2因素方差分析中最简单的两因素无交互方差分析。
例2,4个品种的猪,分别用3种配合料(每种饲料喂1头猪)饲养3个月的增重结果见表2。
分别检验不同品种以及不同饲料对猪增重效果是否有显著差异[10]。
数据文件见图4
输出结果有方差分析、单因素统计量以及多重比较(由于本文主要介绍数据分析过程以及作图技巧,在此不将方差分析、单因素统计量作为重点列出)。
方差分析表明,品种、饲料P值分别为0.000,0.016,即不同品种及不同配合饲料对猪的饲喂效果均有显著影响,品种1和饲料2和3对猪增重效果最好。
(1)根据单因素统计量和多重比较结果画出柱状图。
为了节省作图时间,根据单因素统计量和图5多重比较结果在Excel中先做好图6中左图&复制→粘贴→点击图表区→右键→源数据→在数据区域中插入右图数据,这样2个图形大小基本一致,重新添加平均值、误差线和多重比较结果,为了使数据柱对比更加鲜明,将Excel中纵坐标最大和最小值调节为合适的数值。
调整2个图形横坐标在Excel同一行单元格上,调整横、纵坐标轴,使2个图形具有相同长度的横纵、坐标轴,具有相同数量的主要刻度单位。
(2)调整2个图形使数据柱具有相同宽度。
点击数据柱→右键→数据系列格式→选项→分类间距→调整数值使2个图形数据柱具有相同宽度.。
(3)组合图形。
Shift→分别点击2个图形→右键→组合→复制至Word中→编辑→选择性粘帖→图片(增强型图元文件).。
插入图表标题和坐标轴标目,并与图形组合。
三 常见的医学实验设计类型
(一)医学实验设计类型有几十种:
常见的有:
配对设计、成组设计、单因素K水平设计(K≥3)、配伍组设计、拉丁方设计(拉丁方设计中,试验处理数=横行单位组数=直列单位组数=试验处理的重复数【1】)、交叉设计、析因设计、正交设计和具有重复测量的设计。
正交设计是利用正交表来安排与分析多因素试验的一种设计方法,它利用从试验的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这些部分试验结果的分析了解全面试验的情况,找出最优的水平组合【1,7-8】.。
从是否便于考察因素之间交互作用的角度看,前六种设计都不便考察交互作用,后三种设计是可以考察交互作用的。
从同时考察因素的个数多少角度看,前三种设计都属于单因素设计,配伍组设计属于二因素设计,拉丁方设计、交叉设计都属于三因素设计,而后三种设计即可以用于二因素设计,又可以用于多因素设计。
由于配伍组设计、拉丁方设计和交叉设计都不便考察交互作用,故最适合用于安排只含一个处理因素,含一个或二个区组因素的实验研究场合。
如果实验中同时涉及二个或二个以上处理因素,因素之间的交互作用往往又是不可忽视的,此时,就应当选用析因设计或正交设计。
如果希望观察接受不同处理的几组受试对象某些定量观测指标随时间推移的动态变化趋势,需要在不同时间点上从同一个受试对象身上进行多次观测,这就是所谓的重复测量设计(9)。
在一次实验中,某人在研究三七皂甙Rg1对大鼠实验性血栓形成的影响和对正常血压及高血压大鼠血小板内游离钙水平影响时,收集到表1和表2资料(10)。
Tab.1EffectsofRgl,Rb1andlysinipirinum(LNP)onthrombosisinrats(
±s)
Drug/(mg*kg)
Thrombosiswetweight/mg
NS
25.3±3.9
Rg1 5
8.7±1.2
Rb1 5
18.0±3.3
LNP 9.04
8.2±1.2
NS:
Normalsaline;Rb1andRg1:
TwocomponentsinGinsenosides;LNP:
Lysinipirinum
Tab.2EffectsofRg1onplatelet[Ca2+]iundertheinfluenceofthrombininnormotensiveandhypertensiverats(±s)
Group
Rg1/
(μmol*L)
[Ca2+]i*(nmol/L)
Resting
Thrombin
Normotensive
0
167±24
503±62
1
154±26
255±66
10
141±30
160±33
100
120±26
140±31
Hypertensive
0
230±47
709±65
1
182±38
312±46
10
140±39
232±31
100
131±32
157±37
可以看到,表1中虽然涉及到药物和剂量二个方面,但一种药物只取了一种剂量,并不能将剂量视为一个独立的因素。
因此,在表1中,只有药物一个因素,它有四个水平,生理盐水可被视为一种特殊的“药物”。
显然,与表1资料所对应的实验设计类型应叫做单因素四水平设计。
而表2资料中涉及到三个因素,即受试者的类型(分为正常血压者与高血压者)、接受药物Rgl的剂量(分为0、1、10和100/μmol*L-1)和受试者被检测时所处的状态(静息与接受凝血酶刺激后)。
本资料所对应的实验设计类型取决于在二种状态下是对各组中每一只大鼠分别进行了检测,还是对不同大鼠进行了检测。
若属于前一种情况,应叫做具有一个重复测量的三因素设计;若属于后一种情况,应叫做三因素析因设计。
(二)实验数据的分析与处理
在设计实验中,表格的合理设计对实验结果的分析有很大的促进作用。
科学合理的表格让人对实验分析方法一目了然,而不合理的表格则易使人产生混淆,误用分析方法而出现不必要的错误影响实验结果。
在另一次实验中,某人用6.5Gy照射小鼠后再用几种不同的药物治疗,观察每只小鼠照后不同时间点上外周血白细胞数的动态变化情况,各处理组中的小鼠在不同时间点上反复被观测。
资料如表3所示。
Tab.3ChangesofcirculatingWBC(×109/L)inratsby6.5γirradiation(
±s,n=10)
Daysafterirrad#
Group
WBC(×109/L)
Control
rhIL-6
rhG-CSF
rhIL-6+rhG-CSF
Before*
19.7±1.8
17.3±3.2
17.9±3.8
18.3±3.7
7
1.8±0.7
1.9±0.8
2.0±1.0
2.2±1.5
10
1.8±0.9
1.7±0.8
1.7±0.6
1.3±0.6
14
1.9±0.6
2.9±1.0
2.7±1.1
2.5±0.9
17
2.8±1.0
3.3±0.9
4.6±1.2
4.5±1.1
21
7.6±2.0
6.6±2.4
6.0±3.0
6.9±4.2
23
9.4±3.8
9.7±4.2
9.7±3.9
8.7±5.6
在本实验中涉及了三个处理因素,除照后时间外,纵向所列的四组是各有二水平的二个因素的四种组合,并非是一个药物因素的四个水平,仔细观察不难看出,这个组合因素的四个水平就是由rhIL-6不用与用、rhG-CSF不用与用的四种组合。
将这四种组合视为四个实验条件,每个实验条件下的10只小鼠在7个不同的时间点上被重复观测WBC的值,故与表5对应的实验设计类型应叫做具有一个重复测量的三因素设计。
若将表3资料用表4的形式表达,则容易辨别出它所从属的设计类型。
Tab.4ChangesofcirculatingWBC(×109/L)inratsatdifferenttimepointsby6.5γirradiation(±s,n=10)
Daysafterirrad#
TREATMENT:
WBC(×109/L)
A0,B0
A1,B0
A0,B1
A1,B1
Before*
19.7±1.8
17.3±3.2
17.9±3.8
18.3±3.7
7
1.8±0.7
1.9±0.8
2.0±1.0
2.2±1.5
10
1.8±0.9
1.7±0.8
1.7±0.6
1.3±0.6
14
1.9±0.6
2.9±1.0
2.7±1.1
2.5±0.9
17
2.8±1.0
3.3±0.9
4.6±1.2
4.5±1.1
21
7.6±2.0
6.6±2.4
6.0±3.0
6.9±4.2
23
9.4±3.8
9.7±4.2
9.7±3.9
8.7±5.6
Irrad#meansirradiation;Before*meansbeforeirradiation.A0andA1standfornotusingandusingrhIL-6;B0andB1standfornotusingandusingrhG-CSF2
将数据录入科学合理的表格以后,就要进入最终分析步骤了。
目前最常用的数据处理技术有t检验和F检验。
一般来说,如果比较的数据只有两组,一般用t检验,但也可以用F检验,但是如果比较的数据多于两组,则只能用F检验。
不同的设计类型,需要运用相应的方差分析方法。
但严格地说,方差分析也有其应用条件。
与t检验相同,它也要求资料满足正态性(即各组数据分别服从正态分布)和方差齐性(即任何一个因素的多个水平所对应的多个总体方差应相等)。
如果应用条件不满足,要么找到合适的变量变换方法,使变换后的数据满足条件,再对变换后数据进行方差分析;要么找到相应的非参数检验方法。
(三)概括地说,方差分析方法有几十种。
因为存在几十种不同的实验设计类型,而每一种实验设计类型,有与其对应的方差分析方法。
分析的思路是基本相同的,只是具体的计算公式(即统计模型)是有区别的。
例如上面提到的表一的资料,如果四组资料都分别满足正态性,四组资料满足方差齐性,则应选用单因素四水平设计资料的方差分析。
若方差分析的结果为四组均数之间的差别有显著或非常显著性意义(P<0.05或P<0.01),尚需作多个均数之间的两两比较。
若四组中任何两组之间都需要比较,有多种方法,其中较常用的方法叫q检验;若三个药物组之间不需要比较,而三个药物组都需与生理盐水组比较,则应选用DUNNETT的t检验。
而对于表2资料,如果原始资料满足正态性和方差齐性,根据它是属于三因素析因设计还是属于具有一个重复测量的三因素设计,就应分别选用相应设计资料的方差分析法。
通过三因素析因设计资料的方差分析,可以分析出三个因素各自的效应大小以及它们之间各级交互作用(包括任何二个因素之间和三个因素之间的交互作用)的效应大小。
当交互作用具有显著性意义时,还可对其作进一步分解,以便发现因素之间的最佳水平组合。
通过具有一个重复测量的三因素设计的方差分析,可以有效地排除个体差异和相邻时间点上观测值之间的高度相关性对结果的干扰和影响,比运用一般的方差分析方法能更合理、更有效地揭示因素及其交互作用的效应大小。
四,结语
spss是国际上公认的权威的统计分析软件,广泛应用于自然科学与社会科学研究中[11-13],与SAS,SATA相比,spss不需要编程,只需点击菜单和对话框,易学易用,在短时间内甚至几秒钟内即可得出数据分析结果,但要求掌握基本的统计原理。
Excel也可进行简单的数据分析,但分析结果信息量少,且操作繁琐。
而Excel在作图方面却不失为一优秀软件"与当前流行的数据处理图形软件Matlab.AutoCAD,Sigmaplot、SPSS等相比,Excel不需要一定的编程知识和矩阵知识,图表类型多样,图形精确、细致、美观,且操作灵活、快捷,图形随数据变化呈即改即现的效果,既能绘制简单图形,亦能绘制较为复杂的专业图形。
在医学科研中,要解决的问题往往比较复杂,经常要运用多因素实验设计方法和相应的统计分析方法。
这就需要医学工作者有足够的勇气和耐心来克服难关,突破阻碍。
利用国际上著名的统计分析系统(14),可以有效地进行多因素实验设计和各种实验资料的统计分析,它可以帮助人们从依赖计算器和t检验的落后局面中解放出来。
随着人类文明程度的不断提高,科研工作(包括医学期刊中论文的质量)的水平和质量也应不断提高,以适应时代的发展。
相信在不久的将来,人类能够利用自己的智慧,使医学中的实验设计与数据处理发挥最大作用,更好地拯救患者,造福人类。
参考文献
[1]明道绪.生物统计附试验设计(第三版)[M].北京:
中国农业出版社,2001.
[2]卢纹岱.SPSSforWindows统计分析[M].北京:
电子工业出版社,2006.
[3]张文彤.SPSS11.0统计分析教程(高级篇)[M].北京:
北京希望电子出版社,2010.
[4]李春喜,邵云,姜丽娜.生物统计学[M].北京:
科学出版社,2010.
[5]金玲,陈婉如.动物饲养试验方案设计原则及试验数据分析方法[J].江西饲料,2007(6):
10-12.
[6]徐向宏,何明珠.试验设计与Design-Expert、SPSS应用[M].北京:
科学出版社,2010.
[7]张苏江,陈庆波.数据统计分析软件SPSS的应用(四)------广义因素方差分析(GLM-GeneralFactorialANVOA)[J].畜牧与兽医,2003,35(8):
24-26.
[8]韩永龙,王浩,付丽佳.SPSS软件用于药学研究中的正交设计数据处理[J].药学进展,2002,26(3):
179-182.
[9]现代统计学与SAS应用[M].胡良平主编.北京:
军事医学科学出版社,1996:
57-151.
[10]《医学实验中常见设计类型的辨析及统计方法的合理选用》胡良平中国应用生理学杂志2000年第1期第16卷技术方法.
[11]黄品贤.中医统计学实习指导及SPSS15.0的应用[J].北京:
科学出版社,2009.
[12]夏怡凡.SPSS统计分析精要与实例详解[M].北京:
电子工业出版社,2009.
[13]窦清.基于金融市场综合实验室的SPSS实验教学的思考[J].实验室研究与探索,2007,26(4):
21-23,36.
[14]SASInstituteInc.SAS/STATUser'sGuide,Release6.03Edition.NorthCarolina,USA:
SASInstituteInc.1988:
549-637,941-947.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验设计 数据处理 论文