EXCEL在医学统计学中的应用.docx
- 文档编号:30702384
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:30
- 大小:101.46KB
EXCEL在医学统计学中的应用.docx
《EXCEL在医学统计学中的应用.docx》由会员分享,可在线阅读,更多相关《EXCEL在医学统计学中的应用.docx(30页珍藏版)》请在冰豆网上搜索。
EXCEL在医学统计学中的应用
EXCEL在医学统计学中的应用
(一)
——概述
本课程所需所有EXCEL示例程序,请下载:
一般函数解释.xls,统计函数解释.xls,
统计分析工具解释.xls,统计程序设计解释.xls,
EXCEL实用临床统计程序.xls。
统计学是医学科学的基础学科,对临床医学和实验研究有重要的指导价值[1]。
对大多数临床医师而言,在正确应用统计分析和计算时常感力不从心。
为此,早在十几年前,就有统计学工作者应用BASIC语言编写统计程序[2],以后随着微机的软件和硬件技术的发展,为统计学计算带来了飞跃发展,但建筑在DOS操作系统和数据库基础上的统计软件包需要培训,故其普及和推广应用受到一定限制[3]。
近年来,建筑在Windows操作平台的OFFICE软件得到迅速普及,其中EXCEL优越的数据处理性能和强大的统计计算功能开始为大家所熟悉,在国外有许多医院和实验室已经用EXCEL进行医学数据资料的统计计算的报道[4],国内也有这方面的报道[5],经推广使用和《好医生》网站交流,颇受欢迎。
EXCEL不仅具有现有的的强大的编程和统计功能,更有利于医学资料和统计资源的共享。
EXCEL是一个很有发展潜力的软件,其宏命令和VBA(VisualBasicforApplication)更为EXCEL扩展功能提供了界面,以编程方式对数据分析功能的访问是所有表处理软件中最高级的;EXCEL提供了电子邮件的内部特性的功能,使创建的文件可以和INTERNET上其他人提供的文件进行联接,下载工作簿到用户计算机,也可上载工作簿到FTP(文件传输协议)站点,其数据交换和网络通讯,为统计学工作者数据资料的收集、处理和统计分析提供了更广阔的范围。
EXCEL在医学统计中的应用
在电子表格上,编制了一些常用的医学统计程序,经实际使用以及和SAS、SPSS对比,计算结果一致。
现把如何应用介绍如下:
进入统计程序
每一张电子表格是一个统计程序,当进入EXCEL,打开卫生统计工作簿时,用鼠标点开标签,则该统计程序的电子表格就显示在屏幕上,就可直接使用该统计程序。
常用统计程序
2.2.1计量资料的统计程序
U检验、t检验、几何均数t检验、配对t检验、t'检验、方差分析(三样本)、配伍方差分析、方差分析(四样本)、随机区组方差分析、拉丁方设计方差分析、无重复试验的两因素方差分析、重复试验的两因素方差分析、几个处理组均数与一个对照组均数比较、多个样本两两比较(Newman-Keuls法)、例数相等协方差分析、例数不相等协方差分析、2X2析因方差分析、2X2X2方差分析、直线回归与相关。
详细请见EXCEL实用临床统计程序.xls
2.2.2计数资料的统计程序
卡方检验有:
基本公式、四格表专用公式、2X2等列联表和四格表的确切概率法。
RXCG检验等。
(详细请见EXCEL实用临床统计程序.xls)
2.2.3非参数的统计程序
秩和检验:
配对秩和检验、成组设计两样本比较的U秩和检验、等级资料的两样本秩和检验、成组设计两样本比较的秩和检验、成组三样本秩和检验(Kruskal-Wallis法)、成组四样本秩和检验(Kruskal-Wallis法)、成组秩和检验(Kruskal-Wallis法)、多个样本两两比较的秩和检验、RIDIT分析、配对资料的符号检验、样本与总体中位数比较的符号检验、升降趋势的符号检验(Cox-Stuart)等。
(详细请见EXCEL实用临床统计程序.xls)
2.2.2其他统计程序
均数的抽样、样本均数与总体均数比较(或配对比较)、两样本均数比较、多个样本均数比较、率的抽样、两样本率的比较、配对分类资料比较、多个样本率比较。
标准化率:
直接法计算疾病标准化死亡率(1/10万)、间接法计算疾病标准化死亡率(1/10万)。
寿命表及其应用:
简略寿命表、研究肿瘤(或其他慢性疾病)生存率的改进寿命表法,n月生存率方差、标准误和95%可信区间的计算;完全数据的队列寿命表法、被随访者同时进入随访队列的寿命表、被随访者随时进入随访队列的寿命表、随访资料中被随访者尚有生存者并有失访者的常见队列寿命表、用寿命表方法计算概率病死数等。
(详细请见EXCEL实用临床统计程序.xls)
使用方法和注意要点
2.3.1对初学者而言,先打开统计程序后,就可看到电子表下面的标签内容,有使用说明、U检验、成组T检验、配对T检验、几何T检验……。
只要求使用者根据自己想解决的问题,正确选择统计方法和相应的统计程序,选择所需的工作表后,将统计资料输入到原始数据输入区,即红框内就完成操作;就可举重若轻地解决烦琐的计算问题,得到统计结果。
2.3.2数据输入
当样本资料超过资料框时,可先进行插入行操作,再输入资料数据即可,但不能作列插入,否则无法进行统计计算。
有的数据插入后,其右边单元格中公式需要复制,如配对设计t检验、几何均数比较的t检验、配伍组设计方差分析等,复制时只要将上面有公式的单元格复制框向下拖动即可。
整批样本资料数据(千万注意不要将格式和公式一起复制)用复制方式输入数据,复制后须将指示框移开。
重新计算,一定要将资料样本区的上一批数据全部清除,否则会影响本次计算结果。
计算迅速精度高,同时显示出各统计步骤的中间结果,便于核对和查找存在的问题。
计算结果的精度可达小数点后12位,满足统计计算的要求。
这些程序自98年编写以来,不断改进,并不断有新的实用程序与大家见面,对临床医学和实验研究起到了重要的指导作用。
但另一方面,EXCEL虽有分析工具的现成统计软件供大家使用,但尚有许多有用的统计方法没有提供,如二二比较、2X2X2设计资料的方差分析、秩和检验、配对资料的符号检验、样本与总体中位数比较的符号检验、升降趋势的符号检验(Cox-Stuart)、标准化率、寿命表及其应用等。
本文目的在于抛砖引玉,希望统计学工作者能用EXCEL编写出更多更实用的具有中国特色的统计程序,更希望有更多的统计学工作者和临床医师结合起来,设计出更多符合实际需要的统计程序,能使大家能从繁琐的计算中解放出来,让电脑代替人脑,使人们的精力更多地集中在科研设计和创造性的思维中去。
参考文献
1.方积乾,徐勇勇,余松林。
医学统计学与电脑实验。
上海:
科学技术出版社,1997:
2~3。
2.毛宗秀。
BASIC语言常用数理统计方法程序汇编。
浙江:
科学技术出版社,1979:
1~172
3.俞顺章,俞国培。
疾病数据的管理和分析。
上海:
上海医科大学出版社,1992:
2~5
4.Kokol-P.Atoolforsoftwareandhardwareevaluation.J-Med-Syst.1966Jun;20(3):
167~172
5.董大钧,张宝珍等。
利用Excel进行医学统计t检验分析。
中国卫生统计,1999,16(3):
184~185
EXCEL在医学统计学中的应用
(二)
——应用EXCEL统计函数公式进行统计分析
本课程所需所有EXCEL示例程序,请下载:
一般函数解释.xls,统计函数解释.xls,
统计分析工具解释.xls,统计程序设计解释.xls,
EXCEL实用临床统计程序.xls。
应各位医生、其他专业的朋友和网友的要求,现将EXCEL在医学统计学中的应用的原理和方法介绍如下:
资料
主要根据高等医药院校教材《卫生统计学》[1]、上海第一医学院卫生统计教研组编写的《医学统计方法》[2]、《中国医学百科全书医学统计学》[3]、《医用数理统计方法》[4]和《临床统计学》[5]《寿命表及其应用》[6]等书中有关统计公式和例题进行编程。
编程软件
2.1统计函数:
示例详见统计函数解释工作簿(请下载)。
1)求集中趋势的统计函数:
AVERAGE(number1,number2,...)等,详细请见统计函数解释工作簿的集中趋势的统计函数工作表。
2)求离散趋势的统计函数:
AVEDEV(number1,number2,...)等,详细请见统计函数解释工作簿中的离散趋势的统计函数工作表。
3)求频数分布的统计函数:
FREQUENCY(data_array,bins_array)等,详细请见统计函数解释工作簿中的频数分布的统计函数工作表。
4)正态分布的统计函数:
NORMDIST(x,mean,standard_dev,cumulative)等,详细请见统计函数解释工作簿中的正态分布的统计函数工作表。
5)总体均数估计和假设检验的统计函数:
TTEST(array1,array2,tails,type)等,详细请见统计函数解释工作簿中的总体均数估计和假设检验的统计函数工作表。
6)方差分析的统计函数:
FTEST(array1,array2)等,详细请见统计函数解释工作簿中的方差分析的统计函数工作表。
7)X2检验的统计函数:
CHIDIST(x,degrees_freedom)等,详细请见统计函数解释工作簿中的卡方检验的统计函数工作表。
8)秩和检验的统计函数:
RANK(number,ref,order)等,详细请见统计函数解释工作簿中的秩和检验的统计函数工作表。
9)回归与相关:
CORREL(array1,array2)等,详细请见统计函数解释工作簿中的回归与相关工作表。
2.2常用数学、逻辑和查找函数:
省略,见EXCEL使用指南详细请见一般函数解释工作簿。
应用EXCEL进行统计分析的方法
用EXCEL进行统计分析有四种方法来实现:
1直接应用EXCEL统计函数公式;2应用EXCEL分析工具库;3应用EXCEL电子表格和函数编制应用程序;4应用EXCEL统计宏。
其中统计宏的编制需要一定软件基础,难以展开讨论,以下对其他三种方法结合实例分析。
3.1应用EXCEL统计函数公式进行统计计算
EXCEL函数公式不但有强大的科学运算函数和财务分析函数,而且还有丰富的统计函数,这些统计函数可直接对电子表格上指定区域内数据进行统计计算。
以两个样本的均数T检验为例:
3.1.1TTEST求两个样本的均数t检验
TTEST 判断两个样本是否可能来自两个具有相同均值的总体。
语法 TTEST(array1,array2,tails,type)
Array1 为第一个数据集;Array2为第二个数据集。
Tails 指明单尾或双尾检验。
如果tails=1,函数TTEST使用单尾检验。
如果tails=2,函数TTEST使用双尾检验。
Type 为t检验的类型。
1 成对检验方法;
2 等方差双样本检验;
3 异方差双样本检验。
例1.某单位研究饮食中缺乏维生素E与维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对字,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,见表,问不同饲料的大白鼠肝中维生素A含量有无差别?
操作步骤:
(1)在J44:
J51区域内输入正常饲料组维生素A含量,
(2)在K44:
K51区域内输入维生素E缺乏组维生素A含量,(3)在I44格中输入"=TTEST(J44:
J51,K44:
K51,2,1)"。
(4)输入回车键后,I44格就显示P值结果:
"0."。
推断分析:
因为P值<0.05, 故可认为两种饲料组所得肝中维生素A含量的差别有显著性意义,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
详细请见统计函数解释工作簿中总体均数估计和假设检验的统计函数工作表
例2.某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?
患 者X1:
0.841.051.201.201.391.53
1.671.801.872.072.11
健康人X2:
0.540.640.640.750.760.81
1.161.201.341.351.451.87
操作步骤:
(1)在J28:
J38区域内输入患者血磷值;
(2)在K28:
K40区域内输入健康人血磷值;(3)在I28格中输入"=TTEST(J28:
J38,K28:
K40,2,2)";(4)输入回车键后,I28格就显示P值结果:
"0."。
推断分析:
因为P值<0.05, 故可认为该地急性克山病患者与健康人的血磷值不同有显著性意义,患者较高。
详细请见统计函数解释工作簿中总体均数估计和假设检验的统计函数工作表。
例3.从A、B两个总体内各取一个随机样本,其含量都是10,结果如下。
比较两个均数。
操作步骤:
(1)在J54:
J63区域内输入样本1数据;
(2)在K54:
K63区域内输入样本2数据;(3)在I54格中输入"=TTEST(J54:
J63,K54:
K63,2,3)";(4)输入回车键后,I54格就显示P值结果:
"0."。
推断分析:
因为P值>0.05, 故两样本的均数差别不显著。
详细请见统计函数解释工作簿中总体均数估计和假设检验的统计函数工作表
3.1.2卡方检验
也是常用的统计方法,可用CHITEST函数直接计算,举例说明如下:
语法CHITEST(actual_range,expected_range)
Actual_range用以检验期望值的观测值区域。
Expected_range指包含行列汇总的乘积除以总和后的数据区域。
该函数公式为CHITEST=p(X>c2)。
其中:
Aij=i行j列中的实际值;Eij=i行j列中的期望值。
r=行数;c=列数。
CHITEST返回chi-squared统计的概率和自由度df, 其中df=(r-1)(c-1).
例4.在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组单纯用亚硝胺向鼻腔滴注(鼻注组),另一组在鼻注基础上加肌注维生素B12,实验结果见表,问两组发癌率有无差别?
操作步骤:
(1)在J3:
K4区域内输入实际频数数据;
(2)在J6:
K7区域内输入理论频数数据;(3)在I3格中输入"=CHITEST(J3:
K4,J6:
K7)",(4)输入回车键后,I3格就显示P值:
"0.01092"。
推断分析:
卡方检验结果显示P值=0.01092,<0.05,故可认为两组发癌率有差别,说明增加肌注维生素B12有可能提高大白鼠的鼻咽癌发生率。
详细请见统计函数解释工作簿中卡方检验的统计函数工作表。
EXCEL在医学统计学中的应用(三)
——EXCEL统计分析工具库
本课程所需所有EXCEL示例程序,请下载:
一般函数解释.xls,统计函数解释.xls,
统计分析工具解释.xls,统计程序设计解释.xls,
EXCEL实用临床统计程序.xls。
在EXCEL中提供统计分析工具库有如下:
t-检验:
成对双样本均值分析工具、双样本等方差假设分析工具,双样本异方差假设分析工具及其公式;F-检验:
双样本方差分析工具,Anova:
单因素方差分析工具,Anova:
可重复双因素分析工具,Anova:
无重复双因素分析工具,相关系数分析工具及其公式,协方差分析工具,直方图分析工具,双样本均值分析,抽样分析工具,相关和回归分析工具,描述统计分析工具,排位和百分比排位分析工具,随机数发生器分析工具,指数平滑分析工具,移动平均分析工具。
这些分析工具库使用时都需要对选项进行选择,下面就单因素方差分析、无重复双因素分析、可重复双因素分析工具、相关和回归分析工具的应用,举例说明如下:
Anova:
单因素方差分析工具
此分析工具通过简单的方差分析(anova),对两个以上样本均值进行相等性假设检验。
例5.某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果见表5.1,问三组石棉矿工的用力肺活量有无差别
分析提示:
此为成组设计的定量资料,是单因素三个样本均数的比较,可用成组方差分析。
操作步骤:
1)设置数据区域,并输入数据。
如本例J6:
J17为石棉肺患者数据区,K6:
K15为可疑患者数据区,L6:
L17为非患者数据区。
各列第一行为标志位,即石棉肺患者、可疑患者和非患者。
2)选取"工具"栏中"数据分析"。
3)选定"Anova:
单因素方差分析"。
4)选择"确定"按钮。
5)在"输入区域"框输入J6:
L17。
6)在"分组方式"框选择"逐列",即样本数据按列分组。
7)打开"标志位于第一行"复选框。
8)在显著性检验水平"α"框输入0.05
9)在"输出区域"框输入A14。
10)再选择"确定"按钮。
11)有关单因素方差分析检验结果显示如下:
详细请见统计分析工具解释工作簿中单因素方差分析工作表。
表:
方差分析:
单因素方差分析(请点击查看全表)
Anova:
无重复双因素分析"分析工具
此分析工具通过双因素anova分析(但每组数据只包含一个样本),对两个以上样本均值进行相等性假设检验。
例6.为研究雌激素对子宫发育的作用,以四个种类的未成年雌性大白鼠各3只,每只按一种剂量注射雌激素,经一定时期取出子宫,称重,结果见表。
试比较雌激素的作用在三种剂量间的差别,同时比较四个种系大白鼠之间的差别。
分析提示:
此是计量资料,按雌激素剂量分为三组,这是一个因素,按大白鼠的不同种系分组,又是一个因素,该试验属随机分组设计,故应用两因素方差分析。
操作步骤:
1)设置数据区域,在垂直和水平两个方向上,进行分组分层设计数据区域并输入数据。
如本例、B1、C1、D1为垂直分组,A2、A3、A4、A5为水平分层,将样本数据输入到相应的各组各层区域内,即甲种系大白鼠按雌激素剂量分别将106、116、145(g)输入到B2、C2、D2单元格,乙、丙和丁种系大白鼠子宫重量依此类推输入到B3、C3和D3,B4、C4和D4,B5、C5和D5。
2)选取"工具"栏中"数据分析"。
3)选定"Anova:
无重复双因素分析"。
4)选择"确定"按钮。
5)在"输入区域"框输入A1:
D5。
6)打开"标志"复选框。
7)在显著性检验水平"α"框输入0.05。
8)在"输出区域"框输入A20。
9)再选择"确定"按钮。
10)有关Anova:
无重复双因素分析检验结果显示如下:
详细请见统计分析工具解释工作簿中无重复双因素方差分析工作表
表:
方差分析:
无重复双因素分析(请点击查看全表)
检验结果:
P<0.01,在α水准拒绝H0,接受H1。
推断分析:
故认为雌激素不同剂量组间的差别有显著性意义,大白鼠不同种系间差别亦有显著性意义。
详细请见统计分析工具解释工作簿中无重复双因素方差分析工作表
Anova:
可重复双因素分析工具
此分析工具是对单因素anova分析的扩展,即每一组数据包含不止一个样本。
例6.为探讨某化学反应中温度和催化剂对收率的影响,有人选了4种温度和三种不同的催化剂甲,乙,丙,对所有可能的组合在相同条件都重复2次试验,所得数据见表7.15,试判断温度、催化剂的作用以及它们之间的交互作用是否显著。
表:
某化学反应中不同温度和催化剂下重复2次试验的数据表(请点击查看全表)
解题思路:
此题是某化学反应中温度和催化剂二因素作用下重复2次试验的计量资料,考虑温度和催化剂两个因素是否确系影响收率的重要因素,进一步考虑这两个因素有无交互作用,根据题意和数据特点可用《重复试验的两因素方差分析》。
操作步骤:
1)设置数据区域,在垂直和水平两个方向上,进行分组分层设计数据区域并输入数据。
如本例B1、C1、D1、E1为不同温度分组,A2和A3、A4和A5、A6和A7为甲,乙,丙催化剂分层,其中A2和A3为甲催化剂同一层次重复数据区域,A4和A5,A6和A7为乙,丙催化剂二个层次的重复数据区域。
将样本数据输入到相应的各组各层区域内。
如重复数据为3次,则每一层应有3个数据区域,A2,A3和A4;A5,A6和A7;A8,A9和A10各为一层。
重复次数增加,相应以此类推。
2)选取"工具"栏中"数据分析"。
3)选定"Anova:
可重复双因素分析"。
4)选择"确定"按钮。
显示"方差分析:
可重复双因素分析"对话框。
5)在"输入区域"框输入A1:
E7。
6)在"每个样本的行数"框内输入2,意味重复试验2次的数据。
。
7)在显著性检验水平"α"框输入0.05。
8)在"输出区域"框输入A20。
9)再选择"确定"按钮。
10)有关方差分析:
可重复双因素分析检验结果显示如下:
表:
方差分析:
可重复双因素分析(请点击查看全表)
检验结果:
1)温度因素的F值(98.),催化剂因素的F值(63.),温度和催化剂交互作用的F值(1.);
2)温度因素的P值1.03007E-08(P<0.01);催化剂因素的P值4.2678E-07(P<0.01);温度和催化剂交互作用的P值0.(P>0.05);
推断分析:
温度和催化剂交互作用不显著;温度因素对收率有极显著影响;催化剂因素对收率也有极显著影响。
详细请见统计分析工具解释工作簿中可重复双因素方差分析工作表
相关系数分析工具
此分析工具及其公式可用于判断两组数据集(可以使用不同的度量单位)之间的关系。
总体相关性计算的返回值为两组数据集的协方差除以它们标准偏差的乘积:
注释:
如果需要返回两个单元格区域的相关系数,可直接使用CORREL工作表函数。
例7.某地一年级12名女大学生的体重与肺活量数据如下,试求肺活量(L)Y对体重(kg)X的直线回归方程。
体重(kg)
X
42 42 46 46 46 50
50 50 52 52 58 58
肺活量(L)
Y
2.55 2.20 2.75 2.40 2.80 2.81
3.41 3.10 3.46 2.85 3.50 3.00
分析提示:
此为求肺活量(L)Y对体重(kg)X的直线回归方程,可用直线回归与相关分析。
操作步骤:
1)设置数据区域,并输入数据。
如本例J4:
J16为体重(kg)X自变量数据区,K4:
K16为肺活量(L)Y因变量数据区。
2)选取“工具”栏中“数据分析”。
3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EXCEL 医学 统计学 中的 应用