新EpiInfo软件在流行病学中的使用Word下载.docx
- 文档编号:17574048
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:14
- 大小:29.62KB
新EpiInfo软件在流行病学中的使用Word下载.docx
《新EpiInfo软件在流行病学中的使用Word下载.docx》由会员分享,可在线阅读,更多相关《新EpiInfo软件在流行病学中的使用Word下载.docx(14页珍藏版)》请在冰豆网上搜索。
如果想给变量名标上序号,则可以这样:
“Disease7____”,不要写成“7Disease___”,因为程序要求变量名要以字母开头,若以数字开头,EpiInfo将在数字前加“N”字符。
当然,数据文件建立之后,也可在CHECK模块中完成变量名的修改。
问题5如果你的原始调查表中调查项目多达数百项,则在设计变量名时要注意哪些问题?
EPI软件对字段的类型、长度规定如下:
表1EpiInfo软件的字段类型及示例
字段类型
编辑样式
举例
字符型
_____(下划线)
Cough,139666
数字型
##
139,139.666
大写字符型
<
A>
HAO,H
逻辑字段型
Y>
Y,N
日期型
mm/dd/yy>
11/28/98
mm/dd>
11/28
mm/dd/yyyy>
11/28/1996
dd/mm/yy>
28/11/96
dd/mm>
28/11
dd/mm/yyyy>
28/11/1996
修改日期型
today>
月、日
today/yy>
月、日、2位年份
today/yyyy>
月、日、4位年份
记录号字段
idnum>
139666
问题6对于类似“13966696”的数据,你认为该属上述字符型变量值,还是数字型变量值?
为什么?
文本编辑模块(EPED)是用于建立EpiInfo调查表及一般文本编辑的文字处理器,其主要功能是用于编写调查表文件,但也可编写分析程序、信函及疾病报告等。
调查表文件编好后,其扩展名必须为QES,可保存于硬盘或软盘上。
另外,也可用其他字处理软件如WORD或WPS、写字本等编写,应注意用ASCⅡ文件形式(即DOS文本文件形式)存储。
进入EPED程序可有两种方式:
EPI主菜单或直接在MS-DOS环境下键入EPED,回车运行。
进入EPED模块后,用户可以象用WORD等文字处理软件一样,按原始调查表样式建立新的EPED文件或修改已经存在的调查表文件。
建立或修改完毕后,按<
F9>
或<
F10>
键将调查表文件保存在软盘或硬盘上。
EPED文本编辑模块的窗口如图1所示
F1-帮助F2-文件F3-EpiaidF4-文本F5-打印F6-设置F7-查找F8-块F9-贮存F10-结束
1未命名窗口423911Pg1EPEDLn1Col1InsInd
图1EPDE文本编辑的窗口
在屏幕顶部,显示了主要操作的十个功能键<
F1>
~<
的命令提示,每一命令即可直接执行命令,也可在屏幕中央引出一选择菜单。
问题7请你针对下面研究生微机知识的原始调查表建立一个名为AQ·
QES的调查表文件。
研究生微机知识调查表
调查表编号________
一、基本情况
.姓名____(可不填写)
6.专业___①大内科②大外科③基础④预防⑤管理
2.性别____
7.出生日期____年____月____日
3.年龄____
8.最后学历_____①中专②大专③本科
4.入学前所在单位城市____
9.入学前月收入_____(人民币,元)
5.入学形式_____①统招②课程班
10.上月生活费_____(人民币,元)
11.Epi对你是____①必修课②选修课
二、微机知识
12.入学前是否用过微机____
13.如用过微机,微机操作系统是___
①用过②未用过
①DOS②WINDOWS③DOS+WINDOWS④其他
14.是否用统计软件处理过科研数据___
15.如用过,统计软件名称为____
①是②否
①Epi②SPSS③SAS④BMDP⑤其它
16.填表时间_______
17.核对者______
[课题三]
在进行流行病学资料分析时,有时并非都要用原始调查表的数据,可能是一些中间数据,如病例对照研究分层分析的四格表资料等。
对这种中间数据的处理可利用EpiInfo的STATCALC程序。
同样可以EPI主菜单方式或从DOS状态下直接键入STATCALC,回车后进入STATCALC程序进行分析。
EpiInfoVersion6
Statcalc
November1993
Tables(2x2,2xn)
T表(2x2,2xn)
Samplesize&
power
C样本大小与把握度
Chisquarefortrend
S趋势卡方
F1-Help
F6-OpenFile
F10-Done
图2STATCALC程序窗口屏幕
运行后屏幕出现可供选择的菜单(图2),移动光标控制键并按回车或直按增强显示的字母键例如T等,可进行选择。
按<F1>键显示有关统计方法信息的求助屏幕。
四格表资料分析选择Tables时,屏幕将显示2×
2表格。
若进行单个四格表的分析,只需键入四个数字,然后再按<
F4>
键,屏幕将会显示具有可信限范围的比值比、相对危险度、三种卡方检验值等统计结果。
数字录入时注意列是疾病结局有无,第一列为有此疾病(+),第二列为无此疾病(-);
行是暴露因素有无,(+)表示暴露,(-)表示无暴露。
如果表中数字过小,则显示Fisher精确概率计算值;
另外,也可进一步计算精确法可信限范围。
问题8分析一般2×
2表资料,通常有3种2值可供选择,请你谈谈每种2值的各自适用条件。
为了解铅中毒病人是否有尿棕色素增加现象,分别对病例组和对照组的尿液作尿棕色素定性检查,结果见表2,问铅中毒病人与对照人群的尿棕色素阳性率有无差别?
表2两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
铅中毒病人
29
7
对照组
9
28
(倪宗瓒,卫生统计学,第四版,2000)
问题9对表2资料进行分析,并对结果做出合理的解释。
分层分析如果在输入第一层次四个数字后,接下去按F2键则可继续输入另一层次四个数字。
这样当输完所有层次的数字后,按<
键,得到第一层的分析结果;
按<
键将显示总的分层分析结果。
问题10何谓资料分层分析?
为什么要进行分层分析?
对表3的资料,因考虑到年龄与口服避孕药(OC)有关,也与心肌梗死(MI)有关,可能是个混杂因素。
故按年龄分层,分为年龄<40岁和≥40岁两层;
如表4
表3某病例对照资料结果
组别
服OC
未服OC
病例
39
114
对照
24
154
(李立明,流行病学,第四版,1999)
表4表3资料按年龄分层的结果
40岁
≥40岁
21
26
18
88
17
59
95
问题11请对表4的资料进行分析,并对结果予以解释。
2×
n的列联表分析在表格中连续输入数字,即每输入一个数字后按一次回车,用户可进行2×
n的列联表卡方检验,但n的最大值为10。
某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表5,问其血型构成有无差别?
表5鼻咽癌患者与眼科病人血型构成比较
A型
B型
O型
AB型
鼻咽癌患者
55
45
57
19
眼科病人
44
23
36
(倪宗瓒,卫生统计学,第四版,2000)
问题12分析2×
n列联表时,若程序运行后显示有理论频数小于5,这种情况应如何处理?
有无补救方法?
样本大小计算当选择Samplesize进行样本大小计算时,屏幕将出现另一个选择菜单
Populationsurvey
P群体调查
Cohortorcross-sectional
C队列或横断面研究
Unmatchedcase-control
U非配比病例对照研究
用户可进行抽样调查、队列或横断面研究以及非配对病例对照研究样本大小的计算。
计算样本大小时,应按提示输入可信限水平和用户本人所期望的实际比例、相对危险度或比值比相接近的估计假定值。
例如在队列研究或横断面研究时,假定选择非暴露人群对某一问题具有阳性回答的比例是10%,可以输入20%作为能用以区别暴露人群的比例。
这意味着任何大于20%的比例都会使最终研究结果产生统计学检验显著性,例如,P<0.05。
这里应用20%的比例与应用2的相对危险度及0.5的比值比都是相同的;
即它们都能通过计算获得同样的样本估计值。
在输入有关参数值后,按<
键进行样本大小的计算。
问题13现拟进行一项病例对照研究,研究吸烟与肺癌关系。
预期吸烟者的相对危险度为2.0,人群吸烟率约为20%,设=0.05(双侧),=0.10,试估计非配对设计病例数与对照数相等时的样本含量n。
问题14现拟用队列研究观察放射暴露与白血病的关系,已知一般人群中白血病的发病率P0=0.0001,有放射线暴露的人群白血病发病率P1=0.001。
如果将定为0.05(双侧检验),β=0.1,请计算病例数与对照数相等时的样本含量。
问题15通过上述病例对照研究和队列研究样本含量的计算,你能总结一下有关影响样本含量大小的主要因素有哪些?
趋势卡方检验在流行病学研究中(如病例对照研究),常将暴露史的资料分级计算。
不同水平的暴露各级分别与参考水平(一般用无暴露史或最低暴露水平的水平)作比较;
并分别计算其比值比或标准化率比(SRR)。
分级暴露资料能分析剂量反应关系,加强病因关联的判断依据。
STATCALC程序中的趋势卡方检验经常被用于剂量反应关系,以及年龄、时间或任何其它有序变量趋势与疾病关系的分析。
而且该方法在分析时可对混杂变量的作用进行控制。
扩展的Mantel-Haenszel卡方检验值反应了线性趋势对水平线的离散。
无效假设为线性趋势等于水平线,如果P值小于0.05,则否定无效假设,表明有95%的把握认为线性趋势是存在的。
在进行趋势分析时,原始数据应按数字大小(暴露等级)顺序先进行分层,例如“0、1、2、3”等。
但也可将各组的中间值进行分层,例如“0”表示不喝牛奶;
“2”表示喝1~3杯;
“4”表示喝4~5杯牛奶等。
用于趋势卡方检验的原始数据格式如表6所示。
表6每日吸烟的支数与肺癌的关系
每日吸烟数
1~
5~
15~
(0)
(1)
(2)
(3)
21(c)
40(a1)
269(a2)
379(a3)
59(d)
67(b1)
303(b2)
280(b3)
问题16根据上述原始数据格式,输入各暴露等级的数据,按<
键计算最终结果,并判断有无线性趋势?
表6数据是男、女性在一起的数据,即研究数据中可能存在性别混杂变量,如何处理这类资料?
问题17试对表7的数据进行趋势性卡方检验
表7吸烟与肺癌关系按性别与吸烟数归纳表
层别
男性
2(c)
33(a1)
250(a2)
364(a3)
27(d)
55(b1)
293(b2)
274(b3)
女性
15
32
12
10
6
STATCALC程序结果处理有两种方式,其一,将结果送至某一个文件。
F6>
键后可将结果存到某一个文件。
记住该文件的文件名,它可以随时显示或打印出来(DOS状态下,TYPE命令);
也可用文本处理软件对其进行编辑;
其二,将结果送至打印机。
F5>
键可将当前屏幕计算结果送至打印机,但这时要确保打印机是在联机状态。
将表7的计算结果分别存入C:
\mydocuments\目录中。
注意屏幕底部“F6-OpenFile”与“F6-CloseFile”的含义。
问题18对已经保存的结果文件你知道有几种方法可以继续对其进行编辑?
[课题四]
在流行病学研究中,并非每次都是对原始数据进行统计分析,有时往往需要对一些中间结果进行分析。
EpiInfo6.0较好的考虑到了用户的上述要求。
EPITABLE程序是6.0版所增加的一个应用统计分析程序,其主要功能是对流行病学表格形式的数据进行统计分析。
其使用说明包含在程序的帮助文件里,光标停留在主菜单上的EPITABLEcalculator上,按<
键,即可获得帮助信息。
用户通过EPI6主菜单或从DOS状态下都可运行EPITABLE。
运行后屏幕出现EPITABLE主菜单,屏幕顶部依次为Describe、Compare、Study、Sample、Probability、Setup六个主菜单,每个主菜单拥有各自不同的子菜单,分别对应不同的统计分析功能。
EPITABLE窗口如图3所示。
Describe Compare Study Sample Probability Setup
EPITABLES
F1-HelpF3-MoveF4-ZoomF5-PrintF6-NextF9- F10-QuitMem:
211720
图3 EPITABLE程序窗口
现择其要者简要介绍如下
Describe功能用光标或鼠标选择Describe菜单,屏幕将出现下列主菜单
Proportion →
Simplerandomsampling
单纯随机样本
构成比
Clustersampling
整群样本
Designeffect
设计效率
Mean
均数
Median
中位数
该功能主要计算构成比、均数和中位数的95%可信区间。
“→”所指为下一级子目录。
Compare功能主要用于计数、计量资料的显著性检验。
选择Compare菜单,屏幕出现如下菜单。
Percentages
两个百分比比较的2检验
rxcdatatable
R×
C表2检验
Trend-Quantitativedata
计量资料的趋势性检验
Trend-Ordereddata(Ridit)
等级资料的趋势性检验
Goodnessoffit
拟合优度的检验
Rateragreement(Kappa)
(Rater-致性检验)
Completenessofreporting
捕获-再捕获-致性检验
Means
均数比较
Variances
方差比较
为研究肥胖与脂质代谢的关系,在某地小学中随机抽取了30名肥胖儿童(肥胖组)和30名正常儿童(对照组),用改良八木国夫法测定两组儿童血中脂质过氧化物(LPO)得表8结果。
问题19试对表8进行统计分析,并说明两样本t检验的前提条件是什么?
表8两组儿童血液中LPO含量(μmol/L)
n
肥胖组
30
9.36
0.83
7.58
0.64
问题20某医院用A、B两种配方治疗慢性阑尾炎,治疗结果如表9所示,试分析两配方治疗慢性阑尾炎的疗效有无差别。
表9两种配方治疗慢性阑尾炎疗效比较
无效
好转
显效
治愈
A配方
8
33
B配方
16
Study功能选择Study,具有如下菜单所示功能,可对相关研究的表格数据进行统计分析。
Cohort/cross-sectional →
Cumulativeincidence
累计发病率
队列或横断面研究资料的分析
Incidencedensity
发病密度
Stratified,cumulative
累计发病率的分层分析
Stratified,density
发病密度的分层分析
Case-control →
Unmatched
不配比
病例对照研究资料的分析
Matched1:
1
1:
1配对
2
2匹配
Stratified
分层分析
Vaccineefficacy →
ControlMethod
设立对照组
疫苗效果评价
Cohortstudy
队列研究
Case-controlstudy
病例对照研究
MatchedCase-controlstudy1:
Screening
筛检试验评价
有人在研究食管癌与饮酒关系的病例对照研究中,收集了表10资料,按年龄分为三层。
问题21表10可进行哪些假设检验和流行病学指标的分析?
表10三个年龄组的食管癌发病与饮酒的关系
暴露
35岁
45岁
合计
饮酒
13
40
37
43
51
96
不饮
146
243
201
46
590
(倪宗瓒,医学统计学,第二版,2000)
问题22用某种新方法进行糖尿病的筛检试验,选取70例确诊的糖尿病患者作为病例组;
选取510例非糖尿病病人作为对照组,结果如表11,试对该筛检试验的真实性进行评价。
表11糖尿病的筛检试验
筛检试验(血糖测定)
糖尿病患者
非糖尿病患者
+(≥110mg/100ml)
65
263
-(<
110mg/100ml)
5
247
Sample功能用户可以根据需要计算各种流行病学研究所需样本量,Sample主要包括以下功能菜单。
Samplesize →
Singleproportion
单个构成比样本
样本量
Twoproportions
两个构成比样本
Powercalculation →
把握度计算
Randomnumbertable
随机数字表
Randomnumberlist
随机数字列表
Probability功能用户可利用Probability计算下列各种形式样本统计量的概率
KnownChi2 value
已知2值
KnownStudent'
stvalue
已知t值
Binomial:
Proportionvs.Std.
二项分布
Poisson:
RareEventvs.Std.
泊松分布
RangeinNormaldistribution
正态分布
Fisher'
sexacttest
Fisher精确概率
Combinations/Permutations
排列组合
问题23通过本课题实习,你认为利用统计软件处理流行病学资料有何优缺点?
需要注意哪些方面?
(郝加虎)
参考文献
1.倪宗瓒主编。
卫生统计学。
北京:
人民卫生出版社。
第四版,2000
2.李立明主编。
流行病学。
第四版,1999
3.倪宗瓒主编。
医学统计学。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EpiInfo 软件 流行病学 中的 使用