常用医学统计学方法汇总Word文档下载推荐.docx
- 文档编号:22428905
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:28
- 大小:27.79KB
常用医学统计学方法汇总Word文档下载推荐.docx
《常用医学统计学方法汇总Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《常用医学统计学方法汇总Word文档下载推荐.docx(28页珍藏版)》请在冰豆网上搜索。
两组直接采纳
t查验,这样即使得出结果也未必正确
**
(3)对于常用的设计方法:
多组资料只管最后剖析都是采纳方差剖析,
但不一样设计会有差
别。
常用的设计如完好随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
四格表资料
例数大于
40,且所有理论数大于
5,则用一般的
Pearson
40,所有理论数大于
1,且起码一个理论数小于
5,则用校订的
查验或
Fisher
’s
切实概率法查验。
例数小于
40,或有理论数小于
2,则用
’s切实概率法查验。
2×
C表或
R×
2表资料的统计剖析
列变量&行变量均为无序分类变量,则
(1)例数大于40,且理论数小于5的格子数目<
总
格子数目的25%,则用一般的Pearson查验。
(2)例数小于40,或理论数小于5的格子数
目>
总格子数目的25%,则用Fisher’s切实概率法查验。
列变量为效应指标,且为有序多分类变量,行变量为分组变量,用一般的Pearson查验只
说明组间构成比不一样,如要说明疗效,则可用行均匀分差查验或成组的Wilcoxon秩和查验。
列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采纳一般的Pearson
查验比较各组之间有无差异,假如总的来说有差异,还可进一步作两两比较,以说明能否任
意两组之间的差异都有统计学意义。
C表资料的统计剖析
总格子数目的25%,则用一般的Pearson查验。
(3)假如要作有关性剖析,可采纳Pearson有关系数。
列变量为效应指标,且为有序多分类变量,行变量为分组变量,用一般的
查验只
说明组间构成比不一样,如要说明疗效或强弱程度的不一样,则可用行均匀分差查验或成组的
秩和查验或
Ridit
剖析。
列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采纳一般的
查验比较各组之间有无差异,
假如有差异,还可进一步作两两比较,
以说明能否任
列变量&行变量均为有序多分类变量,
(1)如要做组间差异剖析,则可用行均匀分差查验
或成组的Wilcoxon秩和查验或Ridit剖析。
假如总的来说有差异,还可进一步作两两比较,
以说明能否随意两组之间的差异都有统计学意义。
(2)假如要做两变量之间的有关性,可采
用
Spearson
有关剖析。
配对分类资料的统计剖析
四格表配对资料,
(1)b+c>
40,则用McNemar配对查验。
(2)b+c<
40,则用校订的配对查验。
C×
C资料,
(1)配对照较:
用McNemar配对查验。
(2)一致性查验,用Kappa查验。
在SPSS软件有关剖析中,pearson(皮尔逊),kendall(肯德尔)和spearman(斯伯曼/斯
皮尔曼)三种有关剖析方法有什么异同
两个连续变量间呈线性有关时,使用Pearson积差有关系数,不知足积差有关剖析的合用条
件时,使用Spearman秩有关系数来描绘.
Spearman有关系数又称秩有关系数,是利用两变量的秩次大小作线性有关剖析,对原始变
量的散布不作要求,属于非参数统计方法,合用范围要广些。
对于听从Pearson有关系数的
数据亦可计算
Spearman有关系数,但统计效能要低一些。
有关系数的计算公式可
以完好套用
Spearman有关系数计算公式,但公式中的
x和
y用相应的秩次取代即可。
Kendall'
stau-b等级有关系数:
用于反应分类变量有关性的指标,合用于两个分类变量均
为有序分类的状况。
对有关的有序变量进行非参数有关查验;
取值范围在-1-1之间,此检
验适合于正方形表格;
计算积距pearson有关系数,连续性变量才可采纳;
计算Spearman秩有关系数,适合于定序
变量或不知足正态散布假定的等间隔数据;
计算Kendall秩有关系数,适合于定序变量或不
知足正态散布假定的等间隔数据。
计算有关系数:
当资料不听从双变量正态散布或整体散布未知,或原始数据用等级表示时,
宜用spearman或kendall有关
Pearson有关复选项积差有关计算连续变量或是等间距测度的变量间的有关剖析
Kendall复选项等级有关计算分类变量间的秩有关,合用于归并等级资料
Spearman复选项等级有关计算斯皮尔曼有关,合用于连续等级资料
注:
1若非等间距测度的连续变量
因为散布不明
-可用等级有关
/也可用
有关,对于完
全等级失散变量必用等级有关
2当资料不听从双变量正态散布或整体散布型未知或原始数据是用等级表示时
宜用
Spearman
或
Kendall
有关。
3若不适合用了
等级有关剖析则可能得出有关系数偏小的结论。
则若不适合使用,
可能得有关系数偏小或偏大结论而观察不到不一样变量间存在的亲密关系。
对一般状况默认数
据听从正态散布的,故用Pearson剖析方法。
在SPSS里进入Correlate-》Bivariate,在变量下边CorrelationCoefficients复选框
组里有3个选项:
stau-b
Spearman:
spearman(斯伯曼
/斯皮尔曼)有关系数
斯皮尔曼等级有关是依据等级资料研究两个变量间有关关系的方法。
它是依照两列成平等级
的各平等级数之差来进行计算的,所以又称为“等级差数法”
斯皮尔曼等级有关对数据条件的要求没有积差有关系数严格,只需两个变量的观察值是成对
的等级评定资料,或许是由连续变量观察资料转变获得的等级资料,不论两个变量的整体分
布形态、样本容量的大小怎样,都能够用斯皮尔曼等级有关来进行研究
s有关系数
肯德尔(Kendall)W
系数又称和睦系数,是表示多列等级变量有关程度的一种方法。
合用这
种方法的数据资料一般是采纳等级评定的方法采集的,
即让K个评委(被试)评定N件事物,
或1个评委(被试)先后K次评定N件事物。
等级评定法每个评论者对
N件事物排出一个等
级次序,最小的等级序数为
1,最大的为N,若并列等级时,则均分共同应当占有的等级,
如,平常所说的两个并列第一名,他们应当占有
1,2
名,所以它们的等级应是
又如一个第
一名,两个并列第二名,三个并列第三名,则它们对应的等级应当是
1,,,5,5,5,
这里是2,3
的均匀,5是4,5,6
的均匀。
肯德尔(Kendall)U
系数又称一致性系数,是表示多列等级变量有关程度的一种方法。
该方
法相同合用于让K个评委(被试)评定N件事物,或
1个评委(被试)先后
K次评定N件事
物所得的数据资料,只可是评准时采纳对偶评定的方法,
即每一次评定都要将
N个事物两两
比较,评定结果以下表所示,表格中空白位(暗影部分能够不论)填入的数据为:
若
i比j
好记1,若i比j差记0,二者相同则记。
一共将获得
K张这样的表格,将这
K张表格重叠
起来,对应地点的数据累加起来作为最后进行计算的数据,这些数据记为
γij。
正态散布的有关查验
对来自正态整体的两个样本进行均值比较常使用
T查验的方法。
T查验要求两个被比较的样
原来自正态整体。
两个样本方差相等与不等时用的计算
T值的公式不一样。
进行方差齐次性查验使用
F查验。
对应的零假定是:
两组样本方差相等。
P值小于说明在该
水平上否认原假定,方差不齐;
不然两组方差无显着性差异。
U查验时用听从正态散布的查验量去查验整体均值差异状况的方法。
在这类状况下整体方差
往常是已知的。
固然T查验法与U查验法所解决的问题大概相同,
但在小样本(样本数n)=30作为大样本)
且均方差未知的状况下就不可以用U查验法了。
均值查验时不一样的数据使用不一样的统计量
使用MEANS过程求若干组的描绘统计量,目的在于比较。
所以一定分组求均值。
这是与
Descriptives
过程不一样之处。
查验单个变量的均值能否与给定的常数之间存在差异,用One-SampleTTest单样本
验过程。
查验两个不有关的样本能否来自来拥有相同均值的整体,用Independent-SamplesTtest
独立样本t查验过程。
假如分组样本不独立,用PairedSampleTtest配对t查验。
假如分组不只两个,应使用One-WayANOVO一元方差剖析(用于查验几个独立的组,能否来
自均值相等的整体)过程进行单变量方差剖析。
T检
假如试图比较的变量显然不听从正态散布,则应当考虑使用一种非参数查验过程
Nonparametrictest.
假如用户对比较的变量是分类变量,应当使用
Crosstabs
功能。
当样本值不可以为负值时用右边单边查验
医学科研中常用医学统计学方法
统计学是一门透过同质事物的变异性、揭露内在事物规律性和本质性的科学,切实地讲,是一门对于客观数据剖析的科学,研究数据的采集、整理和剖析,包含理论和应用两个方面。
医学应用统计学,重视于本质应用,是在传承和借鉴传统医学统计学“理论·
原理·
公
式·
应用”模式基础上,创建性地以“目的·
数据库一变量种类一变量间关系”模式为指导
的统计学。
它按照简单适用的原则,力避复杂的数学原理和公式推导,以解决本质问题为导向,以成立
统计数据库、分清变量种类为基础,以剖析变量与变量间关系为中心论述统计学剖析方法,对于广大医学科研工作者,拥有内容简单、思想明确、操作可行、方法适用的特色。
所以,学好用好医学应用统计学需要掌握以下一些基本方法。
一、明确研究目的和研究设计
研究目的是研究设计的目标和方向,科学研究的基本因素及其基来源则是科研设计的基础和
指南。
完好的科研设计包含专业设计和统计设计两部分:
专业设计是指课题的本质意义和研
究价值,当选对象的诊疗标准、归入标准及清除标准等,决定研究课题的先进性和适用性;
统计设计包含选择研究种类与设计方案,确立研究整体、样本量、察看指标、随机化分组或
抽样方法,以及数据的质量控制和统计剖析方法等,影响课题的可信度和科学价值。
所以,正确的统计学剖析必定要成立在明确的研究目的和研究设计的基础之上,那些预先没
有研究目的和研究设计,过后找来一堆数据进行统计剖析都是不行取的。
在医学论文的撰、编、审、读过程中常常碰到的问题是研究的题目与课题设计、论文内容不
符,包含文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的议论偏
离了论文的主题;
还有是目的不明确、设计不合理。
如题目过小,论文不够字数,而一些无
关紧急的变量指标或结果被剖析被议论;
又如题目过大,论文的所有内容不足以说明研究的
目的,使论文的论点难以立足。
所以,合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问
题。
别的,样本含量能否知足,抽样能否随机,偏倚能否控制等,也是不行忽略的问题。
二、建好剖析用的数据库
数据库即寄存数据的“库房”,是指将不一样研究对象不一样观察指标的察看结果逐个有序记录
的二维表格形式。
二维表中除第一行属于察看指标外,其余每一行代表一个察看对象的所有
察看指标值(即数据);
每一列代表某项察看指标所有察看对象的察看值。
严格的数据库数
据能够直策应用有关软件进行统计剖析。
因为不一样软件对文字存在可辨别性问题,一般在统计剖析时要求数据库的数据值所有用阿拉
伯数字表示,必需时可在适合地点附带标注。
对于论文作者来讲,
统计剖析需要借助于统计
剖析软件计算,而统计剖析软件都要有完好、
切合要求的数据或数据库,
所以建好剖析数据
库是统计剖析的需要。
别的,建好剖析数据库还能够理清剖析思路。
在试验或检查研究中获得的数占有时多而零落,
假如不可以进行科学的整理汇总,
就会显得凌乱无章,理不清眉目,
抓不住重点,甚至无所适
从,最后可能充耳不闻、弃之不用,造成数据的极大浪费。
相反,建好数据库,能够使察看
对象的研究指标了如指掌,使研究思路清楚明确。
所以,建好数据库是正确统计剖析的前提和基础,
甚至决定了论文剖析结果的成败。
对于编、
审、读者来讲,一般因为篇幅的限制,常常得不到数据库数据,而只有作者在数据库数据基
础上经统计描绘计算后给出的诸如各指标均数
?
x、标准差s或中位数M、百分位数Px的
“二手”数据,或将研究对象的某一指标按其数值大小或特色属性分组,
盘点各组察看单位
出现的个数或频数的频数表数据等。
不论能否能够获得数据库数据,
作者在统计剖析过程中必定依照数据库数据进行计算,
得出
结果。
假如对“二手”数据或频数表数据的结果等存在迷惑,
编写、审稿专家或读者有官僚
求作者供给数据库数据以检查其完好性、
正确性和真切性,保证研究数据的质量。
倘若在投
稿须知中对数据库数据作出必需的要求,无疑对于保证刊物的发布质量有着踊跃的意义。
三、分清楚指标(或变量)的性质和种类
指标,即察看指标,是由研究目确实定的察看对象的内在属性特色或其有关的影响因素。
例
如,需要研究本体感觉训练对脑卒中偏瘫患者运动功能(本体感觉、均衡功能)的影响,那
么本体感觉、均衡功能反应了脑卒中偏瘫患者运动功能的特色,
分别称为研究的本体感觉指
标、均衡功能指标,影响本体感觉和均衡功能的有关因素,
比方年纪、性别、病种、病程等,
称为研究的年纪指标、性别指标、病种指标和病程指标。
变量即察看变量,也称变化的量,本质上就是察看指标,
一般特指用于数学、统计或软件计
算的剖析指标。
比如,脑卒中偏瘫患者运动功能的本体感觉、
均衡功能指标,在统计计算时,
分别称为本体感觉变量和均衡功能变量。
按变量能否影响其余变量或能否遇到其余变量的影响有影响变量和结果变量之分。
影响变
量,也称自变量,是指自己变化并影响结果变量变化的量;
结果变量,又称因变量,是指随
影响变量变化而变化的量,看作是影响变量变化的结果。
假如剖析痊愈训练对冠芥蒂患者有氧运动功能的影响,
那么痊愈训练可看作是影响变量,
有
氧运动功能则为结果变量;
假如剖析不一样性别之间冠芥蒂患者有氧运动功能能否存在统计学
差异,那么性别是影响变量,有氧运动功能是结果变量。
分清楚变量的性质,即什么是结果
变量、什么是影响变量,是选择统计剖析方法的第一步。
一般而言,那些相对固有的、不易改变的特色(如性别、籍贯等)或易于被人控制的办理因
素(照实验分组、疫苗接种与否等)作为影响变量或影响因素;
而那些简单变化、较难确立
的察看效应或结局(如疗效、生病与否等)作为结果变量,当作是最后察看的结果。
但影响
变量和结果变量的区分是相对的,视研究目的和详细状况而定,有时甚至不加区分。
从数据库、数据剖析的角度来看,
变量是指那些能反应数据库数据的内在数目关系,
可用于
统计计算包含软件计算的指标。
一般而言,不一样的研究目的决定了不一样的数据库,
本质上决
定了构成数据库的不一样变量。
变量的种类分为数值变量和分类变量。
数值变量,又称定量变量,是指能用定量方法测定的、拥有数值大小、高低或多少的指标,
变量值一般有胸怀衡单位,能够带小数点,如身高、体重、血压等;
分类变量,又称定性变
量,是指能用定性的方法确立的、
察看单位某项属性或特色分类的指标。
依据分类变量的分
类项数和各项数间有无等级程度差异分为二项分类变量、
多项无序分类变量、多项有序分类
变量,如表1。
表1?
分类变量的不一样类型与举例
从应用统计学选择统计剖析方法的角度考虑,变量可考虑分为数值变量、多项有序分类变量、多项无序分类变量、二项分类变量四种。
别的,不一样类型变量可按照以下次序转变:
数值变
量一多项有序分类变量一多项无序分类变量一-项分类变量,称为降级转变,但这类转变过程会不停丧失储藏的数据信息,致使统计剖析过程中假阴性结果的不停增添。
至于逆向转变即升级转变,只管理论上认可,但本质应用中不建议采纳。
好多研究表示,掌握好统计剖析的应用条件,正确选择统计剖析方法是学习并应用统计学的一个突出难点。
对于医学论文作者而言,分清楚数据库中变量的性质(影响变量与结果变量)、种类(数值变量、多项有序分类变量、多项无序分类变量、二项分类变量)以及它们之间的降级转变关
系(数值变量一多项有序分类变量一多项无序分类变量一二项分类变量)是学好用好应用统计剖析的基础,能够有效防止张冠李戴、缺少原则地选错统计剖析方法;
对于文章的编审和读者来说,这是判断作者正确选择统计学剖析方法与否的一个简单有效的门路。
四、正确采纳统计学方法
应用统计学(严格而言是指统计学的假定查验)
能够简单地看作是一门对于结果变量与影响
变量之间关系剖析的科学。
因为结果变量(因变量)、影响变量(自变量)各有
4
种种类,所以互相组合有
16种情
形,相对应的有16种首选的统计剖析方法(表
2
中第一个或用☆表示的方法),如,二
项分类变量与二项分类变量关系的剖析采纳两个率比较的
X2查验(四格表X2
查验),二
项分类变量与多项无序分类变量关系的剖析采纳多个率比较的
X2查验,多项无序分类变量
与二项分类变量关系的剖析采纳两个构成比比较的
X2
查验,多项无序分类变量与多项无序
分类变量关系的剖析采纳多个构成比比较的
x2查验.
数值变量与二项分类变量关系的剖析采纳
t-
查验,数值变量与多项无序分类变量关系的分
析采纳完好随机设计的,
F-查验,数值变量与数值变量关系的剖析采纳
直线有关
回归剖析,等等。
假如首选统计方法的条件不适合,一般经过降级转变选择“低”一级或
“低”二级、三级的统计方法或其余统计方法。
如,t一查验是数值变量与二项分类变量关系剖析时首选的统计方法,
假如该方法的条件不
适合,此时将-查验中数值变量“降级”看作多项有序分类变量对待,
故可次选Wilcoxon
秩和查验,假如再“降级”,挨次低选两构成比比较的
x2查验,甚至四格表
X2查验。
又如,假如Pearson直线有关回归剖析的条件不切合,可依据状况将此中的一个或两个数
值变量“降一级”,选择
Sp
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 医学 统计学 方法 汇总