列联表资料的SPSS分析.ppt
- 文档编号:1543914
- 上传时间:2022-10-23
- 格式:PPT
- 页数:37
- 大小:171.50KB
列联表资料的SPSS分析.ppt
《列联表资料的SPSS分析.ppt》由会员分享,可在线阅读,更多相关《列联表资料的SPSS分析.ppt(37页珍藏版)》请在冰豆网上搜索。
列联表资料的SPSS分析在实验研究与基础实验研究中,所分析的指标可以是定量的,也可以是定性的。
其定量指标,有时也转化成定性资料进行分析。
这些定性资料或由定量资料转化而来的定性资料,一般都整理成列联表形式,根据资料性质和分析目的选择恰当的分析方法进行统计分析,并将统计分析结果与专业知识相结合,做出合理的解释。
我们以实验研究列联表资料实例,运用SPSS软件包进行统计分析,对操作过程和结果解释予以详细说明,希望能给大家提供借鉴。
一、一般四格表(22列联表)资料实验研究一般四格表(22列联表)资料分析目的主要有2个,一是分析两个比率总体的差别有无统计学意义或两样本某指标的分布(或构成)总体是否相同,二是分析两个分类特征是否有关联。
例1.某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效,将200例颅内压增高患者随机分为2组,见表1。
表1试验组和对照组降低颅内压疗效的比较,数据录入:
打开SPSS;点击VariableView定义变量,变量1Name为“group”,Type为“String”;变量2Name为“effect”,Type为“String”;变量3Name为“count”;Type为“Numeric”,Decimals为“0”,其它为默认设置;点击DataView输入数据。
分析过程:
频数加权(所有列联表资料均需经过频数加权,以下例题分析中省略该过程):
DataWeightCasesWeightCasesby:
FrequencyVariable:
countOK,分析:
AnalyzeDescriptiveStatisticsCrosstabsRows:
groupColumns:
effectStatistics:
Chi-square:
ContinueOK,主要结果与解释:
根据22表资料c2检验的应用条件:
总例数(n)40且所有的理论值(T)5时,选用一般的c2检验;Pa时,改用Fisher确切概率法;n40,有1T5时,选用连续校正的检验;或改用Fisher确切概率法;n40,或T1时,用Fisher确切概率法。
该资料n大于40,所有T均大于5,可取Pearsonc2值和似然比(Likelihoodratio)c2值,二者c2值分别为12.123和12.864,P0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效优于氢氯噻嗪+地塞米松。
例2.一项关于婴儿喂养方式与腹泻关系的研究,资料如表2;试分析腹泻与喂养方式间是否有关联。
表2婴儿喂养方式与腹泻的关系,数据录入:
定义变量,变量1Name为“method”,变量2Name为“result”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据,method:
1为“人工喂养”,2为“母乳喂养”;result:
1为“有腹泻”,2为“无腹泻”。
分析过程:
AnalyzeDescriptiveStatisticsCrosstabsRows:
methodColumns:
resultStatistics:
Chi-square,ContingencycoefficientContinueOK,主要结果与解释:
这里,n40,且所有T5,取Pearsonc2检验结果,c2=9.981,P0.01,可认为婴儿腹泻与喂养方式有关联;Pearson列联系数C=0.329,根据C0.7为高度关联、C0.4为中度关联、C0.4为低度关联的判断原则,二者关联强度较弱。
二、配对四格表(22列联表)资料例3.某研究者对同一批标本进行两个指标的检测,结果见表3。
问:
两个指标的分布有无差别?
两个指标有无关联?
表3同一批标本两个指标的检测结果,数据录入:
定义变量,变量1Name为“A”,变量2Name为“B”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据,A=1、B=1:
甲指标“+”、乙指标“+”;A=1、B=2:
甲指标“+”、乙指标“-”;A=2、B=1:
甲指标“-”、乙指标“+”;A=2、B=2:
甲指标“-”、乙指标“-”。
分析过程:
AnalyzeDescriptiveStatisticsCrosstabsRows:
AColumns:
BStatistics:
Chisquare,Contingencycoefficient,McNemarContinueOK,主要结果与解释:
McNemarc2检验(SPSSMcNemar检验法不给c2值),P=0.185,说明两个指标分布的差别无统计学意义;一般c2检验,Pearsonc2=235.821,P0.01,说明两个指标存在关联,Pearson列联系数C=0.592,关联程度中等。
例4.某研究者用胃镜和活检对1321例患者进行胃癌检查,结果见表4。
问胃镜和活检的结果是否一致?
表41321例患者胃镜和活检结果,数据录入:
同例3。
分析过程:
AnalyzeDescriptiveStatisticsCrosstabsRows:
AColumns:
BStatistics:
Kappa,McNemar,ContinueOK,主要结果与解释:
McNemar检验,P0.75时,有极好的一致性。
三、RC表资料1.双向无序RC表资料例5.某医生研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表5,问三种疗法的有效率有无差别?
表5三种疗法治疗周围性面神经麻痹的疗效,数据录入与分析过程,见例1。
主要结果与解释:
该资料的原因变量(疗法)与结果变量(有效与无效)均无序,属双向无序RC表资料,选用一般c2检验分析即可。
RC表资料c2检验时,要求所有T1且T5,取Pearsonc2值或似然比c2值,c2=21.038(或21.559),P0.01,认为3种疗法有效率的差别有统计学意义。
例6.测得某地5801人的ABO血型和MN血型结果,问两种血型系统之间是否有关联?
表6某地5801人ABO血型和MN血型分布,数据录入与分析过程:
见例2。
主要结果与解释:
所有T5,c2=213.162(或248.143),P0.01,认为该地ABO血型和MN血型系统之间有关联。
列联系数C=0.188,关联性很弱。
2.单向有序RC表资料例7某医生用3种药物治疗某病患者,疗效如表7。
问3种药物的疗效有无差别?
表73种药物对某病患者的疗效,数据录入:
定义变量,变量1Name为“medicine”,变量2Name为“result”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据:
medicine:
1为“A药”,2为“B药”,3为“C药”,result:
1为“治愈”,2为“显效”,3为“好转”,4为“无效”。
分析过程:
AnalyzeNonparametrictestsKIndependentSamplesTestVariableList:
resultGroupingVariable:
medicineDefineRange:
RangeforGroupingVariable:
Minimum:
1;Maximum:
3;ContinueKruskal-WallisHOK,主要结果与解释:
该资料原因变量“药物种类”属于无序变量,而结果变量“疗效”属于有序变量;可以选用秩和检验、Ridit分析或有序变量的Logistic回归分析,本例选用秩和检验分析。
结果,c2(Hc)=61.146,P0.01,说明3种药物的疗效差别有统计学意义。
3.双向有序且属性不同RC表资料例8某研究者对不同肥胖程度的高血压患者进行治疗,观察患者血压控制情况,试作分析。
表8不同肥胖程度高血压患者的血压控制情况,数据录入:
定义变量,变量1Name为“fat”,变量2Name为“control”,变量3Name为“count”,Type均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据,fat:
1为“不肥胖”,2为“轻度肥胖”,3为“中/重度肥胖”;result:
1为“良好”,2为“尚可”,3为“不良”。
分析过程:
AnalyzeDescriptiveStatisticsCrosstabsRows:
fatColumns:
controlExact:
Exact:
Continue/MonteCarlo:
ContinueStatistics:
Chi-square,ContinueOKAnalyzeCorrelateBivariateVariables:
fat,controlCorrelationCoefficients:
Spearman,Kendall+stau-bTestofSignificance:
Tow-tailedOK,主要结果与解释:
该资料原因变量“肥胖程度”和结果变量“血压控制情况”均属有序(等级)变量,但属性不同,可通过c2检验判断高血压患者的血压控制情况和肥胖度之间有无相关性,并通过等级相关分析其相关程度。
该资料有3个格子(33.3%)的理论值均小于5,不能取Pearsonc2检验或似然比c2检验结果,而应取Fisher确切概率法检验结果,P=0.0720.05,故尚不能认为高血压患者的血压控制情况与其肥胖程度有相关关系。
Kendall和Spearman等级相关分析结果:
t=-0.074,P=0.401;rs=-0.085,P=0.381,也不支持两者之间有相关关系。
该资料若把“肥胖程度”视为无序的分组变量,则可按照“单向有序RC表资料”进行秩和检验分析。
4.双向有序且属性相同RC表资料例9两位放射科医生对一批矽肺胸片独自作出了矽肺分级诊断,请问他们的诊断结果是否一致。
表9两位医生对一批矽肺胸片的分级诊断结果,数据录入与分析过程:
见例4。
主要结果与解释:
该资料两位医生的诊断结果有序(等级)且属性相同,选用一致性检验。
结果,Kappa=0.6760.75,P0.01,认为两位医生的诊断存在一致性,一致性中等。
四、多个样本率间的两两比较对于K2表或2K表资料,总体检验有统计学意义时,只能说明各总体比率(分布)之间总的说来有差别,但不能说明任两个总体比率(分布)之间有差别。
若要对每两个总体比率(分布)之间做出有无差别的推断,需进一步分析。
1.组间全面比较Bonferroni法设总的检验水准为a,进行比较的次数为m,令各次比较的检验水准a=a/m,并规定Pa时拒绝H0,基于这样的做法,就可以把类错误的累积概率控制在a。
当多组间比较次数不多时,该法的效果较好。
但是,当组间比较次数较多(如10次以上)时,检验水准过低,导致结果过于保守,犯类错误的概率增加。
以例5为例,分析三种疗法任两种疗法之间疗效有无差别。
求总的c2值,Pa时,作两两比较。
本例Pearsonc2=21.038,P0.01;求各四格表的c2值及P值;按公式计算校正的a值,式中k为比较的组数,本例为3;各P值与校正的a值比较,判别有无统计学意义。
表10三种疗法有效率的两两比较,结果与解释:
物理疗法与药物治疗、物理疗法与外用膏药比较,Pearsonc2值分别为6.756和21.323,P值分别为0.00
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 列联表 资料 SPSS 分析