实习四均值比较方差分析Word下载.docx
- 文档编号:20785299
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:18
- 大小:170.17KB
实习四均值比较方差分析Word下载.docx
《实习四均值比较方差分析Word下载.docx》由会员分享,可在线阅读,更多相关《实习四均值比较方差分析Word下载.docx(18页珍藏版)》请在冰豆网上搜索。
第一类错误(α)
H0原本不正确,但P>
0.05,不拒绝H0:
第二类错误(β)
α为事先指定的检验水平(一般取0.05),β未知;
α越小,β越大;
α越大,β越小;
增大样本量n,可以同时减小α和β。
三实习内容与步骤
4.1Means过程
4.1.1界面说明
4.1.2结果解释
4.2One-SamplesTTest过程
4.2.1界面说明
4.2.2结果解释
4.3Independent-SamplesTTest过程
4.3.1界面说明
4.3.2结果解释
4.4Paired-SamplesTTest过程
4.4.1界面说明
4.4.2分析实例
4.4.3结果解释
4.5One-WayANOVA过程
4.5.1界面说明
4.5.2分析实例
4.5.3结果解释
该菜单集中了几个用于计量资料均数间比较的过程。
具体有:
∙Means过程对准备比较的各组计算描述指标,进行预分析,也可直接比较。
∙One-SamplesTTest过程进行样本均数与已知总体均数的比较。
∙Independent-SamplesTTest过程进行两样本均数差别的比较,即通常所说的两组资料的t检验。
∙Paired-SamplesTTest过程进行配对资料的显著性检验,即配对t检验。
∙One-WayANOVA过程进行两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较。
§
和上一章所讲述的几个专门的描述过程相比,Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程。
显然要方便的多。
4.1.1界面说明
【DependentList框】
用于选入需要分析的变量。
【IndependentList框】
用于选入分组变量。
【Options钮】
弹出Options对话框,选择需要计算的描述统计量和统计分析:
oStatistics框可选的描述统计量。
它们是:
1.sum,numberofcases总和,记录数
2.mean,geometricmean,harmonicmean均数,几何均数,修正均数
3.standarddeviation,variance,standarderrorofthemean标准差,均数的标准误,方差
4.median,groupedmedian中位数,频数表资料中位数(比如30岁组有5人,40岁组有6人,则在计算groupedmedian时均按组中值35和45进行计算)。
5.minimum,maximum,range最小值,最大值,全距
6.kurtosis,standarderrorofkurtosis峰度系数,峰度系数的标准误
7.skewness,standarderrorofskewness偏度系数,偏度系数的标准误
8.percentageoftotalsum,percentageoftotalN总和的百分比,样本例数的百分比
oCellStatistics框选入的描述统计量。
oStatisticsforFirstlayer复选框组
1.Anovatableandeta对分组变量进行单因素方差分析,并计算用于度量变量相关程度的eta值。
2.Testforlinearity检验线性相关性,实际上就是上面的单因素方差分析。
4.1.2结果解释
有了上一章的基础,Means过程的输出看起来就不太困难了。
以第一章的数据为例,输出如下:
Means
上表还是缺失值报告。
常用统计描述量报表。
这里按默认情况输出均数,样本量和标准差。
由于我们选择了分组变量,因此三项指标均给出分组及合计值,可见以这种方式列出统计量可以非常直观的进行各组间的比较。
上表为单因素方差分析表。
在选择了Anovatableandeta或Testforlinearity复选框时出现。
实际上就是在检验各组间均数有无差异。
上面各项的具体含义将在单因素方差分析一节中解释。
相关性度量指标,给出Eta值以及Eta值的平方根。
One-SamplesTTest过程用于进行样本所在总体均数与已知总体均数的比较,可以自行定义已知总体均数为任意值,该对话框的界面非常简单。
4.2.1界面说明
【TestVariables框】
【TestValue框】
在此处输入已知的总体均数,默认值为0。
弹出Options对话框,用于定义相关的选项,有:
oConfidenceInterval框输入需要计算的均数差值可信区间范围,默认为95%。
如果是和总体均数为0相比,则此处计算的就是样本所在总体均数的可信区间。
oMissingValues单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludescasesanalysisbyanalysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludescaseslistwise)。
默认为前者,以充分利用数据。
4.2.2结果解释
One-SamplesTTest过程的输出也是比较简单的,由描述统计表和t检验表组成,比如要检验数据li1_1.sav中血磷值的总体均数是否等于1,则输出如下:
T-Test
所分析变量的基本情况描述,有样本量、均数、标准差和标准误。
上表为单样本t检验表,第一行注明了用于比较的已知总体均数为1,下面从左到右依次为t值(t)、自由度(df)、P值(Sig.2-tailed)、两均数的差值(MeanDifference)、差值的95%可信区间。
由上表可知:
t=2.975,P=0.007。
因此可以认为血磷值的总体均数不等于1。
Independent-SamplesTTest过程用于进行两样本均数的比较,即常用的两样本t检验。
该对话框的界面我们在第一章已经见过了,和上面的One-SamplesTTest对话框非常相似。
4.3.1界面说明
【GroupingVariable框】
注意选入变量后还要定义需比较的组别。
【DefineGroups框】
用于定义需要相互比较的两组的分组变量值。
可以这样来理解:
如果分组变量有3个取值(即有三组),而我们做t检验是比较其中的某两组,这时就可以用DefineGroups框来指定需比较的两组。
当然,如果分组变量只有2个取值时,我们仍然要再该框中进行定义,这也算是SPSS对话框存在的一个小缺陷吧。
和One-SamplesTTest对话框的Options钮完全相同,此处不再重复。
比如要检验数据li1_1.sav中克山病患者与健康人的血磷值是否相同,用Independent-SamplesTTest过程的结果输出如下:
两组需检验变量的基本情况描述。
可见该结果分为两大部分:
第一部分为Levene'
s方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F=0.032,P=0.860,可见在本例中方差是齐的;
第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t=2.524,ν=22,P=0.019。
从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。
最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。
上表的标题内容翻译如下:
Levene方差齐性检验
两均数是否相等的t检验
F值
P值
t值
自由度
P值(双侧)
均数差值
差值的标准误
差值的95%可信区间
下限
上限
血磷值
假设方差齐
.032
.860
2.524
22
.019
.4363
.1729
7.777E-02
.7948
假设方差不齐
21.353
.020
7.716E-02
.7954
如果你觉得上表太宽,用第三章学过的行列转置功能可以使它变的紧凑许多。
4.4Paired-SamplesTTest过程
该过程用于进行配对设计的差值均数与总体均数0比较的t检验,对统计学比较熟悉的朋友可以看出,他的功能实际上是和One-SamplesTTest过程相重复的(等价于已知总体均数为0的情况),但Paired-SamplesTTest过程使用的数据输入格式和前者不同,即我们所称的统计表格格式,因此仍然有存在的价值。
整个界面上只有一个PairedVariable框需要介绍,他用于选入希望进行比较的一对或几对变量--注意这里的量词是对而不是个。
选入变量需要成对成对的选入,即按住Ctrl键,选中两个成对变量,再单击
将其选入。
如果只选中一个变量,则
按钮为灰色,不可用。
例4.1某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别(卫统第三版例4.5)?
大白鼠对号
正常饲料组
维生素E缺乏
1
3550
2450
2
2000
2400
3
3000
1800
4
3950
3200
5
3800
3250
6
3750
2700
7
3450
2500
8
3050
1750
解:
为了说明问题,此处假设输入数据时就按照上表格式输入,其中正常饲料组变量名为G1,维生素E缺乏组变量名为G2。
操作如下:
1.同时选中G1、G2:
选入PairedVariables框
2.单击OK钮
以例4.1为例,其输出结果如下:
配对变量各自的统计描述,此处只有1对,故只有Pair1。
此处进行配对变量间的相关性分析。
等价于Analyze==>
Correlate==>
Bivariate。
配对t检验表,给出最终的检验结果,由上表可见P=0.004,故可认为两种饲料所得肝中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
对子间的差异
差值均数
标准差
标准误
均数的95%可信区间
第一对
G1-G2
812.5000
546.2535
193.1298
355.8207
1269.1793
4.207
.004
4.5One-WayANOVA过程
One-WayANOVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较,在本章的内容中,他是最为复杂的一个,但是有了前面的基础,拿下他应该不成问题。
对统计分析的数据格式不太熟悉的朋友,请一定先去看看统计软件第一课:
论统计软件中的数据录入格式,会大有帮助的。
选入需要分析的变量,可选入多个结果变量(应变量)。
【Factor框】
选入需要比较的分组因素,只能选入一个。
【Contrast钮】
弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。
oPolynomial复选框定义是否在方差分析中进行趋势检验。
oDegree下拉列表和Polynomial复选框配合使用,可选则从线性趋势一直到最高五次方曲线来进行检验。
oCoefficients框定义精确两两比较的选项。
这里按照分组变量升序给每组一个系数值,注意最终所有系数值相加应为0。
如果不为0仍可检验,只不过结果是错的。
比如说在下面的例4.2中要对第一、三组进行单独比较,则在这里给三组分配系数为1、0、-1,就会在结果中给出相应的检验内容。
【PostHoc钮】
弹出PostHocMultipleComparisons对话框,用于选择进行各组间两两比较的方法,有:
oEquarVariancesAssumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。
oEquarVariancesNotAssumed复选框组一组当各组方差不齐时可用的两两比较方法,共有4种,其中以Dunnetts'
sC法较常用。
oSignificanceLevel框定义两两比较时的显著性水平,默认为0.05。
此处只是介绍可用的方法,并不是要推荐说那种最好,使用时请认真参考有关统计书籍。
oStatistics复选框组选择一些附加的统计分析项目,有统计描述(Descriptive)和方差齐性检验(Homogeneity-of-variance)。
oMeansplot复选框用各组均数做图,以直观的了解它们的差异。
例4.2某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别(卫统第三版例5.1)?
石棉肺患者
可疑患者
非患者
1.8
2.3
2.9
1.4
2.1
3.2
1.5
2.7
2.8
1.9
2.6
1.7
2.5
3.0
3.4
2.4
3.3
2.0
3.5
设数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为X。
此处先进行单因素方差分析,然后进行两两比较,这里选择S-N-K法进行两两比较。
oDependentList框:
选入X
oFactor框:
选入group
oPostHoc钮:
选中S-N-K复选框:
单击Continue钮
o单击OK钮
上题的输出结果如下:
Oneway
上面实际上是一个典型的方差分析表。
给出了单因素方差分析的结果,可见F=84.544,P<
0.001。
因此可认为三组矿工用力肺活量不同。
离均差平方和SS
均方MS
组间变异
9.266
4.633
84.544
.000
组内变异
1.534
28
5.480E-02
总变异
10.800
30
PostHocTests
HomogeneousSubsets
上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。
从上表可见,石棉肺患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均有差异;
由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1.000(自己和自己比较,当然绝对不会有差异了)。
从上面的解释大家可以得知:
SPSS进行两两比较时,如果有差异,则只会告诉你P值小于预定的界值(默认为0.05),而不会给出具体的概率P有多大。
四实习题目
实习一
为了判断某种新型快速水分测定仪的可靠性,用该仪器测定了某湿基含水量为7.5%的标准样品,5次测定结果(%)为7.6,7.8,8.5,8.3,8.7。
对于给定的显著性水平α=0.05,试检验:
(1)该仪器的测量结果是否存在显著的系统误差?
(2)该仪器的测量结果较标准值是否明显偏大?
实习二
用烘箱发(方法一)和一种快速水分测定仪
(2)测定某样品的含水量,测定结果(%)如下:
方法一:
12.2,14.7,18.3,14.6,18.6
方法二:
17.3,17.9,16.3,17.4,17.6,16.9,17.3
对于给定的显著性水平α=0.05,试检验两种方法之间是否存在系统误差?
实习三
用两种方法测定某水剂型铝粉膏(加气混凝土用)的发气率,测定4分钟发气率(%)的数据如下:
44,45,50,55,48,49,53,42,
48,51,53,57,56,41,47,50
试问两种方法之间是否存在系统误差?
(α=0.05)
实习四
对于大气某污染物浓度进行了三批样品的采集,数据见spss4大气某污染物浓度,已知该污染物的居民区国家标准是0.14mg/m3,请问这三批样品某污染物浓度是否等于国家标准?
是否超标?
实习五
某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下(另见spss5),问该地急性克山病患者与健康人的血磷值是否不同?
患者:
0.841.051.201.201.391.531.671.801.872.072.11
健康人:
0.540.640.640.750.760.811.161.201.341.351.481.561.87
实习六
某单位研究饮食中缺乏维生素E与肝中维生素A含量的关系,将同种属的大白按性别相同,年龄、体重相近者配成对子,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,问不同饲料的大白鼠肝中维生素A含量有无差别(数据另见spss6)?
(α=0.05)
实习七
采集了20个高砷地区的地下水样品随机分成两组,分别采用两种措施去除,测得试验前后的数据(10-2mk/L)如下表2(另见excel表1)。
请问甲乙两种措施是否均有效?
甲乙两种措施效果是否相同?
(17分)
表1两种措施污染物去除效果
甲措施
样品号
9
10
处理前
13
11
处理后
乙措施
实习八
实验室质量控制工作中,令4个操作人员对同一环境水样的镉元素含量进行10次重复测定,测定结果见表3(另见excel表2),操作人员使用同一套测量仪器和测量方法,试用0.05的置信水平通过方差分析判断操作人员是否对测定结果有显著影响?
表2镉元素含量测定结果
甲
22.5
21.7
23.1
22.8
21.5
21.4
22.9
23.5
21.2
乙
21.8
20.9
22.7
20.2
20.7
21.1
20.6
丙
21.9
23.2
23.8
24
23.4
丁
22.1
21.6
22.4
23
五附正态分布的检验
一、图示法
1、P-P图
以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实习 均值 比较 方差分析