SPSS学习系列22方差分析报告.docx
- 文档编号:23333422
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:16
- 大小:25.21KB
SPSS学习系列22方差分析报告.docx
《SPSS学习系列22方差分析报告.docx》由会员分享,可在线阅读,更多相关《SPSS学习系列22方差分析报告.docx(16页珍藏版)》请在冰豆网上搜索。
SPSS学习系列22方差分析报告
22.方差分析
一、方差分析原理
1.方差分析概述
方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进展划分的.
方差分析是对总变异进展分析.看总变异是由哪些局部组成的,这些局部间的关系如何.
方差分析,是用来检验两个或两个以上均值间差异显著性〔影响观察结果的因素:
原因变量〔列变量〕的个数大于2,或分组变量〔行变量〕的个数大于1〕.一元时常用F检验〔也称一元方差分析〕,多元时用多元方差分析〔最常用Wilks’∧检验〕.
方差分析可用于:
〔1〕完全随机设计〔单因素〕、随机区组设计〔双因素〕、析因设计、拉丁方设计和正交设计等资料;
〔2〕可对两因素间交互作用差异进展显著性检验;
〔3〕进展方差齐性检验.
要比拟几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个一样的方差,仅仅均值可以不一样.还需假定每一个观察值都由假如干局部累加而成,也即总的效果可分成假如干局部,而每一局部都有一个特定的含义,称之谓效应的可加性.所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方〔MeanSquare〕.
2.根本思想
根本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进展比拟,评价由某种因素所引起的变异是否具有统计学意义.
根据效应的可加性,将总的离均差平方和分解成假如干局部,每一局部都与某一种效应相对应,总自由度也被分成相应的各个局部,各局部的离均差平方除以各自的自由度得出各局部的均方,然后列出方差分析表算出F检验值,作出统计推断.
方差分析的关键是总离均差平方和的分解,分解越细致,各局部的含义就越明确,对各种效应的作用就越了解,统计推断就越准确.
效应项与试验设计或统计分析的目的有关,一般有:
主效应〔包括各种因素〕,交互影响项〔因素间的多级交互影响〕,协变量〔来自回归的变异项〕,等等.
当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方.
根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为α情况下,由F
为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进展试验,得出原始观察值,按原来设计方案算出方差分析表中的各项.
在试验设计阶段通常需要考虑如下4个方面:
〔1〕研究的主要变量〔因变量〕
即试验所要观察的主要指标,一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进展分析;
〔2〕因素和水平
试验的因素〔factor〕可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平〔level〕.在每一个因素下面可以分成假如干水平.
例如,某工厂的原料来自4个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?
所要比拟的地区就是因素,4个地区便是地区这一因素的4个水平.当某个主要因素的各个水平间的主要因变量的均值呈现统计显著性时,必要时可作两两水平间的比拟,称为均值间的两两比拟.
〔3〕因素间的交互影响
多因素的试验设计,有时需要分析因素间的交互影响〔interaction〕,2个因素间的交互影响称为一级交互影响〔A×B〕;3个因素间的交互影响称为二级交互影响〔A×B×C〕.
当交互影响项呈现统计不显著时,明确各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断.
二、单因素方差分析
1个因变量,1个影响因素:
总差异Yij=平均差异μ+因素差异αi+随机差异εij
例1比拟4种品牌的胶合板的耐磨性,各抽取5个样品,一样转速磨损一样时间测得磨损深度〔mm〕,如下:
比拟4个品牌胶合板的耐磨性有无差异?
总差异Yij=平均磨损μ+品牌差异αi+随机差异εij
1.[分析]——[一般线性模型]——[单变量],打开"单变量〞窗口,将变量"wear磨损深度〞选入[因变量]框,"brand品牌〞选入[固定因子]框;
2.点[两两比拟],打开"观测均值的两两比拟〞子窗口,勾选[假定方差齐性]下的"LSD〞、"S-N-K〞,点[继续];
3.点[选项],打开"选项〞子窗口,勾选"描述统计〞、"方差齐性检验〞,点[继续];
点[确定],得到
描述性统计量
因变量:
磨损深度
地板品牌
均值
标准偏差
N
A
.11269
5
B
.11760
5
C
.11216
5
D
.03271
5
总计
.21771
20
给出每个品牌的均值、标准差、样本数.
误差方差等同性的Levene检验a
因变量:
磨损深度
F
df1
df2
Sig.
3
16
.311
检验零假设,即在所有组中因变量的误差方差均相等.
a.设计:
截距+brand
方差齐性检验结果,P值=0.311>0.05,故承受原假设H0:
方差齐.
主体间效应的检验
因变量:
磨损深度
源
III型平方和
df
均方
F
Sig.
校正模型
.740a
3
.247
.000
截距
1
.000
brand
.740
3
.247
.000
误差
.161
16
.010
总计
20
校正的总计
.901
19
a.R方=.822〔调整R方=.788〕
方差分析结果,"校正模型〞是整个方差分析模型的检验,原假设H0:
所有系数〔μ,αi,εij〕都=0;P值<0.001<0.05,故拒绝原假设.
"截距〞检验均值μ,原假设H0:
μ=0〔即不考虑品牌时,平均磨损为0〕;P值<0.001<0.05,故拒绝原假设.
"brand〞对因素品牌的检验,原假设H0:
按因素水平值的各分组的因变量无差异,即品牌因素对磨损深度无影响;P值<0.001<0.05,故拒绝原假设,即不同品牌的耐磨性有差异.
参数估计
因变量:
磨损深度
参数
B
标准误差
t
Sig.
95%置信区间
下限
上限
截距
.045
.000
[brand=A]
.063
.021
[brand=B]
.063
.017
[brand=C]
.063
.000
[brand=D]
0a
.
.
.
.
.
a.此参数为冗余参数,将被设为零.
B列为各品牌均值与均值μ〔截距〕的差.
截距
参数
比照
L1
截距
1
[brand=A]
.250
[brand=B]
.250
[brand=C]
.250
[brand=D]
.250
此矩阵的缺省显示是相应的L矩阵的转置.
基于III型平方和.
估计常数项时使用的L矩阵,均为0.25即总样本的均值是按四种品牌等量混合的情况计算的.
brand
参数
比照
L2
L3
L4
截距
0
0
0
[brand=A]
1
0
0
[brand=B]
0
1
0
[brand=C]
0
0
1
[brand=D]
-1
-1
-1
此矩阵的缺省显示是相应的L矩阵的转置.
基于III型平方和.
比照系数矩阵,默认将最后一组"品牌D〞作为对照组,故上上表的截距〔均值μ
L2=[0100-1]T,对于L2列,令[μα1α2α3α4]×L2=0,化简得α1=α4即前表对α1作的假设检验.
多个比拟
因变量:
磨损深度
地板品牌
均值差值
标准误差
Sig.
95%置信区间
下限
上限
LSD
A
B
.0060
.06339
.926
.1404
C
.3640*
.06339
.000
.2296
.4984
D
*
.06339
.021
B
A
.06339
.926
.1284
C
.3580*
.06339
.000
.2236
.4924
D
*
.06339
.017
C
A
*
.06339
.000
B
*
.06339
.000
D
*
.06339
.000
D
A
.1620*
.06339
.021
.0276
.2964
B
.1680*
.06339
.017
.0336
.3024
C
.5260*
.06339
.000
.3916
.6604
基于观测到的均值.
误差项为均值方<错误>=.010.
*.均值差值在.05级别上较显著.
LSD法给出的两两比拟,将各组均和一个参照水平做比拟,未指定默认,如此每一个水平都作为参照比拟一次.每两个之间的差异有无统计学意义,看对应的P值判断〔原假设H0:
无差异〕.
磨损深度
地板品牌
N
子集
1
2
3
Student-Newman-Keulsa,b
C
5
B
5
A
5
D
5
Sig.
.926
已显示同类子集中的组均值.
基于观测到的均值.
误差项为均值方<错误>=.010.
a.使用调和均值样本大小.
b.Alpha=.05.
LSD法给出的两两比拟结果,将各组的值从小到大排序,注意4个品牌共被分成了3个亚组〔无差异的作为一组〕,品牌B和A放在一个亚组,二者的P值=0.926〔无差异〕.
三、两因素方差分析
1个因变量,2个影响因素:
总差异Yijk=平均差异μ+因素1差异αi+因素2差异βi
+因素1,2交互作用差异γij+随机差异εijk
例2分析超市某商品的销售量在不同的超市规模〔小型、中型、大型〕、货架位置〔A、B、C、D〕是否有差异?
局部数据文件如下:
变量size超市规模:
1=小型,2=中型,3=大型.
总差异Yijk=平均差异μ+超市规模差异αi+货架位置差异βi
+超市规模货架位置交互作用差异γij+随机差异εijk
1.[分析]——[一般线性模型]——[单变量],打开"单变量〞窗口,将变量"sale销售量〞选入[因变量]框,将变量"size超市规模〞、"position货架位置〞选入[固定因子]框;
2.点[选项],打开"选项〞子窗口,勾选[输出]下的"描述统计〞、"方差齐性检验〞,点[继续];
点[确定],得到
主体间因子
值标签
N
超市规模
1
小型
8
2
中型
8
3
大型
8
摆放位置
A
6
B
6
C
6
D
6
描述性统计量
因变量:
周销售量
超市规模
摆放位置
均值
标准偏差
N
小型
A
2
B
2
C
2
D
2
总计
8
中型
A
2
B
2
C
2
D
2
总计
8
大型
A
2
B
2
C
2
D
2
总计
8
总计
A
6
B
6
C
6
D
6
总计
24
误差方差等同性的Levene检验a
因变量:
周销售量
F
df1
df2
Sig.
.
11
12
.
检验零假设,即在所有组中因变量的误差方差均相等.
a.设计:
截距+size+position+size*position
超市规模3个水平,货架位置4个水平,共将样本分成3×4=12组,由于有单组样本数<3个,故无法做方差齐性检验〔值缺失〕.
主体间效应的检验
因变量:
周销售量
源
III型平方和
df
均方
F
Sig.
校正模型
a
11
.000
截距
1
.000
size
2
.000
position
3
.000
size*position
6
.689
.663
误差
12
总计
24
校正的总计
23
a.R方=.921〔调整R方=.849〕
整个方差分析模型的检验结果,交互作用项size*position的P值=0.689>0.05,故承受原假设H0:
该交互作用无差异.下面去掉交互因子继续做两因素方差分析.
3.在第1步的窗口点[模型],打开"模型〞子窗口,选择[指定模型]下的"设定〞,将[构建项]下的[类型]设为"主效应〞,将变量"size〞、"position〞选入[模型]框,点[继续];
4.原窗口点[两两比拟],打开"观测均值的两两比拟〞子窗口,将因子"size〞、"position〞选入[两两比拟检验]框,勾选[假定方差齐性]下的"S-N-K〞,点[继续];
注:
假如已明确对照组,考察其它组与它的比拟,宜采用LSD法;假如要进展多个均值间的两两比拟,且各组人数相等,宜采用Tukey法或S-N-K法〔假如比拟的组数特别多,不宜用S-N-K法,宜用Scheffe法〕;对于不平衡设计或含有协变量的模型,应采用LSD法、Bonferroni法、Sidak法.
点[确定]得到:
误差方差等同性的Levene检验a
因变量:
周销售量
F
df1
df2
Sig.
.171
11
12
.997
检验零假设,即在所有组中因变量的误差方差均相等.
a.设计:
截距+size+position
方差齐性检验,P值=0.997>0.5,故承受原假设H0,即方差齐.
主体间效应的检验
因变量:
周销售量
源
III型平方和
df
均方
F
Sig.
校正模型
a
5
.000
截距
1
.000
size
2
.000
position
3
.000
误差
18
总计
24
校正的总计
23
a.R方=.894〔调整R方=.865〕
整个方差模型的检验结果〔解释参考例1〕.
周销售量
Student-Newman-Keuls
超市规模
N
子集
1
2
3
小型
8
中型
8
大型
8
Sig.
已显示同类子集中的组均值.
基于观测到的均值.
误差项为均值方<错误.
a.使用调和均值样本大小.
b.Alpha=.05.
周销售量
Student-Newman-Keuls
摆放位置
N
子集
1
2
3
D
6
A
6
B
6
C
6
Sig.
.948
已显示同类子集中的组均值.
基于观测到的均值.
误差项为均值方<错误.
a.使用调和均值样本大小.
b.Alpha=.05.
用S-N-K法进展两两比拟,可见超市规模越大,销售量越大;货架位置对销售量也有影响,位置AD在同一亚组,销售量最小,位置B销售量居中,位置C销售量最大,三个亚组之间有统计学差异;另外,由于交互作用被合理地剔除,故上述差异不受另一因素〔超市规模〕取值的影响.
5.假如要绘制轮廓图.原窗口点[绘制],打开"轮廓图〞子窗口,将因子"size〞、"position〞分别选入[水平轴]点[添加],点[继续];
注:
假如要得到两变量的联合轮廓图,将另一变量选入[单图]框即可.
点[确定],得到单变量的轮廓图:
边际均值,是基于现有模型,控制了其它因素作用后,根据样本情况计算某因素各水平的均值估计值〔假如模型中有协变量,会按协变量均值加以修正〕.
轮廓图,即以边际均值为纵轴,以考察因素为横轴的折线图.用以比拟该因素取不同水平值时,样本均值的变化情况.
另外,轮廓图也可用来检验两因素是否存在交互作用:
对于单因素模型或包含全部交互项的全模型,边际均值就是各分组的样本均值,其轮廓图就呈现一组平行线;假如剔除某交互作用后各曲线明显不平行,如此说明两因素存在交互作用.
另外,[选项]子窗口也提供了"缺乏拟合优度检验〞,勾选它,运行得到
失拟检验
因变量:
周销售量
源
平方和
df
均方
F
Sig.
失拟
6
.689
.663
纯误差
12
用来检验当前模型〔剔除交互项〕与全模型〔包括全部交互项〕的比拟,原假设H0:
两模型无差异;本例的P值=0.663>0.05,承受原假设,即两因素超市规模、货架位置的交互作用可以忽略.
6.假如要绘制残差图.原窗口点[选项],勾选[输出]下的"残差图〞,运行得到
残差图给出了因变量的实测值、预测值、标准化残差的散点图,假如预测值与实测值有明显的相关性〔接近直线趋势〕,标准化残差在0附近随机分布,如此明确拟合结果较好.
7.除两两比拟外,也可以自定义比拟.下面只说明原理,具体操作需要借助代码实现.
例如,前文比拟货架位置A与D时,L矩阵=[100-1]T,有
[ABCD]×[100-1]T=0等价于A=D
前面分析发现位置A与D的销售量根本无差异,现在想将A与D合并再与B比拟有无差异,如此可以指定L矩阵=[1-201]T,如此
[ABCD]×[1-201]T=0等价于/2=B
注意:
四、含随机因素的方差分析
随机因素设为固定因素作为分析,可能得到错误的结果.
例3研究4种广告方式〔店内展示、发放传单、推销员展示、广播广告〕有无差异.该地区有几百个销售网点,经费有限只随机选取了18个网点,记录了固定时间段内使用某种广告方式的销售额〔为减小误差,各网点重复测量两次〕:
变量area表示网点;adstype表示广告类型:
1=店内展示,2=发放传单,3=推销员展示,4=广播广告;sales表示销售额.
由于网点是随机选取的,假如重复研究重新抽取的网点可能完全不同,故变量area属于随机因素.
注:
假如对区域进展细分归类,每类区域选代表网点,如此不是随机因素.
[分析]——[一般线性模型]——[单变量],打开"单变量〞窗口,将变量"sales销售额〞选入[因变量]框,将"adstype广告类型〞选入[固定因子]框,将"area网点〞选入[随机因子]框;
点[确定]得到
主体间效应的检验
因变量:
销售额
源
III型平方和
df
均方
F
Sig.
截距
假设
1
.000
误差
17
a
adstype
假设
3
.000
误差
51
b
area
假设
17
.000
误差
51
b
adstype*area
假设
51
.286
误差
72
c
a.MS
b.MS
c.MS<错误>
整个方差分析模型的检验结果,注意当模型含有随机因素时,不再进展总模型的检验,而是分别对每个因素做单独检验,并给出单独的误差项.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 学习 系列 22 方差分析 报告
![提示](https://static.bdocx.com/images/bang_tan.gif)