SPSS数据分析混合线性模型.docx
- 文档编号:3601069
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:15
- 大小:490.41KB
SPSS数据分析混合线性模型.docx
《SPSS数据分析混合线性模型.docx》由会员分享,可在线阅读,更多相关《SPSS数据分析混合线性模型.docx(15页珍藏版)》请在冰豆网上搜索。
SPSS数据分析混合线性模型
之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。
虽
然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的角度讲,由于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集性的数据。
数据的聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同城市间的指标离散度上。
从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同,但是对于抽到的是什么样的数据,却无法控制了。
对于这种具有层次结构的数据,如果分析目的仅限于这几种层次,比如就分析这几个城市,那么可以把它当做一种固定因子,只分析固定效应而不用考虑这种聚集性,但是如果想把结果推广到所有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机效应。
混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对随机误差的分解也越来越精细,结果也越来越准确。
【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校有关,好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推广到所有学校,因此学校这个变量应该被定为随机变量,我们首先按照一般线性模型来分析,不考虑层次因素分析一一般线性模型一单变量
因变量为1気岁成绩*协变量为口岁成集'I®机因子为学檢,不做其也设定,不考虑二者交互作用F直犊分析其主敷应
在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有什么不同
分析一混合模型一线性
首先弾出的对话框用耒设置作为层欢因素的娈量「特其设墨在主赢对话框中,本例为学校A如黑不设董的话J后面的分折则认为没有层次因素❺
谡罟好层次因素之后,进入的親合线性模型的主对话框'和-殿尊性模型类似,住此可叹对模型做更详细的设臥本例中,我们首先来分析学技这个因素是否是层次因素,也就是检齡不同学棣的平均成绩罡否有差异,因此不纳入任何其她因子』只选入因变量在睛机对话框中,我们选走包含截距,并将学校选入组合中『如果学梭不是层次聖集因素的话'那么所有学校的平均成绩应该相同》体观在图中就罡所有回归线的初姑点即载距相等“如果不相等『说明其中有变异.那么变异的耒源就是最开始设走的学校因素。
统计量按钮,可咲选擇要输出的一些绕计量和检验值,在此找们选择举数估计和协方差参数检验P其中协方差聲数检蝮就是用来检验层次聚集因素的
I
匚幅濒计働]
啊tfog云g
Ir**8®**1
j荃靖店计p
丿怙育運费鉄检題®
□WISiimXtttEi
壘對活计怕団方整直i
馬世笳是的间方菱迴.
•洒协万雀世)
□时比矗禮距降Q
■信理同世):
I笳]*
[g»]卫兀
覆少为驳甲的格式显示信愿采髀・
定效应
:
區
[母S
F
1
62.529
.060
.807
■■因变呈;戚謝
裁下来辅出同走效应模型・竄假设为所有字校的咸祭均值为U"由于爱有纳入任何因子,因此P=0.807>0.05>是不能柜絕幕假设的
协方卿當数
wjuzirwiAiF
!
■■
亦•.
tdTKM
uni厂塀®
B47T51
aia^n
41687
OOQ
011573
冊T创
;障=scfMjaq*工
inm
93非押
QOQ
11WVF
HfHi
陆爲输出的检方差靈魏琴架・鱸是对陆W.部分的分析裁果,也殖是对学校是杏是层次鑒集囲麦的最缪定论。
此处,原假设为I®机麹应的方差为m也強是不存在賈异。
等冃于不冋学枝见的威待均值設有差身,可见计值萍不為0・检监給果也是柜寰捺假设,因吐可以判断,学校确寞星一个匡真衆集因憲*
上方的匪望走示越个腕测值"也或是学生之冏是香存在个体差异"也是拒绝康鶴诰,即认均学生之目是存在个律差异的
经过以上分析,我们知道学校确实是一个层次聚集因素,不能按照一般线性模型进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。
首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何因子相比有何变化
将口岁入学成填纳入,由于是连续娈量“因此进入协变童,并且在固走按钮中'将其迭入模型
首先模型槪况中固定效应多了新如入的变量,其次各个信息条#的值,也比之前降低,说明有韶分娈异襪隸加入的变量所解释*
固定效应
曲案隨底『◎广
l*ii;
1住厲r
dr
t
WXh
9£%■
(It-ifpJ
!
辺
1■
W1!
O&331S
040354
«D.732
057
m輔at
QflMIO
ttandlft
5t33D5
012160
4050.074
45190
.000
567746
4:
Ft曲2F
协方號毬口怙计"
||g熬g補
WsldZ
95%RJ
SBfiflg;
J1W?
44672
OOD
.541571
.591241
-■.ir]=whcofl
093卿
018SB6
4343
QOQ
QG3119
U9503
H;时我们再来看龍机部分的分折结果,甘计值比恿来小整參,说明之前祯归在随机效应巾的銮异被新加入固定效应巾的克望所《8釋棹了,也iftfflilfittA的变堕便得原敷狐的层次累集性璋诙
通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后,对于层次聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完
善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个
变量加入随机因素中。
点随机按钮.将娈量纳入模型
<2肉束囱对数似兰朋
Atalke(AIC)
HunrichftITsai.i'i1
(A!
CC)
Bczdogan的貞fl(CAIC)
Schwarz-I'--.!
BayesianW:
CBiC)
9335.677
9341677
B341683
9363.602
93C0.602
mt-八訓小:
你川厂二山讯亡XI
3固亜宣:
鶴岁威酚・
信息条井值进一步降低』说明将该娈量引入至随机效应中罡有敦果餌
■2哽旬索的时数®l聲值Akalk金的信息睾件別®HundchftlTsaii'i1(AJCC)
Bozdogan的負fl(CAIC)Scliwarz■!
'■■]Eiay^sian论戸CBIO
9335.677
9341677
8341683
9363.602
93C0.602
伯息条ft戶
;fi.t:
XI
a固变2:
16罗威绩-
信息条件倩进一步KfS.说明齬该蜚量引入至随机效应中罡有敦果的
df
a
F
-
1
60136'
3S.9M
D*tmw
Sil
OM
a.Jf|
■・16亨1$上
|e
IM半
dr
1
uv严—
用
i&n:
mndin
-
S-57021
.M0M4
M4M
..沁
27nj
Mi
.oao
sum
4FM79
固走效应结果浸有太犬变化,检验翳果也相同
协方差挣数
siz
魅甘
WaldZ
9$%*fJ-.-:
nJ
I勿
Its
553636
Q1219?
4431*
Q00
57S€5&
tv|!
■
■、■'
0»1»4»
490C
j000
oeiS35
137174
如"lit【
1!
■5ICtkOOl]\
.tM4749
(^64640
3.U7
上tn
8.I';|祐冷比厲
随机效应检馥中,可臥看岀斯加入的娈童屋有境计学意又的*说明11岁入学旗绩度対诃岁是存在彩响的』并且残差和粲集性因素的方差也进一步降低,说明该变量的引入罡有效果的&
在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性别、学校类型、各学校学生在11岁入学时的平均成这三个变量。
由于性别和学校类型属于分类变量,囲此迭入因子选框、而学校平均成绩是连续变量'蛊要选入协变量选框
l.=Fr
.-*2广
■a-§
ritsi
阖〒二嘗柜
1
1
gMdar
3
1
3
2
配汕<fkt
1
1
avsin
1
1
約”HQr^*^andlrth
2
r鳖曲吕
2
school
氓曼
1
BiV
W
卑
停3!
哪肝'
・.也履■:
情:
r■产
b,干较丰115'RAMDOM?
■•酩險的常建風莊已*3.卩旷斷节:
工叫嵐广业平“千先耐钿塔屡TflXTFTF|T用號宅111-f*-咐崔闵出?
由于我们认为学校是层次聚集性因素,因此新加入的变量都选入固定效应中,輸岀的模型摘裳结果如左图
-2StVS的对数认然ffiAkalke的信盘兼怦(AIG)Huwich^oTsai力记件(AICC)
Bozdog^n的嶷件CCAIQSchwas0iBayesiin兼件(SIC)
9305.974
9311.974
9311.990
9323636
933Q896
if聶轻件’
独■戟心占号術■的溶式畀〒信目棊件
a因雲量:
1蜩成始
11息粲件值进滾隔惟.说明引入变量起到作用,实际上我们可以逐步引入喪量进行比按
行干曲
分母(if
F
址昔性
玄距—
1
56956
.499
gender
1
4032716
24.5S7
QQQ
schgend
2
61.942
2573
.094
standirt
1
57.164
726.9S6
.aoo
avelrt
1
61156
11579
.G01
固定效应旳脸瞬烫型|卜
a.E.畳.
嚴后输岀的效应类型橙验中.新引入的变量中,学枝类型是没用窥计学直义的
固足承应-启汁目
4&
由计
df
t
95%匿直
F隕
IFF
KJB
A45373
.063753
54.369
2.260
.027
.017575
.273171
[gsndei^O]
-.157903
.033855
4032.716
-1.959
□DC
■234278
-.101529
hendei^l]
Qb
0
e
1
[schg«nd=1]
-.144522
□01750
60413
-1Jfi9
092
-.309023
□18990
[schg@nd=7l
.042609
116224
68.042
.3^9
713
-.189030
274BO0
[«chgond=3]
0b
C
-
-
-
standlrt
.548445
□20341
57.164
26.963
ODO
.507716
.589175
avslrt
.363210
.1O674C
61156
3.403
0D1
.149770
576650
a.目冬量比◎'壺沾
b・因為此番数冗命'所门特苴询严霁
a
阳Id2
:
va
卜命
int
550111
OT:
«31Q oca 121382 57MW1 r^['4=Kh& 刚TM OTHO* <5? 5 oca 045024 1044(1 stjnaini'u=jchoci)*建 Mme ^2ii (JCi 0M270 •2«y 橈方整•巾牯11* a押: r*7 可以看到,虽然没有直接隹眩机效应中引入变量.但是固定效应中引入的变最使得聚築圍素所芳差进一步说明引入的变量是有作用的。 根据以上思路,我们可以继续将变量引入随机效应、或者分析变量间的交互作用等,对数据进行更进一步的分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 混合 线性 模型