结构方程模型.docx
- 文档编号:27467112
- 上传时间:2023-07-01
- 格式:DOCX
- 页数:18
- 大小:83.64KB
结构方程模型.docx
《结构方程模型.docx》由会员分享,可在线阅读,更多相关《结构方程模型.docx(18页珍藏版)》请在冰豆网上搜索。
结构方程模型
结构方程模型:
定义:
结构方程模型早期称为线性结构防城模型(LinearStructuralRelationships,简称LISREL)或称为工变数结构分析(CoratianceStrucyureAnalysis)。
主要目的在于检验潜在变项之关系与数个潜在变项间的因果关系。
【陈宽裕,《结构方程模型》-1996年11月】
结构方程模型(Structural·Equation·Modeling,SEM)是一种非常通用的、主要的线性统计建模技术,广泛应用于经济学、心理学、社会学、管理学等领域的研究,是社会科学研究中的一个非常好的方法。
内容:
结构方程模型包括测量方程(LV和MV之间关系的方程,外部关系)和结构方程(LV之间关系的方程,内部关系),以ACSI模型为例,具体形式如下:
测量方程y=Λyη+εy ,x=Λxξ+εx=
(1)
结构方程 η=Bη+Гξ+ζ或(I-Β)η=Гξ+ζ
(2)
其中,η和ξ分别是内生LV和外生LV,y和x分别是和的MV,Λx和Λy是载荷矩阵,Β和Г是路径系数矩阵,ε和ζ是残差。
对这类模型进行参数估计,常使用偏最小二乘(PartialLeastSquare,PLS)和线性结构关系(LInearStructuralRELationships,LISREL)方法。
测量方程描述潜变量与指标之间的关系;结构方程则反映潜变量之间的关系。
——【杜春雪,《结构方程模型理论的建立与应用》,大众科学·科学研究与实践,2008年第18期】
SEM模式中,存在四种变量:
潜在自变项、潜在依变项、X变项、Y变项。
χ1
ε1
y1
δ1
η1
y1
ξ1
χ2
δ2
ε1
ε1
y1
χ3
δ3
结构模式
测量模式
ζ
用法:
SEM具有理论先验性
能同时处理测量与分析问题
以共变数的运用为核心,亦可处理平均数估计
适用于大样本之分析
包含了西多不同的统计技术
重视多重统计指标的运用
结构方程模型是一种非常通用的、主要的线形统计建模技术,广泛应用于心理学、经济学、社会学、行为科学等领域的研究。
实际上,它是计量经济学、计量社会学与计量心理学等领域的统计分析方法的综合。
多元回归、因子分析和通径分析等方法都只是结构方程模型中的一种特例。
结构方程模型是利用联立方程组求解,它没有很严格的假定限制条件,同时允许自变量和因变量存在测量误差。
在许多科学领域的研究中,有些变量并不能直接测量。
实际上,这些变量基本上是人们为了理解和研究某类目的而建立的假设概念,对于它们并不存在直接测量的操作方法。
人们可以找到一些可观察的变量作为这些潜在变量的“标识”,然而这些潜在变量的观察标识总是包含了大量的测量误差。
在统计分析中,即使是对那些可以测量的变量,也总是不断受到测量误差问题的侵扰。
自变量测量误差的发生会导致常规回归模型参数估计产生偏差。
虽然传统的因子分析允许对潜在变量设立多元标识,也可处理测量误差,但是,它不能分析因子之间的关系。
只有结构方程模型即能够使研究人员在分析中处理测量误差,又可分析潜在变量之间的结构关系。
适用情况:
最初,结构方程模型主要应用于教育学、心理学。
例如,在社会教育学中的成人教育、青少年犯罪,教育社会学中的大学差异研究、健康教育学中的吸毒调查、饮酒、戒烟、虫牙的预防,体育教育学中的运动训练,学校教育学中的课程评价,教育测量学中的信度分析、测验理论等。
在心理学领域,临床心理学中的生活指导、DMSⅢ、精神健康量表、心里不安测量、精神分裂症,发展心理学中的双胞胎研究,同一性、个案追踪研究、社会心理学中的归属理论、态度、性别差异、灾害心理,学习心理学中的遗忘、白鼠的行为分晓,实验心理学中的知觉、棒框测验,认知心理学中的阅读研究,人格心理学中的自我概念,智力研究中的记忆,斯坦福-比纳智力测验等。
在其他学科领域中,例如社会学中的反社会行为、市场学中的消费者行为、经营学、犯罪学、人口学、经济学等的应用研究中都出现了SEM。
步骤:
(1)模型设定。
研究者根据先前的理论以及已有的知识,通过推论和假设形成一个关于一组变量之间相互关系(常常是因果关系)的模型。
这个模型也可以用路径表明制定变量之间的因果联系。
(2)模型识别。
模型识别时设定SEM模型时的一个基本考虑。
只有建设的模型具有识别性,才能得到系统各个自由参数的唯一估计值。
其中的基本规则是,模型的自由参数不能够多于观察数据的方差和协方差总数。
(3)模型估计。
SEM模型的基本假设是观察变量的反差、协方差矩阵是一套参数的函数。
把固定参数之和自由参数的估计带入结构方程,推导方差协方差矩阵Σ,使每一个元素尽可能接近于样本中观察变量的方差协方差矩阵S中的相应元素。
也就是,使Σ与S之间的差异最小化。
在参数估计的数学运算方法中,最常用的是最大似然法(ML)和广义最小二乘法(GLS)。
(4)模型评价。
在已有的证据与理论范围内,考察提出的模型拟合样本数据的程度。
模型的总体拟合程度的测量指标主要有χ²检验、拟合优度指数(GFI)、校正的拟合优度指数(AGFI)、均方根残差(RMR)等。
关于模型每个参数估计值的评价可以用“t”值。
(5)模型修正。
模型修正是为了改进初始模型的适合程度。
当尝试性初始模型出现不能拟合观察数据的情况(该模型被数据拒绝)时,就需要将模型进行修正,再用同一组观察数据来进行检验。
【李健宁,《结构方程模型导论》,安徽大学出版社】
结构方程模型本身仍然存在不足。
例如,在模型设定、模型拟合、拟合检验以及对结果的解释等方面存在问题;在模型设定和模型识别过程所做的比较与最初理论假设的矛盾等等。
——【武洁琼,李建宁,《基于因果关系的教育研究方法思考》,苏州科技学院学报2003
(2)】
指标:
指标含有随机误差和系统误差。
随机误差指测量上的不准确性行为。
系统误差反映指标同时测量潜变量以外的特性。
随机误差和系统误差统称为测量误差,但潜变量则不含这些误差。
【杜春雪,《结构方程模型理论的建立与应用》,大众科学·科学研究与实践,2008年第18期】
探索性分析
定义:
探索性因子分析法(ExploratoryFactorAnalysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。
因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。
探索性因子分析(EFA)致力于找出事物内在的本质结构。
f1
χ1
e2
χ2
f2
f3
e3
χ3
探索性因子分析法的运用:
顾客满意度调查
服务质量调查
个性测试
形象调查
市场划分识别
顾客、产品及行为分类
————【孙晓军周宗奎.探索性因子分析及其在应用中存在的主要问题.心理科学.2005年06期】
探索性分析的适用情况:
在缺乏坚实的理论基础支撑,有关观测变量内部结构,一般用探索性因子分析。
先用探索性因子分析产生一个关于内部结构的理论,再在此基础上用验证性因子分析。
但这必须用分开的数据集来做。
探索性分析步骤:
1、辨别、收集观测变量。
按照实际情况收集观测变量,并对其进行观测,获得观测值。
针对总体复杂性和统计基本原理的保证,通常采用抽样的方法收集数据来达到研究目的。
2、获得协方差阵(或Bravais-Pearson的相似系数矩阵)。
我们所有的分析都是从原始数据的协方差阵(或相似系数矩阵)出发的,这样使我们分析得到的数据具有可比性,所以首先要根据资料数据获得变量协方差阵(或相似系数矩阵)。
3、确定因子个数。
有时候你有具体的假设,它决定了因子的个数;但更多的时候没有这样的假设,你仅仅希望最后的到的模型能用尽可能少的因子解释尽可能多的方差。
如果你有k个变量,你最多只能提取k个因子。
通过检验数据来确定最优因子个数的方法有很多,例如Kaiser准则、Scree检验。
方法的选择由,具体操作时视情况而定。
4、提取因子。
因子的提取方法也有多种,主要有主成分方法、不加权最小平方法、极大似然法等,我们可以根据需要选择合适的因子提取方法。
其中主成分方法一种比较常用的提取因子的方法,它是用变量的线性组合中,能产生最大样品方差的那些组合(称主成分)作为公共因子来进行分析的方法。
5、因子旋转。
因子载荷阵的不唯一性,使得可以对因子进行旋转。
这一特征,使得因子结构可以朝我们可以合理解释的方向趋近。
我们用一个正交阵右乘已经得到的因子载荷阵(由线性代数可知,一次正交变化对应坐标系的一次旋转),使旋转后的因子载荷阵结构简化。
旋转的方法也有多种,如正交旋转、斜交旋转等,最常用的是方差最大化正交旋转。
6、解释因子结构。
最后得到的简化的因子结构是使每个变量仅在一个公共因子上有较大载荷,而在其余公共因子上的载荷则比较小,至多是中等大小。
通过这样,我们就能知道所研究的这些变量是由哪些潜在因素(也就是公共因子)影响的,其中哪些因素是起主要作用的,而哪些因素的作用较小,甚至可以不用考虑。
7、因子得分。
因子分析的数学模型是将变量表示为公共因子的线性组合,由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时更利于描述研究对象的特征,因而往往需要反过来将公共因子表示为变量的线性组合,即因子得分。
——【武汉杨丹《探索性因子分析与验证性因子分析比较研究》】
验证性因子分析
定义:
验证性因子分析是对社会调查数据进行的一种统计分析。
它测试一个因子与想对应的测度项之间的关系是否符合研究者所设计的理论关系。
验证性因子分析(confirmatoryfactoranalysis)的强项在于它允许研究者明确描述一个理论模型中的细节。
因为测量误差的存在,研究者需要使用多个测度项。
当使用多个测度项之后,我们就有测度项的“质量”问题,即效度检验。
而效度检验就是要看一个测度项是否与其所设计的因子有显著的载荷,并与其不相干的因子没有显著的载荷。
对测度模型的检验就是验证性测度模型。
对测度模型的质量检验是假设检验之前的必要步骤。
而验证性因子分析(CFA)是用来检验已知的特定结构是否按照预期的方式产生作用。
验证性因子分析的步骤:
1、定义因子模型。
包括选择因子个数和定义因子载荷。
因子载荷可以事先定为0或者其它自由变化的常数。
或者在一定的约束条件下变化的数(比如与另一载荷相等)。
这是和探索性因子分析在分析方法上的一个重要差异,我们可以用一个直观的比喻,也就是说探索性因子分析是在一张白纸上作图,而验证性因子分析是在一张有框架的图上完善和修改。
2、收集观测值。
定义了因子模型以后,我们就可以根据研究目的收集观测值了。
这一点与探索性因子分析有一定的相似之处。
3、获得相关系数矩阵。
与探索性因子分析一样,我们的分析都是在原始数据的相关系数矩阵基础上进行的,所以首先就要得到相关系数矩阵。
实际上方差协差阵、相似系数矩阵和相关阵之间是可以相互转化的。
4、根据数据拟合模型。
我们需要选择一个方法来估计自由变化的因子载荷。
在多元正态的条件下,最常用的是极大似然估计,也可采用渐进分布自由估计。
5、评价模型是否恰当。
这一步可以说是验证性因子分析的核心。
当因子模型能够拟合数据时,因子载荷的选择要使模型暗含的相关阵与实际观测阵之间的差异最小。
最好的参数被选择以后,差异量能被用来作为衡量模型与数据一致的程度。
最常用的模型适应性检验是卡方拟合优度检验。
原假设是模型是适应性模型,备择假设是存在显著差异。
但是,这个检验受样本量大小影响,包含大样本的检验往往会导致拒绝原假设,尽管因子模型是合适的。
其他的统计方法,比如用Tucker-Lewis指数,比较建议模型和“原模型”的拟合度。
这些方法受样本量大小影响不大。
6、与其他模型比较。
为了得到最优模型,我们需要完成这一步。
如果你想比较两个模型,其中一个是另一个的缩略形式,你就能从卡方统计量的值检查出他们的差别,大约服从卡方分布。
几乎所有独立因子载荷的检验能用来作为全因子模型和简因子的模型之间的比较。
为以防你不是在检查全模型和简模型,你可以比较均方根误差的近似值(RMSEA),它是模型中每个自由度差异的一个估计值。
验证性分析适用情况
验证性因子分析要处理推论统计量,处理难度要求高。
需要具备更大容量的样本。
精确的样本量要随着观测值和模型的因子数变化而变化,但一个标准模型至少需要200个个体。
在进行分析过程中必须选择与每个因子在很大程度上匹配的变量,而不是可能是潜在变量的“随机样本”。
——【杨丹,《探索性因子分析与验证性因子分析比较研究》】
信度检验
定义:
信度(reliability)是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。
信度检验是指同一个测验对同一组被试验测两次或三次,对所得结果一致性程度进行检验。
信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。
反之,随机误差可能导致不致性,从而降低信度。
信度可以定义为随机误差R影响测量值的程度。
如果R=0,就认为测量是完全可信的,信度最高。
方法:
(注:
该部分内容基本是直接引用,当中有其他文献的内容穿插。
在使用时请适当修改。
)
(1)再测法:
用同一测验对同一被试,前后施测两次,根据两次测验分数计算相关系数,即是再测信度。
该信度反映了测验的稳定性程度,故又称稳定性系数,是用皮尔逊积差相关公式计算的。
用再测法估计信度,可以得到有关测验结果是否随时间而变化及变化程度的资料,可以作为预测被测者将来行为表现的依据。
但也存在明显的局限性:
前后两次测验结果易受到练习和记忆的影响,前后两次施测的时间间隔影响稳定性系数,特别是对学绩测验的影响较大。
如果时间间隔太长,被测者的身心因受环境影响将发生大的变化,从而对第二次施测结果产生较大影响,使稳定性系数降低;如果间隔太短,则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响,使第二次测验性质发生变化。
另外,有些测验不宜用再测法估计信度,如测量创造力测验,被试一旦掌握了解决问题的办法、原则,重测时,他将很容易作出反应,这样测验的性质就发生了改变。
因此,只有在没有复本可用,测验不易受重复使用影响,现实条件又允许重复施测的情况下才使用重测法估计信度。
用重测法估计信度,间隔时间长短没有严格的规定,一般说,间隔时间越长,稳定性系数越低,最适宜的时距应根据测验目的、性质及被试特点而定,最好不超过六个月。
对儿童的时距应该短些,对成年人的时距可适当长些,因为个体早期的身心特征变化较大,而成年人的身心特征则相对稳定。
(2)复本法.根据同一测验目的编制的许多平行德等值测验,可测定被试的同一特征,这些等值的测验叫做复本。
对一组受测者间隔一定时间或同时施测两个复本,根据两次测验结果求得相关系数,即得等值性系数,又称复本信度。
对一组受测者间隔一定时间后施测两个复本所求得的稳定性系数又称等值稳定性系数。
因为用这种方法求得的信度不仅受复本质量的影响,而且受时间练习等因素的影响,因此,等值稳定性系数更全面地反映了测验的信度。
计算等值稳定性系数是对两个复本测验结果计算斯皮尔曼积差相关系数(具体公式见前)。
(3)分半法.当测验没有复本(复本的编制是很复杂的)而且测验只适合施测一次的情况下,可用分半法估计信度,即将测验题目分成对等的两半,根据每人在这两半测验中的得分,计算其相关系数,这个系数又称内部一致性系数。
要求得分半信度,首先要将测验分成对等的两半。
绝大多数测验是由许多题目排列组成的,但是若将测验简单地分成前后两部分,常常是不对等的,对等的两部分起码有两个要求:
一是测验的两部分在难度、区分度及测验目标上基本是相同的;一是被测者以同等的态度来对待两部队测验,即在完成两部分测验过程中,练习,疲劳,情绪等因素对被试产生了同等的影响。
因此,将一个测验分成两部分时,常用的是奇偶分半法,即将奇数题分为一部分,将偶数题分为一部分。
特别是测验题目是按由易到难排列时,这种分法可以将测验分为大致相等的两半,但是,对于速度型的测验不适合用奇偶分半法。
用分半法求出的测验的信度系数并不能反映整个测验的信度。
这是因为信度受测验的长度的影响,测验越长,信度越高,将测验分成两半求得的信度系数,低估了整个测验的信度,因此,需对测验系数加以校正,校正公式是斯皮尔曼—布朗(Spearman—Brown)公式。
指标:
大部分情况下,信度是以信度系数为指标,它是一种相关系数。
常常是同一被试样本所得到的两组资料的相关,理论上说就是真分数方差与实得分数方差的比值,公式为:
r(xx)=r^2(xt)=S^2(t)/S^2(x)
公式中r^2(xt)是真分数标准差与实得分数标准差的比值,称作信度系数,公式为:
r(xt)=S(t)/S(x)
可见信度指数的平方就是信度系数。
信度指标:
包括重测信度、分半信度和克朗巴赫系数
(1)重测信度是相同量表前后两次测量同一批被访者量表得分的简单相关系数r,一般要求达到0.7以上。
(2)分半信度是相同量表的调查项目分成两半,如分前后两个部分、按提问项目号的奇数和偶数分两个部分。
计算两个部分得分的简单相关系数r,分半信度为R=2r÷(1+r)。
(3)克朗巴赫系数你已经算得了,就不赘述了。
效度检验
定义:
效度检验是指测量结果中具有跨样本或跨情景的有效性。
在结构方程模式中,一个理想模型在不同样本上重复出现的程度不同。
基本程序:
(1)将样本切割为两个样本,利用多样本模型分析;
(2)针对同一个假设模型进行估计,一个样本成为测定样本,另一个样本成为消毒样本。
(3)先将一个被检验的SEM模型在测定样本上进行估计后,重复再效度样本上进行检验,检验时,参数的数值应套入先前在测定样本上所使用的模型设定或参数估计数,进行模型检验。
方法:
(注:
该部分内容基本是直接引用,当中有其他文献的内容穿插。
在使用时请适当修改。
)
(1)内容效度:
内容效度也称表面效度或逻辑效度,是指测量目标与测量内容之间的适合性与相符性。
例如,以考查学习成绩为目的的测验来说,"所欲测量的内容"是指教学大纲所规定的全部教材;"起预期反应"是指学生学习这些教材所产生的行为变化,如对教材的记忆、理解和应用。
一个测量要具备较好的内容效度必须满足两个条件:
一是确定好内容范围,并使测量的全部项目均在此范围内。
二是测量项目应是已界定的内容范围的代表性样本。
换句话说,就是选出的项目能包含所测的内容范围的主要方面,并且使各部分项目所占比例适当。
估计内容效度的方法:
A、由专家进行逻辑分析:
即请有关专家对测验题目与原来的内容范围是否符合进行分析,作出判断,看测验题目是否较好地代表了原来的内容。
B、统计分析:
克伦巴赫(Cronbach)认为内容效度可以进行数量估计,方法是从同一教学内容总体中抽取两套测题,分别对同一组被试进行测验,两种测验的相关系数可用来估计内容效度。
若相关系数大,则内容效度高;若相关系数小,则两个测验中至少有一个内容效度低。
另外,有经验的任课教师对本学科测验的内容效度有较好的判断。
当然,若能与有关专家配合会更好些。
(2)效标效度:
效标效度又称准则效度、实证效度、统计效度、预测效度或标准关联效度,是指用不同的几种测量方式或不同的指标对同一变量进行测量,并将其中的一种方式作为准则(效标),用其他的方式或指标与这个准则作比较,如果其他方式或指标也有效,那么这个测量即具备效标效度。
估计效标效度的主要方法是:
A、相关法:
即求某测验分数与效标测量间的相关,所得结果即效标系数。
当测验分数与效标测量分数都是连续变量时,用积差相关公式求相关系数。
当测验分数是连续变量,而效标测量分数是二分变量时,可用二列相关公式计算效度系数。
B、区分法:
即看原先测验的分数是否可以区分由效标测量所化分的团体。
例如,某工厂通过测验录用了一批工人,过一段时间后,根据工作成绩将其分为称职和不称职两种,然后回过头来检查他们的测验分数,运用t检验看看两组在测验上的平均分数是否有显著差异。
若有显著差异,说明测验是有效的;若差异不显著,说明测验是无效的。
C、功利率:
为了测定测验的功效,人们还可对使用测验所化掉的费用与得到的利益进行比较,看其利弊大小,这种效度指标叫功利率。
(3)构想效度:
构想效度也称结构效度、建构效度或理论效度,是指测量工具反映概念和命题的内部结构的程度。
它一般是通过测量结果与理论假设相比较来检验的。
如果用某一测量工具对某一命题(概念)测量的结果与该命题变量之间在理论上的关系相一致,那么这一测量就具有构想效度。
确定构想效度的基本步骤是,首先从某一理论出发,提出关于特质的假设,然后设计和编制测量并进行施测,最后对测量的结果采用相关分析或因素分析等方法进行分析,验证与理论假设的相符程度。
一般说,学科测验主要看内容效度,心理测验主要看结构效度。
判断内容效度更容易一些,有教学大纲作依据;判断结构效度更难一些,因为理论结构和心理特质不易把握。
确定结构效度的方法:
A、对测验题目进行分析:
主要是分析测验的内容,被试对题目所作的反应,测验题目的同质性以及分测验之间的关系来判断测验的构想效度。
B、计算与同类权威测验的相关:
某一个新测验如果与同类的大家公认有效的已有测验之间,在测验结果上相关很高,说明这两个测验测的是相同特质,即新测验也有较高的结构效度,如后编的智力测验常与斯坦福─比纳智力量表进行比较。
C、因素分析:
通过因素分析找到影响测验分数的共同因素,在测验分数的总变异中来自有关因素的比例,可以作为构想效度的指标。
(1)宽松效度取向:
效度样本仅需维持与测定模型相同的因素结构设定,参数无需进行任何等同设定。
(2)温和效度取向:
效度样本的不忿参数必须套用测定样本的参数数据,也就是说效度模型中的不忿参数必须设定为样本间等。
一般惯用的等同参数是因素负荷量。
(3)严谨效度取向:
两个样本之间具有完全相同的模型设定,同时参数的数值也完全相等。
不同内容和形式:
模型数目
效度样本来源
相同母体
不同母体
单一模型
模型稳定性(Modelstability)
效度延展性(Validityextension)
多重模型
模型选择性(Modelselection)
效度类化性(Validitygeneralization)
——【邱皓政,《结构方程模型方法论》,北京师范大学心理学院2005年心理计量春季讲座】
效度指标:
包括内容效度、标准关联效度和结构效度。
(1)内容效度一般是通过专家评议打分。
(2)标准关联效度以一个公认有效的量表作为标准,检验新量表与标准量表测量结果的相关性,以两种量表测定得分的相关系数表示标准效度。
(3)结构效度主要用证实性因子分析(CFA)评价。
参考文献:
陈宽裕,《结构方程模型》-1996年11月
杜春雪,《结构方程模型理论的建立与应用》,大众科学·科学研究与实践,2008年第18期
李健宁,《结构方程模型导论》,安徽大学出版社
武洁琼,李建宁,《基于因果关系的教
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 结构 方程 模型