问卷分析方法Word格式文档下载.docx
- 文档编号:22543927
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:53
- 大小:67KB
问卷分析方法Word格式文档下载.docx
《问卷分析方法Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《问卷分析方法Word格式文档下载.docx(53页珍藏版)》请在冰豆网上搜索。
3.
您平时喜欢的文学作品:
(1)□外国的
(2)□中国的
(3)□古代的
(4)□近代的(5)□现代的
4.
您平时喜欢的体育项目:
(1)□爬山
(2)□游水(3)
□跑步(4)□打篮球
其中1、2题为单选题,3、4题为多(复)选题。
面介绍与单、多选题有关的软件处理方法。
、变量的编码方法
1.对单选题一个题目用一个变量即可。
如第1题用A1(取值为1或者2——要做标签)
第2题用A2(取值为1或2或3——要做标签)
2.对多选题
一个题目用一个代码,该题目下的一个选项为另一代码,由这两个代码组成该题的变量。
如:
第3题用代码A3,
选项
(1)——(5)的代码分别是M1—M5,于是该题的变量有5个:
A3M1,A3M2,A3M3,A3M4,
A3M5,它们构成了第3题的变量集,集合名为A3。
第4题用代码A4,
选项
(1)——(4)的代码分别是M1——M4,于是该题的变量有4个:
A4M1,A4M2,A4M3,A4M4,它们构成了第4题的变量集,集合名为A4。
注:
以上多选题的选项,选中的记为1,不选中的记为0。
二、定义多选题题集
A4M1,A4M2,A4M3,A4M4为例,它们是同以题目的4个可复选的选项,它们组成一个集合,集合名为A4。
★【Analyze】→【MultipleResponse】→【DefineSets】
★把A4M1,A4M2,A4M3,A4M4选入“VariablesinSet'
的方框中。
★在给出集合名A4即可。
每一个复选题都要定义题集。
三、多选题的频数分布
→Frequencies
★Analyze→MultipleResponse
★把每一个题的题集选入“Table(s)for”的方框中;
★点击OK即可。
四、多选题的列联表及其检验
因为列联表的
行和之和=列和之和
所以,在
•单选题与单选题;
•单选题与复选题中的一个选项所构成的列联表进行(独立性)检验。
其方法是进入
Analyze→DescriptiveStatistics→Crosstabs
过程。
量表分析
.李克特(Likert)五点量表法
此量表的填答方式,以五点量表最为常用,因为它的内部一致性较好,常用的选项名称如下:
•非常符合5,符合4,有时符合3,不符合2,非常不符合1。
•总是如此5,时常如此4,有时如此3,很少如此2,从未如此1。
•非常同意5,同意4,不能确定3,不同意2,极不同意1。
•非常重要5,重要4,不能确定3,不重要2,极不重要1。
二.量表分析步骤
1.项目分析;
2.效度分析;
3.信度分析.
3.项目分析
1.编制数据文件
一份量表,一般分为若干个层面,每个层面有若干调查题项。
如1:
学校办学水平意见调查表,分两个层面编制。
第一层面:
教师工作满意度,有若干题项;
第二层面:
教师教学投入,有若干题项。
如2:
父母影响调查表:
第一层面:
父母压力(A)第二层面:
心理支持(B)第三层面:
作业协助(C)编制数据文件时,变量名可以是:
A层面:
A1,A2,A3,⋯B层面:
B1,B2,B3,⋯C层面:
C1,C2,C3,⋯.也可以是题序号。
2.项目分析目的:
将不适合的题项删除。
“不合适”标准:
★标准一:
在高分组与低分组中,无显著性差异(无区分能力)的题项。
★标准二:
与总分相关不显著的题项。
•标准一的统计处理:
(1)计算总分T方法:
Tranform→Compute
(2)对总分排序方法:
Data→Sortcases
(3)按总分分别取前(或后)的27~30(%)样本作为高分组与低分组。
(4)在数据文件中设立一个分组变量,高分组的样本记
为1,低分组的样本记为2。
(5)进行t检验。
•高分组与低分组差异不显著的题项应该去掉或者修改。
•标准二的统计处理:
用总分T对所有题项作相关分析(即求相关系数)
Analyze→Correlate→Bivariate
注意:
把t放在第一行,易读结果。
•与总分相关不显著的题项应该去掉或者修改标准一与标准二所得的结果不一定相同,作项目分析时,只需说明是用什么标准即可.
4.效度分析
效度有内容效度,效标关联效度与建构效度之分(近来还倡导专家效度)。
此处介绍:
建构效度——指测验能够测量出理论的特征或概念的程度。
如果我们根据理论的假设结构,编制一份量表或测验,经实际测验结果——受试者所得的实际分数,经统计检验结果能有效解释受试者的心理特征,则此测验或量表即具有良好的建构效度当然说明建构效度好,内容效度也好,因为内容效度是通过题目的合理性来判断的。
(一)总量表的效度分析
此处所用的方法是因子分析法(因素分析法)按因子分析的原理及效度分析的含义,此处因子分析时因素(公因子)个数应是量表设计时的层面数。
如果量表效度高,应说是一个层面的含义就是一个公因子,如:
A1,A2,A3,⋯.的公因子应解释为家长压力
B1,B2,B3,⋯⋯的公因子应解释为心理支持
C1,C2,C3,⋯⋯的公因子应解释为作业协助
注意到:
•因子分析的含义是由已知的A1,A2,A3,⋯.找未知公因子。
•效度分析的含义是由已知的公因子来判定量表编制的题项A1,A2,A3,⋯.是否能说明公因子。
•所取定因子分析中累计贡献率为因子分析的解释率,解释率越高,量表的效度越高。
(二)各层面的因子(素)分析
提取一个公因子,观测其与该层面各题目的相关系数,以
说明题项是否合适,其累计贡献率为该层面的解释率
五.信度分析
指量表或试卷的可靠性
(一)总量表的信度
Analyze→Scale→ReliabilityAnalysis
在主对话框中的Model选Alpha,点击子对话框Statistics,选○Scaleifitemdeleted。
各题项在AlphaifItemDeleted的值与Alpha进行比较,也可以作为判断该题项是否合适的标准之一。
(二).各层面的信度分析
注:
(1)信度高,有时也称为内部一致性高。
(2)一般而言,总量表的题项多,其信度系数通常会大
于各分量表(层面)的信度系数。
第十四章因子分析
一般书中提到:
将主成分分析再向前推进一步,就是因子分析。
也就是说,要了解因子分析,必须对主成分分析有所了解。
事实上,在因子分析的讨论中,所用到的因子提取方法,常用的是用主成分分析的方法来提取。
因此,在介绍因子分析之前,先简单地介绍一下主成分分析。
一、主成分的直观含义
1.处理实际问题的一对矛盾
一方面,对实际问题需要有更全面的了解,必须测量其多项指
标(即变量多);
另一方面,变量过多,不但给统计处理带来很多麻烦,还可能抓不到本质。
2.解决这对矛盾的方法
方法之一:
把原始变量综合成较少的几个“综合变量(指标)”。
“综合指标”的含义:
(1)尽可能多地原始指标的信息;
(2)“综合指标”之间相互无关(这样会给解释综合指标的含义带来方便)。
3.主成分
满足
(1)、
(2)的“综合指标”称为原来指标的主成分。
例如,了解数学系学生的学习能力,可以选择他们所学过的所有的专业课成绩(原始变量),这将有二十个左右,根据专业的特点,应该有几个“综合指标”(主成分):
空间想象能力,逻辑推理能力,记忆能力。
二、主成分的求法
设x1,x2,⋯,xp为原始变量,f1,f2,⋯,fq为主成分,当然q≤p。
主成分fj是原变量x1,x2,⋯,xp的线性组合
fj=aj'
x=a1x1+a2x2+⋯+apxp
其中x=(x1,x2,⋯,xp)'
,aj=(a1j,a2j,⋯,apj)'
,j=1,
2,⋯,q。
第一主成分满足
D(f1)=max{D(fj),j=1,2,⋯,q}
第二主成分满足
D(f2)=max{D(fj),j=2,⋯,q}
且Cov(f1,f2)=0,即f1与f2不相关。
第三主成分满足
D(f3)=max{D(fj),j=3,4,⋯,q}
且Cov(f1,f3)=0,Cov(f2,f3)=0。
如此下去,得到q个公因子。
主成分个数的确定方法:
满足下式子
D(f1)D(f2)D(fq)给定数值(如0.85等)的最小的q
D(f1)D(f2)D(fp)
上式中左边的式子称为的累计贡献率。
第一节因子分析模型
一、基本问题
1.模型
如果从x1,x2,⋯,xp中提取了主成分f1,f2,⋯,fq,从数学上讲,原变量xi应可由f1,f2,⋯,fq线性表出,即
xi=αi1f1+αi2f2+⋯+αiqfq+εi,i=1,2,⋯,p
(1)
其中附加一个εi,可以理解为f1,f2,⋯,fq未包含xi的特殊信息或者是随机误差。
例如,x1,x2,x3分别表示数分、高代、解几的成绩(原变量),f1,f2,f3分别表示空间想象能力,逻辑推理能力,记忆能力(主成分)。
如果我们想分别了解以上课程对的f1,f2,f3依赖程度(或这三个公因子在以上课程成绩上的体现情况),这样就有了
(1)式的出现。
一般地,称
(1)式为因子分析模型。
•因子分析模型
(1)在形式上象多元线性回归模型,但它与线性回归模型有本质的差异,这是因为公因子是f1,f2,⋯,fq不可观测的,所以
(1)不能用多元线性回归模型的方法去处理。
欲记
X=(x1,x2,⋯,xp)'
A=(aij)pqf=(f1,f2,⋯,
fq)'
ε=(ε1,ε2,⋯,εp)'
则因子分析模型为X=Af+ε为了分析上的需要,在理论上提出一些要求:
▲E(xi)=0,Var(xi)=1,i=1,2,⋯,p
——隐含x1,x2,⋯,xp是标准化的变量;
▲E(f)=0,Var(f)=I,Cov(f,ε)=0,
——隐含f1,f2,⋯,fq是标准化的变量,f1,f2,⋯,fq互不相关,且f1,f2,⋯,fq与ε1,ε2,⋯,εp不相关;
222
▲E(εi)=0,Var(ε)=diag(σ12,σ22,⋯,σp2)——隐含E(εi)=0,D(εi)=σi2,εi与εj
i≠j)不相关。
2.基本任务
(1)根据x1,x2,⋯,xp,求出(估计出)公因子载荷矩阵A;
(2)确定公因子的个数;
(3)对公因子f1,f2,⋯,fq的含义作出合理的解释。
二、基本原理
1.估计载荷矩阵A
设样本(xi1,xi2,⋯,xip),i=1,2,⋯,n下面用主成分法(PrincipalComponentAnalysis)。
具体步骤:
(1)计算样本的相关系数矩阵R;
(2)计算R的特征根λ1≥λ2≥⋯≥λp≥0,(3)确定公因子的个数;
方法一:
取特征根中λ≥1的个数作为公因子的个数;
方法二:
12q给定数值(如0.85等)的最小的q.
12p
4)求λ1,λ2,⋯,λq对应单位特征向量γ1,γ2,⋯,γq;
5)对特征向量规格化即
ajjj,j1,2,,q
6)A的估计值为A=(a1,a2,,aq)(aij)pq
2.因子载荷矩阵A的统计意义
为了对公因子作出解释,必须弄清A的统计意义
(1)因子载荷aij的统计意义
记xi与fj的相关系数为rij
rij=Cov(xi,fj)=Cov(αi1f1+αi2f2+⋯+αiqfq+εifj)
=Cov(aijfj,fj)
=aCov(fj,fj)
=aijD(fj)
ij
=a
即aij为xi与fj的相关系数,因此aij反映xi与fj的相关程度,即aij越大,xi与fj的相关程度越高,公因子fj越反映了xi的作用,或者说fj对xi的依赖越大。
3.共性方差(变量共同度)的统计意义
q
称hi2ai2j(即A的第i行元素平方和)为变量(公因子)
j1
共同度(共性方差)。
由于aij反映了的fj对xi作用,所以hi2反映了所有公因子f1,f2,⋯,fq对xi的作用大小(或者说f1,f2,⋯,fq中包含
xi的信息多少)。
通过下面的推导,可以更清楚看到这一点
因为
1=D(x)=D(αi1f1+αi2f2+⋯+αiqfq+εi)
=D(
αi1f1)+D(αi2f2)+⋯+D(αiqfq)+D(εi)
αi1D(f1)+αi2D(f2)+⋯+αiqD(fq)+
22
=hi+σi
由此得到
(1)0≤hi2≤1;
(2)若hi=1,则σi=0,表示ε只取常数,但E(ε)
=0,所以ε=0。
此时
xi=αi1f1+αi2f2+⋯+αiqfq
即xi由f1,f2,⋯,fq唯一确定;
(3)若hi=0,则σi=1,
但E(xi)=E(αi1f1+αi2f2+⋯+αiqfq+εi)=0,D(αi1f1+αi2f2+⋯+αiqfq)=0,于是αi1f1+αi2f2+⋯+αiqfq=0,则xi=εi,即xi由εi唯一确定。
所以hi2的大小,反映了所有的公因子f1,f2,⋯,fq对xi的作用。
4.方差贡献
p
称g2jai2j(即A的的列元素平方和)为公因子fj的方差
i1
贡献。
gj2的大小,反映了第j个公因子fj对所有原变量x1,x2,⋯,xp的作用,gj2越大,fj对x1,x2,⋯,xp的作用越大。
一般地,根据g12,g22,⋯,gq2大小排序,得到对应f1,f2,⋯,fq的作用大小的排序。
由于g2jai2j=aj'
aj=λjγj'
γj=λj
所以特征根λj就是的fj方差贡献,它的大小反映了公因子fj所有x1,x2,⋯,xp的重要性,从而说明了公因子的选择是根据因子的重要程度作为标准的。
三、基本计算
1.数据文件变量为x1,x2,⋯,xp
2.选择统计方法
Analyze→DataReduction→Factor增加因子分析的适应性的检验
3.结果说明例(P197)
第二节因子旋转
一、必要性当公因子的解释有困难时,想办法使所求载荷阵A的同一列元素的绝对值两极分化,(即向1或者0靠拢),现在的问题是这样的载荷阵是否存在,如何求得?
二、可能性
如果X=Af为因子分析模型,对f作正交变换,即令S=Γ‘×
f且Γ'
Γ=I
则X=AΓS+ε
(2)
仍然是因子分析模型.
=E(Af+ε)=0,
Var(AΓS+ε)=Var(AΓΓ'
f+ε)
=Var(Af+ε),
所以Var(xi)=1,i=1,2,
⋯,p;
E(S)=0,Var(S)=I,Cov(S,
ε)=0,
2
E(εi)=0,Var(ε)=diag(σ12,
σ2,⋯,σp)
•注意:
在模型
(2)中,
S=Γ'
f为公因子,AΓ为载荷阵。
因此对原来模型
(1)中的A、f,可以通过找一个正交阵Γ,使AΓ成为较为理想(因素两极分化)的载荷阵,这样就可以更好地解释公因子Γ'
f的实际含义了。
因子正交旋转的方法很多,最常用的是“极大方差旋转”(VarimaxRotation)。
需要进行因子旋转时,只要在因子分析的主对话框中,点击
Rotation
再选定○Varimax即可。
第八章回归分析
变量间的两种关系
1.函数关系——对X,Y,已知其中一个,可以准确地计算出另外一个。
2.相关关系——X,Y之间有联系,但已知其中的一个,不能准确地计算出另外一个。
Y——血压,X——年龄
Y——单位成本,X——产量回归分析、相关分析(下章讨论)都是研究相关关系的统计方法。
相关分析——研究变量相关程度的方向与程度大小;
回归分析——研究变量之间的近似表达表达式(经验公式)——回归方程,为要说明回归方程是否有意义,要用相关程度作为标准。
回归分析的分类:
用自变量的个数作标准来分,可分为一元、二
元、三元
第一节一元线性回归模型
一、基本问题
1.数据基本形式
X
x1
x2⋯
⋯.xn
Y
y1
y2⋯
⋯.yn
其中X为可控制的一般变量,Y为随机变量
2.数据结构(模型)
~N(0,2)
称为一元线性回归模型。
3.基本任务
(1)根据样本(xi,yi),i=1,2,⋯,n,在某种标准下,求出y=a+bx的近似表达(估计)式,即a,b的估计值,得到y?
a?
b?
x;
(2)检验近似式是否有效
(3)计算标准误差。
b的估计方法
标准:
最小二乘原理,即选择a,b的估计值a?
b?
,使得
Q(a?
b?
)minQ(a,b)min(yiabxi)2
用数学分析中求极值的方法,求得:
b?
Lxy
Lxx
a?
yb?
x
11
xxi,yyi
nn
其中
Lxx(xix)2
Lxy(xix)(yiy)
Lyy(yy)2
2.回归方程的显著性检验
(1)平方和分解
ST(yiy)2[(yiy?
i)(y?
iy)]
(yiy?
i)2(y?
iy)22(yiy?
i)(yiy)
S剩S回0
2)检验的方法
欲检验H0:
b=0,在H0成立的条件下,有
FS回~F(1,n2)
S剩/(n2)
当Sig.=P(F>
F值)<
时,回归效果显著(即拒绝H0),反之不显著。
3)标准误差
定义:
称sSE为标准误差,也称为标准残差。
在统计量F的表达式中,可以看到:
F大,标准误差s小,模型的拟合程度好;
F小,标准误差s大,模型的拟合程度差。
由此可见,标准误差s是用来度量模型拟合程度的量。
4)复相关系数
称R=S回为复相关系数。
S总
由R的定义可以看出:
R越大,F越大,模型的拟合程度越好;
R越小,F越小,模型的拟合程度越差。
由此可见,复相关系数R也是一个用来度量模型拟合程度的量。
由于R的大小受到回归方程中自变量个数p与样本容量n的影响(一个极端情况是样本容量为n=2时,R2=1),所以R隐含着虚假成分,于是进行适当的修正R1(1R2)nn21,(称为修正复相关系数)
3.回归系数的检验欲检验H0:
b=0注:
这与回归方程的检验是一样的(在一元的情况下)。
1.数据文件的建立
变量为2个。
2.统计方法的选择
Analyze→Regression→Linear
在主对话框中注意自变量(Independent)与因变量(Dependent)的选择。
3.计算结果的说明
例(P75)
第二节多元线性回归
1.数据(样本):
自变量x1,x2,..,xm,因变量y,作n次试验,得到如下数
xn1,xn2,⋯,xnm,yn
2.数据结构(模型)
y=b0+b1x1+b2x2+⋯.+bmxm+,~N(0,2)
(1)计算回归模型y=b?
0b?
1x1b?
2x2b?
mxm
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 问卷 分析 方法