回归分析方法及其应用中的例子Word格式文档下载.docx
- 文档编号:18893499
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:29
- 大小:351.53KB
回归分析方法及其应用中的例子Word格式文档下载.docx
《回归分析方法及其应用中的例子Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《回归分析方法及其应用中的例子Word格式文档下载.docx(29页珍藏版)》请在冰豆网上搜索。
假设菜电信运营商的服务界面包括了A1……Am共M个界面,那么各■界面对总体服务满意度A的影响可以通过以A为因变量,以A1……Am为自变量的回归分析,得出不同界面服务对总体A的影响系数,从而确定各服务界面对A的影响大小。
同样,A1服务界面可能会有A11……A1n共N个因素的影响,那么利用上述方法也可以计算出A11A1n对A1的不同影响系数,由此确定A1界面中的重要因素。
通过两个层次的分析,我们不仅得出冬大服务界面对客户总体满意度影响的大小以及不同服务界面上各■因素的影响程度,同吋也可综合得出某一界面某一因素对总体满意度的影响大小,由此再结合用户满意度评价、与竞争对手的比较等因素来确定每个界面细分因素在以后工作改进中的轻重缓急、重要性差异等,从而是到爭半功倍的作用。
例3.5.4:
对某地移动通信公司的服务满意度研究中,利用回归方法分析各服务界面对总体满意度的影响。
a.直接进入法
显然,这种方法计算的结果中,C界面不能通过显著性检验,直接利用分析结果是错误
的,见表3.5.4.1:
表3・5.4.1强制回归的Coefficients
UnstandardizedCoefficients
StandardizedCoefficients
t
Sig.
B
Std.Error
Beta
(Constant)
A
C
D
E
F
aDependentVariable:
H
b.逐步回归法
这种方法剔除了一个不能通过统计检验的大的服务界面(C界面),虽然通过了显著性
检验,但却遗漏了C界面的信息。
表3.5.4.2逐步回归的Coefficients
同样,使用强制刪除法,C服务界面不能通过显著性检验,向前法和向后法亦剔除了C界面进入分析。
可以看出,通过以上回归分析我们得到了不同的分析结果,显然这种分析方法存在着较大的偏差,随意选取一种是不负责任的,必须深入研究。
一般来说,满意度分析中涉及到许多因素,而诸多因素间存在看一定的关联,因而在进行回归分析时,各自变董之间的共线性问题导致了直接使用线性回归分析模型时一些因子不能参与分析的現象。
一些市场研究咨询公司常釆用舍弃一些变量,遗漏部分信息来求得统计检验通过的方法;
有的不顾显箸性检验结果而强行使用不合理的分析结果来保证变量不被舍弃,从而虚假地保障了信息不被遗漏。
我们认为这是满意度分析错误的两个极端。
处理的正确方法是,利用SPSS软件中的岭回归分析来解决,既保障信息不被遗漏,同时保障分析具有统计意艾。
SPSS软件界面没有直接进行岭回归的命令,我们可以通过SPSS提供的程序编辑命令,自行编辑程序加以实现。
在SAS软件中可直接进行岭回归分析。
对例3.5.4.1进行岭回归,分析结果和表的结果对比如下。
可见两者之间有较大差异(下表数据将已将回归系数之和标准化为100%),F界面对总体满意度的作用被缩小了5%左右,而B界面、D界面的作用各被夸大近5亂
表3・5・4・3强制回归与冷回归结杲的比较
表的错误分析
岭回归结果
两者之间的差异
%
\
5回归分析方法应用的举例说明——怎样作回归分析How
本章以一个例子详细说明回归分析方法在实际研究中是如何应用的。
回归分析变量的数据转换
本章举例说明的例子选用39家企业样本数据(见表),带动作用是因变量,其余各变董均为自变量,其中所属产业和员工人数是对该样本企业而言,而接触程度则指该样本企业与本地的龙头企业之间在业务上的接触紧密程度。
接触程度.各自变董和因变董均以Likert五分董表进行度量。
表
例子的样本数据
样本
所属
员工
接触
企业
公共
营销
技术
资源
风险
带动
编号
产业
人数
程度
合作
事务
努力
改进
共享
分担
作用
皮革
230
2
159
3
208
4
112
5
100
6
495
7
33
8
80
9
10
150
11
136
12
61
13
17
14
15
家电
300
16
250
18
134
19
428
20
21
400
22
23
225
24
180
25
90
26
160
27
28
350
29
345
30
305
31
32
414
34
324
35
36
200
37
85
38
39
415
5.1.1
企业所晨
,产业虚拟变量的引入
从表中看到.自变量所属产业为名艾变量,在进行多元回归分析之祈需要将其转化为虚拟变董进行处理。
而员工人数在一定程度上能够反映企业的规模,因此也将其处理为虚拟变量。
将皮革产业变量定狡为变#D,,则
D=fO属于家电产业,=|1属于皮革产业
5.1.2企业规模虔拟变量的引入
首先按照企业员工人数将企业划分为微型、小型.一般型.中型和大型共5种类型企业,具体划分标准见表:
表企业规模的划分和变量说明
企业规模小型
中型
>
100且W300
d3
大型工300
员工数W100
变量名D2
由此,有:
0不属于小型产业
不属于中型产业
1属于小型产业:
属于中型产业
当以上D2.Ds均为0时,则表示该企业属于大型企业。
5.1.3引入虚拟変量后的变量数据
将上述各变量进行转换处理之后,得到本例进行回归分析的各个变董数据,见表:
表回归分析的变量数据
编
小
中
接触程企业公共营销
技术资源风险也丄带动
改进共享分担
号
行业
型
度合作事务努力
D,
D2
TachCoopPubIMark
TechRecoRiskEffe
首先看表中,各变董的均值及其标准差:
变量的描述性数据
变量
均值
标准差
样本数
effe
・79983
coop
・88252
publ
・87023
mark
・82885
tech
・62307
reco
・87637
risk
・80624
D・
.3590
・48597
.3333
・47757
Da
.4103
・49831
tach
由于举本例的目的是为了详细解释在SPSS中如何进行回归分析,所以在本文中不详细论述与本主体关系不大的各■项分析及其结论。
在表中,详细列出了所有变董之间的两两相关系数:
变量的相关系数及其显著性
D2D3tach
・377()
・385(*)
・607()
.410(**)
.387(*)
・382(*)
.438(**)
.398(*)
.617(**)
.313
・709(**)
.502(**)
.376(*)
・174
.324(*)
risk
・731(**)
.257
.322(*)
.210
・265
・659(♦*)
(♦)
.092
.204
.017
.000
・000
・151
D3
.006
.070
.063
.042
・137
(**)1
・397(*)
・162
.212
.064
.349(*)
.187
.304
(*)
・1261
强制(Enter)的多元线性回归分析
5.3.1强制(Enter)多元线性回归分析在Spss软件中的操作
激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框。
从对话框左侧的变董列表中选effe,点击钮使之进入Dependent框,选其余各个变量(包括coop、publ、mark、tech、reco、risk>
Di、D2、D3和tach),点击钮使之进入Independent(s)框;
在Method处下拉菜单,共有5个选项:
Enter(强制法)、Stepwise(逐步法)、Remove(剔除法)、Backward(向后法)、Forward(向前法)。
首先选用Enter法°
点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析,在本例中选择Regressionconfidence下的Estimate、Residuals下的Durbin-Watson,以及ModeIfit和ColIinearityDiagnostics这几个选项,分别进行回归系数的仕计.模型的拟合评价和回归三大问题的诊斷;
点击Plots...钮选择是否作变量分布图,在本例中选择DEPENDENT即因变量作为X轴,ZRESID即标准化残差作为Y轴,观察Y随X变化的情况,以判斯是否存在异方差和自相关问題:
点击Save...钮选择对回归分析的有关结果是否作保存,在本例中不做选择:
点击Options...钮选择变量入选与剔除的a、0值和缺失值的处理方法,在本例中选择系统默认值。
点击0K钮即完成分析。
5.3.2强制(Enter)多元线性回归分析三大问题的诊斷
首先要判断本强制回归中是否存在回归的三大问题。
因此,对照第3幸的相关内容有:
1、多重共线性诊断
见表和表中,回归方程的F较商但十值显著的不多,表明自变董之间有存在严重多重共线性的可能。
但方差膨胀因子VIF值基本在2左右,而容忍/t(Tolerance)也在可接受范国内。
在麦中也看到,除去第11个层面(Dimension),其余各层面的条件指标(Conditionindex;
Cl)在30以内,各个自变量在每个层面上的方差比例基本没有出现都较大的现象。
说明自变量之间没有严重的多重共线性问题。
表模型的拟合⑹
Model
R
RSquare
AdjustedRSquare
Std・Errorofthe
Estimate
Durbin-V/atson
.872(a)
.761
.675
・45576
aPredictors:
(Constant),tach,D3.mark,reco,D1,tech,coop・D2,risk,pubIbDependentVariable:
effe
Coefficients
Coefficierrts
Statistics
ToleranceVIF
Std・Error
.568
.490
.128
.657
.425
pubI
.131
.779
.422
.219
・105
.227
.046
.723
tech
・157
.162
.122
.973
.339
.540
.327
・135
.358
.023
.388
.403
.406
.461
D1
.191
.182
.633
.218
.130
.963
.344
.466
.034
.208
.021
.165
.870
.508
.071
.086
.096
.829
.414
.644
aDependent
Variable:
表变量的多重共线性诊断⑹
Mod
e1
Dimen
sion
Eigenvalue
Conditio
nIndex
VarianeeProportions
常数
pub
I
ris
k
.00
・00
・0
.0
・1
.14
.694
・5
.01
.211
.4
.59
.03
.07
・11
.55
.069
.06
.02
・14
・16
.04
.058
.05
.26
.12
.13
.030
.25
.47
・18
•1
.09
・10
.025
.33
.013
.40
・15
.32
.08
.64
.45
.009
.71
.77
2、自相关诊斷
从表中看到,值为,而查DW统计量临界值表(张晓蒂,1991)有:
样本莹为39且变董个数为5时氏为而du为.则在本例中其范围较之更广.还不能完全判断是否存在自相关,本例中暫且认为不存在自相关问题。
3、异方差诊断
见图,该残差图中的点基本呈随机分布,初步判断该组数据不存在异方差问题。
Scatterplot
DependentVariable:
J.002.003.00AM5.00
«
np一SVH(snd)pooouU.2SEZOH
图标雇化残差与因变量之间的散点图
因此,从上述的诊断结果来看,本例的回归分析过程中不存在回归问題的三大问題。
接着检验回归的残差是否服从正态分布,见图。
从图中看到,残差基本是如从正态分布
的。
NormalP-PPlotofUnstandardizedResidual
表方差分析⑹
(Constant),tach,D3,mark,reco,D1,tech,coop・D2・risk,pubIbDependentVariable:
此时,将回归分析的结果总结如下:
表回归分析结果(a)
ModeI
(Constant
)
・128
・131
・122
・191
・182
・130
・344
・165
R:
.872:
AdjustedRSqu:
.675:
F:
:
Sig.:
.000
bWeightedLeastSquaresRegression-WeightedbyreciprocaIofesquared
其中需要说明的是,没有设定虚拟变量的类别变量(本例中的家电产业和大型企业)被称为参照类,各■个虚拟变量回归系数则表示该类别与参照类上均值的差异。
为了比较回归系数显箸的冬自变量对因变量的影响程皮的大小,本例选用标准化后的系
数,则从表中看到:
①本例数扌居分析得出.自变董mark、reco和risk对因变量effe有显著影响,且均为正向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 方法 及其 应用 中的 例子