《多元统计分析》实验一.docx
- 文档编号:30102696
- 上传时间:2023-08-05
- 格式:DOCX
- 页数:13
- 大小:402.55KB
《多元统计分析》实验一.docx
《《多元统计分析》实验一.docx》由会员分享,可在线阅读,更多相关《《多元统计分析》实验一.docx(13页珍藏版)》请在冰豆网上搜索。
《多元统计分析》实验一
实验一使用图示法对实际多元数据作初步描述分析和寻找异常值
(廖颖林编写)
一、实验目的
1.掌握使用SAS软件进行相关性分析;
2.掌握使用SAS软件绘制适当的图形对多元数据进行初步的描述分析;
3.掌握使用SAS软件对异常值的判别方法。
二、实验内容
根据顾客满意度理论,顾客对产品的满意度受到购买产品之前对产品质量的预期、产品的实际质量感受以及产品的价值感受即性价比的影响。
某电视机生产企业开展了顾客满意度调查,共获得了有效样本969条,原始数据参见附录。
调查中,顾客根据自身感受对四个问题进行评分。
四个问题分别为:
对购买前产品质量预期的评价(EXPE)、对产品实际质量的评价(QUAL)、对产品性价比的评价(VALU)以及对产品满意度的评价(SATI)。
评分范围为1~10分,均采用整数分值。
其中1分表示预期质量非常差、实际质量非常差、性价比非常低或非常不满意;10分表示预期质量非常好、实际质量非常好、性价比非常高或非常满意。
分值越高表示相应的评价越好。
对该电视机生产企业的调查数据进行初步描述分析,并判断调查数据中是否存在异常值。
实验1
通过对顾客满意度以及各影响因素的原始数据进行相关性分析。
验证该电视机生产企业的调查数据是否符合顾客满意度理论。
实验2
通过绘制适当的图形对调查数据进行初步的描述分析。
实验3
通过采用合适的方法判断调查数据是否存在异常值。
三、实验要求
1.进行相关分析,理解相关系数与偏相关系数的概念,并对相关系数和偏相关系数进行检验;
2.通过绘制适当的图形,例如箱形图、散点图矩阵等,对数据进行直观的、初步的描述分析;
3.通过采用散点图矩阵,直观判断调查数据中是否存在异常值,并采用合适的方法对异常值进行处理。
四、实验指导
打开SAS软件。
1.进行相关分析。
进入交互式菜单操作系统,打开数据文件sasuser.case1。
菜单选择过程如下:
解决方案(Solutions)
分析(Analysis)
交互式数据分析(InteractiveDataAnalysis)(参见图1)
在打开(Open)对话框中打开数据文件sasuser.case1,参见图2。
图1进入交互式数据分析菜单操作系统
图2在交互式菜单操作系统中打开数据文件sasuser.case1
选择多元(YX)分析,初步分析变量EXPE、QUAL、VALU和SATI的相关关系。
菜单选择过程如下:
分析(Analyze)
多元(YX)分析(Multivariate(YX))(参见图3)
在多元(YX)分析(Multivariate(YX))对话框中选中变量EXPE、QUAL、VALU和SATI
Y
确定(OK),参见图4。
图3多元(YX)分析操作
图4多元(YX)分析对话框
输出结果参见图5。
图5变量EXPE、QUAL、VALU和SATI相关分析的输出结果
对变量EXPE、QUAL、VALU和SATI的相关关系进行检验。
菜单选择过程如下:
在输出结果界面(参见图5)上,选择表(Tables)
相关系数P值(CORRp-values),参见图6。
图6对变量EXPE、QUAL、VALU和SATI的相关关系进行检验
输出结果参见图7。
图7变量EXPE、QUAL、VALU和SATI相关关系进行检验分析的输出结果
根据图7,SATI与影响变量EXPE、QUAL、VALU之间的相关系数分别为:
0.5368、0.7014、0.7525。
各相关系数的p值均小于0.0001,这说明SATI与各个影响变量均存在着显著的正相关关系。
同时考虑到顾客满意度的各影响因素之间亦存在一定的相关性,通过计算偏相关系数,对变量EXPE、QUAL、VALU和SATI的相关关系做更进一步的探讨分析。
菜单选择过程如下:
以计算固定QUAL与VALU,EXPE与SATI的偏相关系数为例。
分析(Analyze)
多元(YX)分析(Multivariate(YX))
在多元(YX)分析(Multivariate(YX))对话框中选中变量QUAL、VALU
Partial
选中变量EXPE
X
选中变量SATI
Y
确定(OK)(参见图8)
选择表(Tables)
相关系数P值(CORRp-values)。
图8固定QUAL与VALU,求EXPE与SATI的偏相关系数
输出结果参见图9。
图9固定QUAL与VALU,EXPE与SATI偏相关系数的输出结果
根据图9,当固定QUAL与VALU时,SATI与影响变量EXPE的偏相关系数为0.0855,p值为0.0078。
与相关系数比较可知,在控制QUAL与VALU之后,EXPE与SATI的相关关系减弱。
但由于偏相关系数检验的p值较小,这说明:
总体而言,偏相关程度仍然显著。
同理可分别求出SATI与QUAL以及SATI与VALU之间的偏相关系数,操作参见上述说明,不再给出具体的菜单选择过程。
输出结果分别参见图10和图11。
图10固定EXPE与VALU,QUAL与SATI偏相关系数的输出结果
图11固定EXPE与VALU,QUAL与SATI偏相关系数的输出结果
根据图10,当固定EXPE与VALU时,SATI与影响变量QUAL的偏相关系数为0.3670,p值小于0.0001。
根据图11,当固定EXPE与QUAL时,SATI与影响变量VALU的偏相关系数为0.5223,p值小于0.0001。
与相关系数比较可知,在控制EXPE与VALU之后,QUAL与SATI的相关关系减弱。
在控制EXPE与QUAL之后,VALU与SATI的相关关系减弱。
但是根据p值可知,总体而言上述两个偏相关关系仍然显著。
对上述相关分析总结如下:
(1)SATI与各影响因素之间存在着显著的正线性相关。
按照相关程度从大到小排列,依次为:
VALU、QUAL和EXPE。
(2)在控制另外两个影响因素之后,SATI与单个影响因素之间的偏相关系数均从绝对值上小于相关系数,说明各个影响因素之间亦存在这一定程度的正线性相关关系。
图7中各影响因素之间的相关系数可对此结论进行验证。
例如EXPE与QUAL的相关系数为0.6019,为显著正相关。
(3)SATI与各影响因素的偏相关系数仍然显著。
按照相关程度从大到小排列,依次为:
VALU、QUAL和EXPE。
该结论与相关系数的排列顺序完全一致。
说明无论从相关系数还是偏相关系数来看,对购买电视机顾客的满意程度影响最大的因素为性价比,其次为电视机的产品质量,而购买前的质量预期虽然存在一定影响,但是与前两者相比,影响力度偏小。
(4)SATI与EXPE之间正的线性相关关系与顾客满意度理论中的差异理论相悖,该结论的合理性还需要得到进一步的验证。
2.绘制合适的图形对数据进行直观的、初步的描述分析。
对每个变量绘制箱形图,观察数据的分布形态。
菜单选择过程如下:
分析(Analyze)
箱形图/拼花图(Y)(BoxPlot/MosaicPlot(Y))(参见图12)
在箱形图/拼花图(Y)(BoxPlot/MosaicPlot(Y))对话框中选中变量EXPE、QUAL、VALU、SATI
Y
确定(OK)(参见图13)。
图12选择绘制箱形图
图13箱形图/拼花图(Y)对话框
输出结果参见图14。
图14箱形图输出结果
根据图14,EXPE、QUAL、VALU和SATI均具有负偏态分布的特点,即顾客的评价中分值偏高的评价多,而分值偏低的评价较少。
该分布特点符合顾客满意度评价的一般规律。
绘制散点图矩阵,进一步探求数据的分布形态。
菜单选择过程如下:
分析(Analyze)
散点图(YX)(ScatterPlot(YX))(参见图15)
在散点图(YX)(ScatterPlot(YX))对话框中选中变量EXPE、QUAL、VALU、SATI
Y和X
确定(OK)(参见图16)。
图15选择绘制散点图
图16散点图对话框
输出结果参见图17。
图17散点图矩阵输出结果
根据图17,可快速形成SATI与各影响因素具有正线性相关关系的结论。
而且,还可判断SATI与各影响因素相关关系的紧密程度,按照由紧密到松散的程度排序,依次为:
SATI与VALU、SATI与QUAL、SATI与EXPE,该结论与相关系数的计算结论相一致。
3.对异常值的判别和处理
在图17中可以发现一个特殊的观测值,该观测值脱离观测值的集中区域。
在散点图矩阵中选中该点,得到观测值的ID为841,参见图18。
图18利用散点图矩阵甄别异常值
是否可将该观测值判定为异常值?
还需要进行定性分析。
ID为841的观测值所对应的原始数据分别为:
EXPE为1,QUAL为1,VALU为4,SATI为8。
说明这名顾客在购买电视机之前对该产品的质量预期很低,购买后产品的实际质量与预期相同,即质量很差,但是由于电视机产品的价格较低,所以性价比较好,有趣的是,顾客满意程度居然为8分,远远超过该顾客对其他变量的评价。
这似乎不合常理,因此,可以认为该观测值为异常值,将该观测值剔除。
对剔除异常值后剩余的968个观测值重新进行分析。
由于分析的步骤与前面一致,这里就不再重复了。
注:
本案例数据量很大,可从本课程的精品课程网站上下载。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 实验