判别分析.docx
- 文档编号:6768664
- 上传时间:2023-01-10
- 格式:DOCX
- 页数:11
- 大小:524.51KB
判别分析.docx
《判别分析.docx》由会员分享,可在线阅读,更多相关《判别分析.docx(11页珍藏版)》请在冰豆网上搜索。
判别分析
武夷学院实验报告
课程名称:
多元统计分析项目名称:
判别分析
姓名:
专业:
信息与计算科学班级:
1班学号:
同组成员:
无
一、实验目的
通过本次实验,熟悉SPSS统计软件,学会在统计软件SPSS中进行判别分析,并通过判别分析输出结果图,再进行判别分析。
根据输出结果,会用SPSS软件实现距离判别法、贝叶斯判别和费歇尔判别。
二、实验内容
1.操作SPSS的基本方法(打开、保存、编辑数据文件)
2.问卷编码
3.录入数据并练习数据相关操作
4.对spss软件有关判别分析的操作;
5.输出并解释分析结果并完成实验报告。
三、实验步骤
1.开机
2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS
3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语句编辑窗
4.对一份给出的数据进行编码和变量定义
5.按要求录入数据
6.练习基本的数据修改编辑方法
7.对输出结果进行距离判别法、贝叶斯判别和费歇尔判别
8.保存数据文件
9.关闭SPSS,关机。
四、实验项目及结果
人类发展指数(HDI)是由联合国开放计划署在《1990年人类发展报告》中提出的,用以衡量世界各国或地区经济社会发展水平的指标。
其指标构成如下:
出生时平均预期寿命、平均受教育年限、预期受教育年限以及人均国民总收入(2001年购买力评价美元)等4个指标。
这里选取了5个发达国家和5个发展中国家的指标值作为训练样品,用以对4个待判国家进行判别分析(“类别”中“1”为发达国家,“2”为发展中国家)。
表4.1联合国开发计划署发布的2014年人类发展指数的部分数据
将数据导入SPSS软件中,得到如下图:
(1)操作步骤
(1)点击Analyze→Classify→Discriminant,进入Discriminant主对话框(图4.2)。
①GroupingVariable为标明已知的样品所属类别的变量列表框。
这里,将“类别”变量放置于此。
DefineRange用于确定分类变量的数值范围,本例“类别”变量的最小值为1,最大值为2.
②Independents为标明观测量特征的变量列表框。
本例将四个变量放置于此。
③Enterindependenttogether表示所有自变量都能对观测量的特征提供丰富的信息且彼此独立时选择该项,此时将使用所有自变量进行判别分析,建立全模型。
Usestepwisemethod表示按照判别变量贡献的大小使用逐步方法选择自变量。
选择此项时,Method按钮被激活,可以进一步选择判别分析方法。
(2)点击主对话框Statistics选项,用于选择要输出的描述统计量、函数系数以及矩阵(图4.3)。
①Descriptives子选项用于设定要输出的描述统计量。
其中,Means表示输出各类各自变量均值,标准差,各自变量总样本的均值和标准差;UnivariateANVOAs表示对各类中同一变量均值都相等的假设进行检验,输出单变量的方差分析结果;Box’M表示对各类的协方差矩阵相等的假设进行检验。
②FunctionCoefficients子选项用于设定判别函数系数的输出形式。
其中,Fisher’s表示输出可以直接用于对新样本进行判别分类的Fisher’s系数(即为贝叶斯判别函数,并不是费希尔判别方法的判别函数,只因该判别思想是由费希尔提出),对每一类给出一组系数,并给出该组中判别分数最大的观测量。
Unstandardized输出未标准化的费希尔判别方法的判别函数。
③Matrices子选项用于设定要输出的自变量的系数矩阵。
其中,Within-groupscorrelation表示输出类内相关矩阵;Within-groupscovariance表示计算并显示合并类内协方差矩阵;Separate-groupscovariance表示输出显示一个协方差矩阵;Totalcovariance表示计算并显示总样本的协方差矩阵。
选中所需选项后,点击Continue回到主对话框。
(3)点击主对话框Classify选项,用于设置分类参数和判别结果。
①PriorProbabilities子选项用于设定两种先验概率,其中,Allgroupsequal表示各类先验概率相等;Computefromgroupssizes表示各类的先验概率与各类的样本量成正比。
②UseCovarianceMatrix子选项用于设定分类使用的协方差矩阵。
其中,Within-groups表示指定使用合并组内协方差矩阵进行分类;Separate-groups表示使用各组协方差矩阵进行分析。
③Display子选项用于设定生成到输出窗口的分类结果。
其中,Casewiseresult表示对每个观测量输出判别分数、实际类、预测类、后验概率等;Summarytables表示输出分类小结,给出正确分类样品数、错分样品数和错分率;Leave-one-outclassification表示输出每个样品进行分类的结果,也称为交互校验结果。
④Plots子选项用于设定输出的统计图。
其中,Combined-groups表示生成包括各类的散点图,该散点图是根据前两个判别函数值作的散点图;Separate-groups根据前两个判别函数数值对每一类生成一张散点图,共分为几类就生成几张散点图;Territorialmap表示根据函数值生成把样品分到各类中去的区域图。
⑤Replacemissingvaluewithmean表示对缺失值的处理方式,即用该变量的均值代替缺失值。
选中所需选项后,点击Continue回到主对话框。
⑷点击主对话框Save选项,用于指定生成并保存在数据文件中的新变量(图4.5)
①Predictedgroupmembership表示要求建立新变量,根据判别分数,按照后验概率最大指派所属的类别;
②Discriminantscores表示建立表明判别分数的新变量;
③Probabilitiesofgroupmembership表示要求建立新变量,表明样品属于某一类的概率。
选中所需选项后,点击Continue回到主对话框。
⑸点击主对话框OK按钮,运行判别分析程序。
(2)输出结果
⑴表4.2为分析案例处理摘要,反映的是有效样本量及变量缺失的情况。
本例有4个样本判别待判,所以表中显示有4个样品变量值缺失。
表4.2分析案例处理摘要
⑵表4.3为分组统计量表,是各组变量的描述统计分析。
从表中可以看出4个变量在2组的均值差别还是比较大的。
表4.3分组统计量表
⑶表4.4为组均值的齐性检验。
从表中可以看出,出生时预期寿命和人均国民收入在两组中的均值差异是显著的,而另外两个变量的差异是不显著的。
表4.4组均值的均等性的检验
⑷表4.5为协方差矩阵的均等性检验。
是对两组进行的总体协方差矩阵是否相等的统计检验。
由表中的P值0.202可知两组总体的协方差矩阵差异显著。
表4.5协方差矩阵的均等性检验
⑸表4.6是典型判别函数的分析结果。
其中,Eigenvalue表反映判别函数的特征值、解释方差的比例和典型相关系数。
从表中可以看出,第一判别函数解释了。
100%的方差。
Wilks’Lambda表是对第一个判别函数的显著性检验。
从表中可以看出,P值为0.070,因此判别函数是显著的。
表4.6典型判别函数的分析结果
⑹表4.7和表4.8反映的是判别函数和判别载荷。
表4.7是标准化的判别函数。
表4.8反映的是结构矩阵,即为判别载荷。
由表4.7可知判别函数为Y₁=0.264X₁*-0.004X₂*+0.614x₃*+0.907X4*其中,X₁*—X4*均为标准化后的变量值,标准化变量的系数即为判别权重。
通过判别权重和判别载荷可以看出哪些解释变量的贡献比较大。
⑺表4.9为未标准化的典型判别函数系数,即费希尔判别函数系数。
可以将样品观测值直接代入该函数以求判别得分。
本例费希尔判别函数为Y₁=-16.253+0.074X₁+0.002X₂+0.57X₃
⑻表4.10为类重心处的费希尔判别函数值。
⑼表4.11为贝叶斯判别函数系数。
这里是将各样本的变量值代入贝叶斯各类别判别函数中,按判别函数值最大的一组进行归类。
由表4.11可知两类贝叶斯判别函数分别为
F₁=-369.285+6.106X₁+0.766X₂+15.051X₃
F₂=-316.977+5.689X₁+0.759X₂+13.216X₃
⑽表4.12为按照案例顺序的判别表,给出了样品判别结果。
该表个列的内容分别为:
实际所属类别、预测所属类别、贝叶斯判别第一大后验概率、与预测所属类别的重心的马氏距离,以及费希尔判别得分。
从表4.12可以得出:
4个待测样本分别属于第2类、第2类、第1类和第2类。
另外,已知类别样品中第6个样品阿根廷被判错了,由发达国家被判成了发展中国家。
⑾最后由于在save选项中选择了生成表示判别结果的新变量,所以在SPSS的数据编辑窗口可以观察到产生的新变量,其中变量dis-1存放类别样品所属组别的数值,dis-1-1表示样品各变量值代入判别函数所得的判别得分,dis-1-2和dis-2-2分别表示样品属于第一组第二组的贝叶斯后验概率。
五、实验总结
通过这一次实验操作使自己平时所学的理论知识能与实践相结合,熟练掌握了spss软件的一些基本操作方法,学习最重要的的在于学以致用,系统的统计实验训练能将理论知识和实践结合起来。
在解决实际问题时,一定要结合当时的实际背景。
只有定性分析与定量分析相结合,才能得出更加令人信服的结果。
通过本次实验用spass统计分析软件来进行判别分析后,感觉统计学中的很多问题不再像以前那么陌生了,同时也感觉统计学不再是想象中那么困难,之前学习统计学最怕的就是对数据进行求解与分析,现在使用这款软件后,我对它的认识由浅入深,循序渐进,在实践中遇到的各种问题也能逐个攻克。
学习这种在日常工作中有价值的分析方法,会使我更能轻易应付日后的社会的信息工作,掌握这种高级的技能,对我工作就业也提供了竞争优势。
从此,在解决统计方面的问题又多了一项解决的工具:
spss。
实验报告成绩(百分制)__________实验指导教师签字:
__________
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析