第五章数据分析梅长林习题.docx
- 文档编号:1036382
- 上传时间:2022-10-15
- 格式:DOCX
- 页数:12
- 大小:163.88KB
第五章数据分析梅长林习题.docx
《第五章数据分析梅长林习题.docx》由会员分享,可在线阅读,更多相关《第五章数据分析梅长林习题.docx(12页珍藏版)》请在冰豆网上搜索。
第五章数据分析梅长林习题
第五章数据分析(梅长林)习题
第五章习题
1.习题
解:
假定两总体服从正态分布,且协方差矩阵
,误判损失相同又先验概率按比例分配,通过SAS计算得到先验概率如表:
ClassLevelInformation
group
Variable
Name
Frequency
Weight
Proportion
Prior
Probability
G1
G1
6
G2
G2
8
即:
又计算可得:
有计算的总体协防差距矩阵S为:
PooledWithin-ClassCovarianceMatrix,DF=12
Variable
x1
x2
x1
x2
并且:
计算广义平方距离函数:
并计算后验概率:
回代判别结果如下:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
1
G1
G1
2
G1
G1
3
G1
G1
4
G1
G2
*
5
G1
G1
6
G1
G1
7
G2
G2
8
G2
G2
9
G2
G2
10
G2
G2
11
G2
G2
12
G2
G2
13
G2
G2
14
G2
G2
由此可见误判的回代估计:
若按照交叉确认法,定义广义平方距离如下:
逐个剔除,交叉判别,后验概率按下式计算:
通过SAS计算得到表所示结果。
发现同样也是属于G1的4号被误判为G2,因此误判率的交叉确认估计为
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
1
G1
G1
2
G1
G1
3
G1
G1
4
G1
G2
*
5
G1
G1
6
G1
G1
7
G2
G2
8
G2
G2
9
G2
G2
10
G2
G2
11
G2
G2
12
G2
G2
13
G2
G2
14
G2
G2
其中
=,
,又因为
,所以
,
最后可得后验概率p为:
习题
解:
(1)在
并且先验概率相同的的假设前提下,建立矩离判别的线性判别函数。
利用SAS的procdiscrim过程首先计算得到总体的协方差矩阵,如表:
PooledWithin-ClassCovarianceMatrix,DF=25
Variable
x1
x2
x3
x4
x5
x6
x7
x8
x1
2.
-0.
0.
x2
0.
4.
x3
0.
-0.
3.
1.
1.
0.
x4
-2.
1.
5.
2.
0.
x5
1.
5.
8.
3.
x6
0.
0.
2.
3.
4.
0.
x7
0.
x8
4.
0.
0.
2.
各个总体的马氏平方距离见表:
GeneralizedSquaredDistancetogroup
Fromgroup
G1
G2
G1
0
G2
0
线性判别函数为:
得到训练样本回判法判别结果如表:
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
训练样本的交叉确认判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
17
G1
G2
*
19
G1
G2
*
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
(2)假设两总体服从正态分布,先验概率按比例分配且误判损失相同,在两总体协方差矩阵相同,即
的条件下进行Bayes判别分析,通过SASdiscrim过程得到结果:
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
交叉确认判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
19
G1
G2
*
25
G2
G1
*
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
在
,并且先验概率按比例分配的假设前提下利用SAS的procdiscrim过程进行Bays判别分析,这时以个总体的训练样本单独估计各总体的协方差矩阵,可到的训练样本的回判和交叉确认结果:
回判结果:
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
交叉确认判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
21
G2
G1
*
22
G2
G1
*
23
G2
G1
*
24
G2
G1
*
25
G2
G1
*
26
G2
G1
*
27
G2
G1
*
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
(3)在不同的假设前提,采用不同判别方法得到待判样本的判别结果:
1.距离判别分析得到西藏、上海、广东的判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Classifiedintogroup
G1
G2
1
G2
2
G2
3
G2
2.在协方差矩阵相同的前提下,Bayes对西藏、上海、广东的判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Classifiedintogroup
G1
G2
1
G2
2
G2
3
G2
3在协方差不同矩阵相同的前提下,Bayes对西藏、上海、广东的判别结果:
PosteriorProbabilityofMembershipingroup
Obs
Classifiedintogroup
G1
G2
1
G1
2
G1
3
G1
3.习题
解:
(1)假设两总体服从正态分布且在两总体协方差矩阵相同,即
,先验概率按相同的条件下进行Bayes判别分析,通过SASdiscrim过程得到结果:
首先得到线性判别函数:
回代误判结果:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
9
G1
G2
*
29
G2
G1
*
由计算结果发现,第9号样本被误判到G2,29号样本被误判到G1.误判率为%
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
交叉确认判别结果:
由计算发现总共有四个样本被判错,分别是9、28、29、35号样品。
累计误判率为%
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
9
G1
G2
*
28
G2
G1
*
29
G2
G1
*
35
G2
G1
*
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
(1)假设两总体服从正态分布且在两总体协方差矩阵相同,即
,先验概率按比例分配且误判损失相同的条件下进行Bayes判别分析,通过SASdiscrim过程得到结果:
首先得到线性判别函数:
LinearDiscriminantFunctionforgroup
Variable
G1
G2
Constant
x1
x2
x3
x4
x5
x6
x7
回代误判结果
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
9
G1
G2
*
29
G2
G1
*
ErrorCountEstimatesforgroup
G1
G2
Total
Rate
Priors
交叉确认误判结果:
PosteriorProbabilityofMembershipingroup
Obs
Fromgroup
Classifiedintogroup
G1
G2
5
G1
G2
*
9
G1
G2
*
11
G1
G2
*
12
G1
G2
*
29
G2
G1
*
35
G2
G1
*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 数据 分析 梅长林 习题