营养素聚类分析.docx
- 文档编号:27731880
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:16
- 大小:55.74KB
营养素聚类分析.docx
《营养素聚类分析.docx》由会员分享,可在线阅读,更多相关《营养素聚类分析.docx(16页珍藏版)》请在冰豆网上搜索。
营养素聚类分析
聚类分析作业
100244119田刘芬
下表给出美国制造商生产的早餐方便粥数据。
先将数据用不同的聚类方法进行聚类分析,并进行合理的分类,且说明理由。
解:
首先对数据进行初步分析,对各个指标做简单的描述性统计分析.
表一
由表一可知,8个指标的数量级各不相同,平均数从0.98到180.47不等,标准差也有很大差异,所以数据量纲之间具有很强的差异性.为了消除量纲影响,我们在聚类分析之前先对数据进行标准化处理.
(1)最短距离法
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingSingleLinkage
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case33
Case44
Case1515
Case88
Case2424
Case3636
Case1717
Case2828
Case3030
Case99
Case1919
Case2121
Case1414
Case1616
Case77
Case1212
Case2020
Case3535
Case3333
Case2323
Case2525
Case55
Case3232
Case3838
Case3939
Case11
Case66
Case1111
Case4040
Case2222
Case1010
Case1313
Case3434
Case2727
Case2929
Case3131
Case2626
Case22
Case3737
Case4141
Case4242
Case4343
******HIERARCHICALCLUSTERANALYSIS******
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
(1)Case1818
各类样本个数表
1
2
3
4
5
6
7
8
WardMethod(8)
35
1
1
1
1
1
2
1
WardMethod(7)
36
1
1
1
1
2
1
WardMethod(6)
37
1
1
1
2
1
WardMethod(5)
37
2
1
2
1
WardMethod(4)
39
1
2
2
WardMethod(3)
41
1
1
由上表可知,将43各样本分为五组比较合适。
以下探究各类别之间是否具有显著性差异,以及各个类别具有怎样的特征。
由上表可知,各个类别之间在卡路里、蛋白质、钠、纤维、碳水化合物、糖、钾这七个变量上具有显著性差异,且这种差异具有统计意义。
在脂肪这种营养素上不具有差异。
综合以上分析,将43个样本分为五类比较合理。
第一类:
营养均衡早餐。
这一类别包含多数早餐样本。
第二类:
高碳水化合物早餐。
这一类别包括2号样本和37号样本。
第三类:
高纤维素早餐。
这一类别包括18号样本
第四类:
低卡路里零脂肪早餐。
这一类别包括41、42号样本。
第五类:
高脂肪早餐。
43号样本属于此类。
(2)最长距离法
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingCompleteLinkage
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case33
Case44
Case1515
Case88
Case2424
Case3636
Case1919
Case2121
Case2525
Case3838
Case3939
Case11
Case1111
Case4040
Case66
Case1010
Case2222
Case1313
Case3434
Case2727
Case2929
Case3131
Case22
Case3737
Case2020
Case3535
Case2323
Case3333
Case77
Case1212
Case1717
Case2828
Case3030
Case55
Case1414
Case1616
Case99
Case3232
Case2626
Case4141
Case4242
Case4343
******HIERARCHICALCLUSTERANALYSIS******
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case1818
1
2
3
4
5
6
7
8
WardMethod(8)
12
2
10
10
5
1
2
1
WardMethod(7)
12
2
15
10
1
2
1
WardMethod(6)
22
2
15
1
2
1
WardMethod(5)
22
17
1
2
1
WardMethod(4)
22
17
1
3
WardMethod(3)
39
1
3
由上表可知,将样本分为七类比较合适。
经过检验可知,各类别之间所有变量都具有显著性差异,且统计意义良好。
综上所述,七类分别是:
第一类:
营养均衡早餐。
该类别包括1、3、4、8、15等12个样品。
第二类:
高蛋白质早餐。
该类别包括2、37号早餐样品。
第三类:
高碳水化合物早餐。
这一类中包括5、7、9、12、14、16等15个样本。
第四类:
高卡路里高脂肪早餐。
该类包括6、10、11、13等10个样本。
第五类:
高纤维素早餐。
包括18号早餐。
第六类:
零脂肪早餐。
包括41、42号早餐
第七类:
零钠高钾早餐。
包括43号早餐。
(3)重心法
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingCentroidMethod
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case33
Case44
Case1515
Case88
Case2424
Case3636
Case1919
Case2121
Case2525
Case1717
Case2828
Case3030
Case55
Case3838
Case3939
Case11
Case66
Case77
Case1212
Case2020
Case3535
Case2323
Case3333
Case1414
Case1616
Case99
Case3232
Case1111
Case4040
Case2222
Case1010
Case1313
Case3434
Case2727
Case2929
Case3131
Case2626
Case22
Case3737
Case4141
Case4242
Case4343
******HIERARCHICALCLUSTERANALYSIS******
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case1818
1
2
3
4
5
6
7
8
WardMethod(8)
31
2
3
1
1
2
2
1
WardMethod(7)
31
2
5
1
1
2
1
WardMethod(6)
36
2
1
1
2
1
WardMethod(5)
37
2
1
2
1
WardMethod(4)
39
1
2
1
WardMethod(3)
41
1
1
由上表可知,各个类别之间在卡路里、蛋白质、钠、纤维、碳水化合物、糖、钾这七个变量上具有显著性差异,且这种差异具有统计意义。
在脂肪这种营养素上不具有差异。
综合以上分析,将43个样本分为八类比较合理。
第一类:
营养均衡早餐。
该类别包括大多数早餐样品。
第二类:
高蛋白质早餐。
该类别包括2、37号早餐样品。
第三类:
高卡路里早餐。
这一类中包括13、27、34号早餐。
第四类:
高纤维素早餐。
该类包括18号样本。
第五类:
零脂肪早餐。
包括26号早餐。
第六类:
高碳水化合物早餐。
包括29、31号早餐
第七类:
低糖低热量早餐。
包括41、42号早餐。
第八类:
零钠早餐。
包括43号早餐。
(4)组间平均距离法
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingAverageLinkage(BetweenGroups)
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case33
Case44
Case1515
Case88
Case2424
Case3636
Case1919
Case2121
Case2525
Case3838
Case3939
Case11
Case1717
Case2828
Case3030
Case55
Case66
Case77
Case1212
Case2020
Case3535
Case2323
Case3333
Case1414
Case1616
Case99
Case3232
Case2626
Case1111
Case4040
Case2222
Case1313
Case3434
Case2727
Case1010
Case2929
Case3131
Case22
Case3737
Case4141
Case4242
Case4343
******HIERARCHICALCLUSTERANALYSIS******
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
Case1818
1
2
3
4
5
6
7
8
WardMethod(8)
27
2
6
3
1
1
2
1
WardMethod(7)
27
2
9
1
1
2
1
WardMethod(6)
28
2
9
1
2
1
WardMethod(5)
37
2
1
2
1
WardMethod(4)
39
1
2
1
WardMethod(3)
41
1
1
由上表可知,各个类别之间在卡路里、蛋白质、钠、纤维、碳水化合物、糖、钾、脂肪这八个变量上具有显著性差异,且这种差异具有统计意义。
综合以上分析,将43个样本分为六类比较合理。
第一类:
营养均衡早餐。
该类别包括大多数早餐样品。
第二类:
高蛋白质早餐。
该类别包括2、37号早餐样品。
第三类:
高卡路里早餐。
这一类中包括10、11、13等九种早餐。
第四类:
高纤维素早餐。
该类包括18号样本。
第五类:
零脂肪早餐低卡路里早餐。
包括41、42号早餐。
第六类:
低碳水化合物高脂肪早餐。
包括43号早餐
对比以上几种聚类方法可知,最短距离法和重心法的分类没有通过类间显著性检验。
最长距离法和组间平均距离法都通过了显著性检验,但是最长距离法将样本分为七类组间平均距离法分为六类,且组间距离法各类中样本分布均匀程度较最长距离法好。
所以,组间距离法的聚类效果最好。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 营养素 聚类分析