数学建模葡萄酒的质量分析比赛一等奖.docx
- 文档编号:9574998
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:57
- 大小:275.93KB
数学建模葡萄酒的质量分析比赛一等奖.docx
《数学建模葡萄酒的质量分析比赛一等奖.docx》由会员分享,可在线阅读,更多相关《数学建模葡萄酒的质量分析比赛一等奖.docx(57页珍藏版)》请在冰豆网上搜索。
数学建模葡萄酒的质量分析比赛一等奖
葡萄酒的质量分析
摘要
据考古学家考证,人类在10000年前的新石器时代就开始了采集野生葡萄果实与进行天然的葡萄酒酿造。
而中国古代即有各种野生葡萄,古人称葡萄为蒲桃,为皇家果园的珍奇果品。
周朝已有蒲桃的记载。
葡萄酒历史悠久,在今天也越来越受广大人民的喜爱,我们将在本文中对葡萄酒的评价与葡萄酒与酿酒葡萄之间的联系建立模型。
针对问题1:
我们要分析两组评酒员的评价结果有无明显差异。
我们先求出它们的方差进行对比,在评价酒的质量的好坏时,要考虑外观、香气、口感和平衡(整体),将它们综合起来才是评价葡萄酒的综合标准。
我们求出每一个小组对某一种酒的评价的平均值与方差,用Matlab程序作出对应的方差波动图。
通过两组数据和图的对比,可看出第一小组的变化波动比第二组的变化波动大。
因此,我们认为第二组的评价结果更可信。
针对问题2:
在附录二中葡萄酒的理化指标只取一级指标,剔除二级指标。
对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共27个指标。
为了把指标复杂的关系进行简化,对理化指标用spss做主成分分析并求解第i样红葡萄综合指数Zi。
Zi=
+b1i=1,2,3…..27,n=1,2…7
同理可求白葡萄的综合指数,然后根据所求解得到的数据Zi进行分段划分,进而划分酿酒葡萄的级别:
红葡萄酒为:
第一类:
得分大于2,9、23。
第二类:
得分2~1,3、17、2、20。
第三类:
得分1~0,14、5、19。
第四类:
得分小于-2,10、25、15、18、7、11。
白葡萄酒为:
第一类,得分大于2:
17、22。
第二类,得分2~0:
5、9、28、10、21、27、1。
第三类,得分0~-2,26、2、18、13、14、7。
第四类,得分小于-2:
12、8、11、16。
针对问题3:
所用的方法和问题2一样,我们仍用主成分分析法来建立模型。
首先分析酿酒葡萄与葡萄酒理化指标间的联系,葡萄酒中的花色苷、单宁、总酚、酒总黄酮、白黎芦醇、DPPH半抑制体积、色泽等影响着葡萄酒的质量。
我们从问题2中找出影响葡萄酒较大的酿酒葡萄的理化指标,将葡萄酒的理化指标和这些数据拟合中一起,再用SPSS程序计算出结果,就可以直接得到他们之间的相关矩阵。
针对问题四:
在评价葡萄酒的质量时,我们要考虑外观,香气,口感和平衡/评价。
将问题2和问题3中求出的相互影响的主要数据综合中一起,建立相应的模型:
再用SPSS程序计算出最后的结果为:
=89.308-0.002x1+1.727x2-1.615x3+……+0.0.148x17(红葡萄酒)
=69.105-0.595x1-0.789x2-0.256x3+……+0.085x16(白葡萄酒)
关键词:
线性回归MatlabSPSS主成分分析法
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
附件1:
葡萄酒品尝评分表(含4个表格)
附件2:
葡萄和葡萄酒的理化指标(含2个表格)
附件3:
葡萄和葡萄酒的芳香物质(含4个表格)
二、符号说明
酿酒葡萄的不同的理化指标
各葡萄样本与主成分的关系矩阵
酿酒葡萄理化指标提取的主成分对应理化指标中的贡献率
各葡萄酒评分量纲化处理后的数值
主成分
与其贡献率
的乘积加上葡萄酒评分数值构成线性组合
为y的估计值或预测值
A为截距(常数项)
Bi为偏回归系数
三、问题分析
问题1
要建立一个模型判断两组评酒员评价酒的价值时有无显著性差异,我们在解题的过程中,首先对附录一中的数据进行处理,每一个评酒员对每一种酒的评价都不一样。
我们在数据处理时,先求出它们对某一种酒的评价的分数,再求出这一小组对这种酒的评价均值与评价的无偏方差。
建立表格,将这些评价的分数综合在一起,这样有利于我们对比第一、二组对不同酒的评价。
就红葡萄酒和白葡萄酒之间不同的评价与评价的方差,我们可以用Matlab程序分别作出第一、二组的方差对比图和t,F的检验,根据第一、二组的评价的方差的波动大小,我们就可以清晰地看出他们之间的变化差异。
问题2
题目中要求我们要建立一个模型根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。
题目对葡萄酒样品给出了葡萄酒品尝评分表、理化指标分析表和芳香物质分析表。
由于酿酒葡萄酒理化指标分析表和芳香物质分析表无法直接对葡萄酒的质量进行判断。
因此,把酿酒葡萄的理化指标作为对葡萄酒质量的评定。
在处理数据时,由于数据太多,我们将酿酒葡萄的理化指标综合,用主成分分析法处理酿酒葡萄的理化指标,将所有指标用spss缩减为几个主成分,根据附录二给出的数据,用主成分分析法建立相应的数学模型,对葡萄进行分级。
问题3
在这个问题中需要我们建立模型分析酿酒葡萄与葡萄酒的理化指标自己的关系。
在葡萄酒的理化指标中,花色苷、单宁、总酚、酒总黄酮、白黎芦醇、DPPH半抑制体积、色泽等都是影响葡萄酒质量的因素。
而我们根据问题二的结果从酿酒葡萄的理化指标中选出几个主要成分做一个文件,根据相应的数据,将酿酒葡萄与影响葡萄酒的主要因素用SPSS软件计算出他们之间的相关矩阵,我们可以认为相关矩阵中显示出的数据就是酿酒葡萄与葡萄酒的理化指标之间的联系。
问题4
在这个问题中,我们需要同时考虑酿酒葡萄和葡萄酒的理化指标,再分析它们对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
在解决问题的过程中,我们可以根据问题2和问题3得出的结论选出影响的主要因素结合附录一葡萄酒的质量的平均值,建立多元线性回归模型,用SPPS软件计算出结果。
四、模型假设
1、在建立模型的过程中,只针对给出的这几种酒,不考虑其他酒的影响;
2、葡萄酒的质量不考虑芳香物质的影响只考虑理化指标的影响;
3、葡萄酒的二级理化指标的信息全部反应在相对应得一级理化指标中。
五、模型的建立和求解
问题1:
我们先找出每组中每一个评酒员对于某一种酒的评价总分,再求出这一组对这种酒的评价均值,以与他们的无偏方差,他们的计算方式如下:
评价均值=1/10*(评酒员1的评价+评酒员2的评价+···+评酒员10的评价)
无偏方差=1/9*[(评酒员1的评价-评价均值)^2+……+(评酒员10的评价-评价均值)^2]
根据他们的计算结果,我们得出下表数据:
酒样号
第一组对红葡萄酒的评价
第一组对白葡萄酒的评价
第二组对红葡萄酒的评价
第二组对白葡萄酒的评价
评价均值
无偏方差
评价均值
无偏方差
评价均值
无偏方差
评价均值
无偏方差
1
62.7
92.9
82
92.22222
68.1
81.87778
77.9
25.87778
2
80.3
39.78889
74.2
201.0667
74
16.22222
75.8
49.06667
3
80.4
45.82222
85.3
365.1222
74.6
30.71111
75.6
142.4889
4
68.6
108.0444
79.4
44.71111
71.2
41.28889
76.9
42.1
5
73.3
62.01111
71
126.4444
72.1
13.65556
81.5
26.27778
6
72.2
59.73333
68.4
162.7111
66.3
21.12222
75.5
22.72222
7
71.5
103.6111
77.5
39.16667
65.3
62.67778
74.2
42.17778
8
72.3
44.01111
71.4
183.6
66
65.11111
72.3
31.12222
9
81.5
32.94444
72.9
92.76667
78.2
25.73333
80.4
106.2667
10
74.2
30.4
74.3
212.6778
68.8
36.17778
79.8
70.4
11
70.1
70.76667
72.3
177.1222
61.6
38.04444
71.4
87.82222
12
53.9
79.65556
63.3
115.7889
68.3
25.12222
72.4
140.0444
13
74.6
44.93333
65.9
170.7667
68.8
15.28889
73.9
46.76667
14
73
36
72
114.2222
72.6
23.15556
77.1
15.87778
15
58.7
85.56667
72.4
131.6
65.7
41.34444
78.4
54.04444
16
74.9
18.1
74
178
69.9
20.1
67.3
82.23333
17
79.3
88.01111
78.8
144.1778
74.5
9.166667
80.3
38.45556
18
60.1
42.76667
73.1
156.5444
65.4
50.26667
76.7
30.23333
19
78.6
47.37778
72.2
46.4
72.6
55.15556
76.4
26.04444
20
78.6
26.04444
77.8
64.4
75.8
39.06667
76.6
50.04444
21
77.1
116.1
76.4
172.7111
72.2
35.51111
79.2
64.4
22
77.2
50.62222
71
138.6667
71.6
24.26667
79.4
53.6
23
85.6
32.48889
75.9
43.65556
77.1
24.76667
77.4
11.6
24
78
74.88889
73.3
111.1222
71.5
10.72222
76.1
38.54444
25
69.2
64.62222
77.1
33.87778
68.2
43.73333
79.5
106.5
26
73.8
31.28889
81.3
72.9
72
41.55556
74.3
102.9
27
73
49.77778
64.8
144.4
71.5
20.5
77
35.55556
28
81.3
80.45556
79.6
25.37778
根据以下图表,我们可以用excel分别计算出第一、二组对红葡萄酒和白葡萄酒的评价的无偏方差对比,利用matlab(程序见附录1)可以便捷的绘制出第一、二组的变化波动,如下(蓝线表示第一组,红线是第二组):
图一表示两组对红葡萄酒的评价的方差波动
图二表示两组对白葡萄酒的评价的方差波动
通过对比,我们还可以把两个图合并在一起看,如下:
图三两个组对红、白葡萄酒的评价方差的对比
根据以上的图一、图二与图三,都可以看出第一组的评价方差波动比第二组的评价方差波动大,我们就可以认为在评酒时,第二组的结果更可信。
问题二:
在解决这个问题时,葡萄酒的理化指标分为一级指标和二级指标,由于二级指标都在一级指标中进行反应,故剔除二级指标。
对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共27个指标。
由于指标太多,并且多指标之间往往存在着一定程度的相关性。
为了把指标复杂的关系进行简化,对理化指标做主成分分析。
主成分分析模型:
酿酒葡萄的无量纲化理化指标有27个,设为X1,X2……X27。
令X=(X1,X2……X27),假定存在二阶矩阵,其均值和协方差分别记为
.主成分的方差依次递减,重要性依次递减,即
。
如果第一主成分表达的信息不够,这依次往下找。
主成分对整个数据的反应能力越强,则它对数据的贡献率越大。
一般,累积贡献率达到85%左右就可以说对数据有了较好的反映。
将数据(附录2中酿酒葡萄的数据)带入SPSS,得出结果.
综合评价模型:
酿酒葡萄的分级和酿酒葡萄的理化指标、葡萄酒的质量有关。
葡萄的评分决定葡萄酒的质量,设评分量纲化数值为b1,b2,b3,,,bx。
通过主成分分析酿酒葡萄的理化指标进行将变量缩减。
由于以上数据都做了量纲化处理,所以这些数据可以进行比较。
主成分
与其贡献率
加上葡萄酒评分数值构成线性组合,其中
的累积贡献率很大,这些主成分可代表理化指标的信息。
考虑到酿酒葡萄与葡萄酒的质量、酿酒葡萄的理化指标有关。
令综合数值Z:
即Z1=
+b1
由于各样品的综合成分值各不一样。
当得分越高时,样品葡萄的等级越高。
将酿酒红葡萄的理化指标带入SPSS软件中,进行主成分分析。
提取主要结果为:
解说总变异量
成份
初始特徵值
平方和負荷量萃取
總和
變異數的%
累積%
總和
變異數的%
累積%
1
6.452
23.896
23.896
6.452
23.896
23.896
2
4.639
17.181
41.077
4.639
17.181
41.077
3
3.292
12.194
53.271
3.292
12.194
53.271
4
2.833
10.492
63.762
2.833
10.492
63.762
5
1.958
7.251
71.013
1.958
7.251
71.013
6
1.288
4.772
75.785
1.288
4.772
75.785
7
1.202
4.452
80.237
1.202
4.452
80.237
上图表给出了各个因子的贡献率,第1个因子的贡献率是23.896%,第2个因子的贡献率是17.181%,第3个因子的贡献率是12.194%,第3、4、5、6、7、8因子的贡献率分别是10.492%、7.251%、4.772%、4.452%,这7个因子的累积贡献率达到80.273%,则这7个因子能反应足够的信息。
成分矩阵
成份
1
2
3
4
5
6
7
氨基酸总量
.313
.573
-.108
.466
-.188
-.199
-.100
蛋白质
.645
-.480
-.078
.271
.216
-.174
-.118
VC含量
-.124
-.423
-.055
-.011
-.552
.193
.030
花色苷
.851
-.038
.181
-.313
.042
.142
.039
酒石酸
.394
.068
-.368
.387
.341
-.532
.100
苹果酸(g/L)
.389
.295
-.144
-.672
.015
.276
.254
柠檬酸
.306
.143
-.402
-.363
.379
-.459
.272
多酚氧化酶活力
.290
.169
.191
-.587
.282
-.024
-.290
褐变度
.598
-.037
-.029
-.708
-.015
.094
-.073
DPPH自由基
.785
-.405
.156
.211
-.059
-.037
.142
总酚
.874
-.082
.264
.214
-.079
.072
.085
单宁
.747
-.069
.372
-.076
-.227
-.150
.266
葡萄总黄酮
.738
-.215
.320
.274
-.047
.024
.262
白藜芦醇
.110
-.190
-.729
.078
-.226
.140
.434
总糖
.203
.828
.055
.263
.092
.246
.049
还原糖
.008
.778
-.003
.132
.140
.101
-.060
可溶性固体
.186
.827
.224
.150
.106
.175
.041
ph
.310
-.264
-.151
.695
.137
.324
-.218
可滴定酸
-.375
.488
.543
-.006
-.367
-.234
.227
固酸比
.438
-.072
-.401
-.002
.539
.364
-.128
干物质含量
.304
.898
.088
.095
.090
-.012
.093
果穗质量
-.316
-.463
.323
.071
.582
.036
.172
百粒质量
-.532
-.346
.552
.082
.236
.114
.156
果梗比
.579
-.153
-.174
-.205
-.335
-.204
-.309
出汁率
.556
-.121
.352
.153
-.071
.221
.159
果皮质量
-.288
-.178
.677
-.100
.332
-.075
.214
果皮颜色
-.393
.036
-.674
.017
.041
.167
.480
上图为27个指标与7个因子之间的相关系数表。
通过SPSS分析,即将27个指标精简为7个主成分。
从图上可以看出,不同的理性指标与各因子的相关系数不一样。
例如:
将红葡萄样品1的各指标乘以图表上的相关系数,求到的是红葡萄样品1与因子1的相关系数。
红葡萄样品1表达式为:
用上面求的Y值与7个主成分的贡献率、评分数值来求综合数值Z。
综合评价方程如下:
Z1=
+b1
Z2=
+b2
Zm=
+bm
得到27个葡萄样品的得分
红葡萄
综合指数
红葡萄
综合指数
红葡萄
综合指数
葡萄样品11
-2.763
葡萄样品12
-0.47983
葡萄样品19
0.345305
葡萄样品7
-1.54231
葡萄样品16
-0.4546949
葡萄样品5
0.639452
葡萄样品18
-1.8789
葡萄样品4
-0.24562
葡萄样品14
0.65257
葡萄样品15
-1.562
葡萄样品27
-0.15653
葡萄样品20
1.215429
葡萄样品25
-1.1879
葡萄样品1
-0.06426
葡萄样品2
1.24568
葡萄样品10
-1.52562
葡萄样品26
0.16594
葡萄样品17
1.34782
葡萄样品6
-0.46305
葡萄样品22
0.2456509
葡萄样品3
1.47
葡萄样品13
-0.7834
葡萄样品21
0.25496
葡萄样品23
2.2205
葡萄样品8
-0.7807
葡萄样品24
0.33742
葡萄样品9
2.36
根据以上图表中的数据,可对葡萄样品进行分类,我们将它分为四类:
第一类:
得分大于2,9、23。
第二类:
得分2~1,3、17、2、20。
第三类:
得分1~0,14、5、19。
第四类:
得分小于-2,10、25、15、18、7、11。
酿酒白葡萄的主成分分析法如上:
可提取出主要成分为9种:
解说变异量
成份
初始特征值
平方和负荷量萃取
总和
變異數的%
积累%
总和
變異數的%
积累%
1
5.721
20.431
20.431
5.721
20.431
20.431
2
4.660
16.644
37.075
4.660
16.644
37.075
3
2.837
10.132
47.208
2.837
10.132
47.208
4
2.079
7.424
54.631
2.079
7.424
54.631
5
1.885
6.732
61.363
1.885
6.732
61.363
6
1.652
5.902
67.265
1.652
5.902
67.265
7
1.498
5.349
72.614
1.498
5.349
72.614
8
1.253
4.475
77.089
1.253
4.475
77.089
9
1.089
3.890
80.979
1.089
3.890
80.979
同时,还可以得到成分矩阵表,如下:
成分矩阵
成份
1
2
3
4
5
6
7
8
9
氨基酸总量
.547
.281
.091
.535
.008
.111
.067
.155
.062
蛋白质
.071
.714
-.002
-.312
.085
-.208
-.278
.058
-.051
VC含量
-.338
-.224
-.475
-.337
.149
.360
.376
.031
.063
花色苷
-.249
-.449
.381
.290
.027
.213
.125
-.503
.150
酒石酸
.458
-.384
.157
.229
.284
.505
.156
.303
.066
苹果酸
.034
.414
.017
.602
.382
.258
-.249
.014
-.199
柠檬酸
.268
.028
.334
.065
.181
.418
-.421
.014
.108
多酚氧化酶活力
-.340
-.482
.132
-.192
-.149
.288
-.370
-.269
-.080
褐变度
.151
.141
-.162
-.603
.390
-.038
-.361
.200
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 葡萄酒 质量 分析 比赛 一等奖