数模国赛A题葡萄酒.docx
- 文档编号:4984681
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:36
- 大小:167.55KB
数模国赛A题葡萄酒.docx
《数模国赛A题葡萄酒.docx》由会员分享,可在线阅读,更多相关《数模国赛A题葡萄酒.docx(36页珍藏版)》请在冰豆网上搜索。
数模国赛A题葡萄酒
2012高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
A题葡萄酒的评价
摘要
本文探讨的是判定两组评价结果有无显著性差异,研究葡萄分级,葡萄与葡萄酒理化指标间联系,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响的问题。
首先,不同的两组的评酒员对一种葡萄酒进行品评打分时,打分的高低不同既可能源于不同组的评酒员的差别,也可能源于组内评酒员的差别。
这种特征符合单因素方差分析法的适用问题。
因此,可以利用统计学中单因素方差分析的方法,对每一种酒以组别为控制变量,打分值为观测变量,利用EXCEL2007自带的单因素方差分析功能求解出F检验值和P值,查表得F临界值,在给定
的检验水平下,若
,P<0.05则判断控制变量给观测变量带来了显著影响。
本文对所有55种葡萄酒进行上述判定,得出两组评酒员对部分酒的评分有显著性差异。
因此综合判定两组评酒员的评价结果有显著性差异。
对每一种葡萄酒的评分,不同评酒员的评分有随机性差异,通过研究每组内10位评酒员的评分与本组的评分均值间偏离程度大小可以判别两组评判的可信度。
因此,本文计算出对各种酒两组评酒员评分的方差,得知对于大部分酒,第二组评酒员评分方差更小,评分更稳定,更可信。
其次,要对酿酒葡萄进行分级,需要先确定影响分级的指标。
由于葡萄理化指标较多,且葡萄各理化指标间、葡萄理化指标与葡萄酒质量间的信息相关性和重叠性大,因此,本文对这些指标选用主成分分析法,构造出8个独立且有代表性的主成分指标,用这些主成分指标来代替原有的31个指标。
再建立主成分综合评价模型,将各主成分的贡献率作为权重,利用线性加权得到每种葡萄的综合评价值,并按照综合评价值高低将葡萄分为四级。
再者,要得到酿酒葡萄和葡萄酒的理化指标之间的联系,需要先筛选出两者的共同指标,由于两者之间的联系具有不确定性,因而选用灰色关联度法,选定葡萄酒的一项理化指标,以葡萄酒的该理化指标为参考序列,以同种葡萄筛选出的所有理化指标分别为比较序列,分别求出灰色关联度,得到相同理化指标间的灰色关联度较大,即酿酒葡萄和葡萄酒的相同理化指标之间的联系较大。
进一步分析,对共有的理化指标分别求出葡萄与葡萄酒的关联度大小,得到白藜芦醇,H(D65),总酚,花色苷,单宁5个指标的关联度都大于0.7,表示这几项理化指标葡萄与葡萄酒之间的联系更为紧密。
最后,要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,由于理化指标较多且相互联系,信息重叠量大,故本文先对葡萄和葡萄酒共38个理化指标用主成分分析法,构造出主成分,并按各指标对主成分的载荷大小排序筛选出13个有代表性的指标,再加上由参考文献确定的3个芳香物质指标,共构成16个影响葡萄酒质量的指标。
又考虑各指标对葡萄酒质量不同方面的影响不同,故将葡萄酒质量分为外观,口感,香气,整体5方面单独考虑。
对每一方面而言,筛选出的16个指标对葡萄酒质量的影响方式和影响大小未知,故选用多元线性回归分析法对数据拟合,确立影响较大4或5个指标,再利用这些指标建立多元线性回归模型,得到指标对葡萄酒某方面质量的具体函数关系,并对模型进行检验,论证得到可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量。
关键词:
单因素方差分析主成分综合评价灰色关联度多元线性回归
1.问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量
2.问题分析
本文探讨的是判定两组评价结果有无显著性差异,研究葡萄分级,葡萄与葡萄酒理化指标间联系,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响的问题。
首先,以某一种酒为例,不同的两组的评酒员对该种葡萄酒进行品评打分时,打分的高低不同既可能源于不同组的评酒员的差别,也可能源于组内评酒员的差别。
这种特征符合单因素方差分析法的适用问题。
因此,要判定不同组评酒员对同一种酒的平均评分是否有显著性差异,只考虑第一第二组评酒员对酒的评分的影响,可以利用统计学中单因素方差分析的方法,判定两组对同一种酒是否存在显著性差异,再综合所有55种葡萄酒可以判定这两组评酒员的评价结果有无显著性差异。
其次,要对酿酒葡萄进行分级,需要先确定影响分级的指标。
由于题目中给出的葡萄理化指标较多,且葡萄理化指标间与葡萄酒质量的信息相关性和重叠性大,为了减小指标间的相关性,提高综合评价的可靠性,本文对这些指标选用主成分分析法,得到少量独立的主成分指标,用这些主成分指标来代替原有的大量指标。
再利用得到的主成分指标计算每种葡萄的综合评价值,按照综合评价值排序对葡萄进行分级。
再者,要得到酿酒葡萄和葡萄酒的理化指标之间的联系,需要先筛选出两者的共同指标,又由于两者之间的联系具有不确定性,因而可以选用灰色关联度法,选定葡萄酒的一项理化指标,以葡萄酒的该理化指标为参考序列,以同种葡萄筛选出的所有理化指标分别为比较序列,分别求出灰色关联度,利用关联度大小从而判定出葡萄的各理化指标对葡萄酒该项理化指标的影响大小。
综合得到对葡萄酒各个理化指标影响较大的葡萄理化指标,即判定出酿酒葡萄与葡萄酒的理化指标之间的联系紧密程度。
最后,要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,考虑到各理化指标对葡萄酒质量的不同方面的影响不同,本文将葡萄酒质量分为外观,口感,香气,整体5方面单独考虑。
由于理化指标较多且相互联系紧密,信息重叠量大,故本文先对理化指标用主成分分析法,并按各指标对主成分的载荷大小排序筛选出一些有代表性的指标。
对每一方面而言,酿酒葡萄和葡萄酒的各理化指标对它的影响方式和影响大小未知,故选用多元线性回归分析法对数据进行拟合,确立影响较大的几个指标,再利用这些指标建立多元线性回归模型,从而得到理化指标对葡萄酒某方面质量的具体函数关系。
3.模型的基本假设
1.两组处理条件下的样本是随机的,相互独立的。
2.两组处理条件下的样本分别来自正态分布总体。
3.两组处理条件下的样本方差相同。
4.在线性回归模型中没有遗漏任何重要的解释变量,也没有包含任何多余的解释变量。
4.主要变量符号说明
序号
符号
含义
1
假设
2
第i组总体均值
3
组间离差平方和
4
组内离差平方和
5
F
F检验值
6
n
所有试验结果数
7
r
水平个数
8
对第i个水平,第j次观测结果
9
第i个主成分
10
第i个主成分的贡献率
11
主成分载荷
5.模型的建立与求解
5.1两组评价结果是否存在显著性差异及可信度的判断
首先,以某一种酒为例,不同的两组的评酒员对该种葡萄酒进行品评打分时,打分的高低不同既可能源于不同组的评酒员的差别,也可能源于组内评酒员的差别。
这种特征符合单因素方差分析法的适用问题。
因此,本文选用统计学中单因素方差分析的方法,以组别为控制变量,打分值为观测变量,求出观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。
从而判定两组评价结果是否存在显著性差异。
最后,再综合所有27种红葡萄酒,28种白葡萄酒可以判定这两组评酒员的评价是否存在显著性差异。
5.1.1单因素方差分析模型建立
(1)单因素方差分析基本步骤
1、提出原假设:
2、建立统计量F=
~F(r-1,n-r)
其中组间离差平方和
组内离差平方和
3、对给定的检验水平
,查表确定临界值
(r-1,n-r),使
4、对给定的试验结果计算F的值,判定
若
,则拒绝
;
若
,则接受
。
5.1.2模型求解
(1)以对15号红葡萄酒为例,以组别为控制变量,打分值为观测变量。
利用EXCEL2007自带的单因素方差分析功能求解模型。
1、提出原假设
:
两组评酒员所评分总体均数相等,
2、利用EXCEL2007计算F统计量值,P值
由题知r=2,n=20,
F=
EXCEL求解得下表1:
表1:
单因素方差分析法
SUMMARY
组
观测数
求和
平均
方差
列1
10
548
54.8
83.7333
列2
10
657
65.7
41.3444
方差分析
差异源
SS
df
MS
F
P-value
Fcrit
组间
594.05
1
594.05
9.49889
0.00642
4.41387
组内
1125.7
18
62.5388
总计
1719.75
19
3、给定检验水平
=0.05,查得临界值
=4.41387
4、判定:
,P<0.05,所以拒绝原假设,即得出结论:
两组评酒员的评价结果有显著性差异。
(2)同理可计算得出55组方差分析数据,对共55种葡萄酒的品评中,两组对部分酒的评判有显著性差异,部分没有。
综合得出结论,两组评酒员的评价结果有显著性差异。
5.1.3可信度判定
对每一种葡萄酒的评分,不同评酒员的评分有随机性差异,研究每组内10位评酒员的评分与本组的评分均值间偏离程度大小可以判别两组评判的可信度,偏离程度大,则不可信,反之,可信。
因而,本文分别计算两组10位评酒员的评分方差,通过比较得到,对于27种葡萄酒的评分,第一组10位评酒员的评分方差绝大多数比第二组大,由方差大小比较判定,第二组的评分较为稳定,评分结果更加可信。
5.2酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级
要对酿酒葡萄进行分级,首先要确定影响分级的指标。
由于题目中给出的葡萄理化指标较多,且葡萄理化指标间与葡萄酒质量的信息相关性和重叠性大,为了减小指标间的相关性,提高综合评价的可靠性,本文选用主成分分析法,得到少量独立的主成分指标,用这些主成分指标来代表原有的大量指标。
再建立主成分综合评价模型,利用得到的主成分按各自的贡献率为权数用线性加权求和来计算每种葡萄的综合评价值,最后按照综合评价值排序对葡萄进行分级。
5.2.1主成分分析综合评价模型的建立
(1)对样本数据的标准化
设有n个样品,P个指标,得到的原始资料矩阵
为了实现样本数据的标准化,应求样本数据的平均和方差。
样本数据的标准化是基于数据的平均和方差进行的。
因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化。
对数据矩阵Y作标准化处理,即对每一个指标分量作标准化变换,变换公式为:
其中:
样本均值
样本标准差
得标准化后的数据矩阵
(2)计算相关矩阵
对于给定的n个样本,求样本间的相关系数。
相关矩阵中的每一个元素由相应的相关系数所表示。
其中
(3)求特征值和特征向量
设求得的相关矩阵为R,求解特征方程:
|R-λI|=0
通过求解特征方程,可得到m个特征值(i=1~m),且有
和对应于每一个特征值的单位特征向量:
i=1~m
(4)确定主成分个数
根据求得的m个特征向量,m个主要成分分别为:
i=1,2,...m
最终主成分个数的确定是通过方差累计贡献率G(m)来确定的
当累积贡献率大于85%时,就认为能足够反映原来变量的信息了,对应的m就是抽取的前m个主成分。
(5)计算主成分得分
计算样品在m个主成分上的得分:
i=1,2,...M
(6)求解综合评价值
由主成分各自的贡献率确定各主成分的权重,再用线性加权求和来计算综合评价值。
主成分
的贡献率
为
,综合评价值Q=
5.2.2主成分分析综合评价模型求解
(一)SPSS求解主成分
(1)原始数据
已知影响红葡萄分级的的葡萄理化指标与葡萄酒质量打分值一共31种指标,将27种红葡萄的上述各指标值构造成一个27×31的矩阵,作为原始数据矩阵,原始数据表见附录二。
(2)利用SPSS软件,对数据进行标准化处理,求得相关系数矩阵,见附录三
求解相关矩阵的特征方程|R-λI|=0 的特征根,求出对应的单位特征向量,并通过累计贡献率的大小确定8个主成分,见下表2
表2:
成份矩阵a
主成份
1
2
3
4
5
6
7
8
氨基酸总量
.345
.532
-.110
.469
-.257
-.297
.168
-.012
蛋白质
.663
-.432
.220
.225
.148
-.087
.083
-.135
VC
-.122
-.376
.160
-.075
-.556
.097
-.023
.161
花色苷
.835
.010
.003
-.366
.096
.199
-.094
.063
酒石酸(g/L)
.383
.124
.283
.464
.285
-.107
.204
-.521
苹果酸(g/L)
.308
.443
.255
-.597
.137
.337
-.116
.125
柠檬酸(g/L)
.248
.289
.434
-.249
.399
-.063
.293
-.428
多酚氧化酶活力
.268
.165
-.099
-.621
.286
-.328
-.005
.158
褐变度
.559
.048
.207
-.699
.051
-.089
-.082
.115
dpph
.806
-.390
.046
.118
-.072
.132
.213
.111
总酚
.897
-.117
-.152
.127
-.064
.196
-.011
.088
单宁
.764
-.076
-.194
-.199
-.198
.244
.243
-.057
葡萄总黄酮
.772
-.257
-.177
.182
-.027
.314
.124
.057
白藜芦醇(mg/kg)
.028
.033
.808
.193
-.217
.145
.292
.296
黄酮醇(mg/kg)
.552
.084
.054
-.072
-.133
-.514
.477
.216
总糖
.203
.755
-.281
.293
.087
-.026
-.072
.294
还原糖g/L
.028
.726
-.239
.200
.131
-.107
-.051
.074
可溶性固形物
.193
.727
-.417
.145
.110
-.033
-.024
.263
PH
.330
-.301
.104
.677
.059
-.070
-.284
.230
可滴定酸
-.328
.375
-.631
-.103
-.347
.199
.295
-.135
固酸比
.398
.007
.413
.123
.553
-.076
-.317
.222
干物质含量
.304
.852
-.290
.122
.092
-.016
.054
.033
果穗质量
-.273
-.530
-.201
.033
.567
.100
.229
.086
百里质量
-.462
-.471
-.465
-.001
.241
.174
.222
.193
果梗比
.573
-.100
.266
-.240
-.367
-.438
.088
.041
出汁率
.566
-.143
-.224
.029
-.060
.425
-.143
.008
果皮质量
-.198
-.335
-.577
-.201
.325
-.055
.478
.219
L
-.539
-.359
.310
.035
.083
-.309
.076
.345
A
-.392
.312
.669
.218
-.017
.280
.256
.217
B
-.216
.529
.525
.144
.189
.452
.294
.095
葡萄酒质量评分
.538
-.465
-.338
.440
.155
-.090
-.006
.023
(二)主成分综合评价
(1)主成分值及综合分值计算
利用MATLAB求解得8个特征值的单位特征向量
,见下表3,程序见附录四。
表3:
特征值及对应特征向量表
特征值
7.200
5.132
3.839
3.073
2.030
1.753
1.418
1.271
特征向量
0.129
-0.235
0.056
-0.267
-0.180
-0.224
-0.141
0.010
0.247
0.191
-0.112
-0.129
0.104
-0.066
-0.070
0.120
-0.045
0.166
-0.082
0.043
-0.390
0.073
0.020
-0.143
0.311
-0.005
-0.002
0.209
0.067
0.150
0.079
-0.056
0.143
-0.055
-0.145
-0.265
0.200
-0.081
-0.171
0.462
0.115
-0.196
-0.130
0.341
0.096
0.254
0.098
-0.111
0.093
-0.128
-0.221
0.142
0.280
-0.047
-0.246
0.379
0.100
-0.073
0.050
0.355
0.201
-0.248
0.005
-0.141
0.208
-0.021
-0.106
0.399
0.036
-0.067
0.069
-0.102
0.300
0.172
-0.023
-0.067
-0.050
0.100
-0.179
-0.099
0.334
0.052
0.078
-0.073
-0.045
0.148
0.009
-0.078
0.285
0.033
0.099
0.114
-0.139
0.184
-0.204
0.051
0.288
0.113
0.090
-0.104
-0.019
0.237
-0.104
-0.051
0.010
-0.014
-0.413
-0.110
-0.152
0.109
-0.245
-0.263
0.206
-0.037
-0.028
0.041
-0.094
-0.388
-0.400
-0.191
0.076
-0.333
0.143
-0.167
0.061
-0.019
0.060
-0.261
0.010
-0.320
0.122
-0.114
0.092
-0.081
0.042
-0.066
0.072
-0.321
0.213
-0.083
0.077
-0.025
0.020
-0.233
0.123
0.133
-0.053
-0.386
0.042
-0.053
0.238
-0.205
-0.122
-0.166
0.322
0.059
-0.244
0.150
-0.248
0.120
0.148
-0.003
-0.211
-0.070
0.388
-0.057
0.266
-0.197
0.113
-0.376
0.148
-0.070
0.065
-0.012
-0.046
-0.029
-0.102
0.234
0.103
-0.019
0.398
0.075
-0.192
-0.076
-0.172
0.208
0.237
0.000
0.169
0.131
-0.187
-0.171
0.214
0.044
-0.136
0.137
-0.258
-0.331
-0.074
-0.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数模 葡萄酒