全国大学生数学建模竞赛 A题论文 葡萄酒.docx
- 文档编号:3448016
- 上传时间:2022-11-23
- 格式:DOCX
- 页数:29
- 大小:415.81KB
全国大学生数学建模竞赛 A题论文 葡萄酒.docx
《全国大学生数学建模竞赛 A题论文 葡萄酒.docx》由会员分享,可在线阅读,更多相关《全国大学生数学建模竞赛 A题论文 葡萄酒.docx(29页珍藏版)》请在冰豆网上搜索。
全国大学生数学建模竞赛A题论文葡萄酒
2012高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
2012年9月9日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要:
鉴别葡萄酒时,品酒员根据外观、香气、口感等指标给出的评分可以较为准确的反映葡萄酒的质量,但由于品酒员评分标准的差异,对同种葡萄酒的评分也不尽相同。
而检测酿酒葡萄和葡萄酒的理化指标在一定程度上也可以反应葡萄和葡萄酒的质量。
应用统计学方法对葡萄酒质量进行分析和评价,可以更加了解葡萄酒成分与感官质量之间的关系,为葡萄酒的控制、预测和区分提供一种有效途径。
对此,我们对数据分别采取主成分分析,相关性分析和多元线性回归分析的方法,用回归矩阵明确表示了葡萄酒和酿酒葡萄理化指标之间的关系,并且结合BP神经网络算法,通过对酿酒葡萄及葡萄酒理化指标的分析,准确、智能的给出相应葡萄酒的评分。
针对品酒员评分数据,我们采取t检验的方法观察两组品酒员评分的差异显著性,并且根据各组评酒员的评分与平均分的偏差值确定两组品酒员的可信程度。
在对理化指标分析的过程中,通过相关性分析和主成分分析法筛选出影响葡萄酒评分的主要理化指标,有选择性的忽略无关数据,优化了后续数据处理过程。
BP神经网络可以用理化指标作为评分标准,经过反复学习后,利用其为葡萄酒进行智能评分,与品酒员的评分数据进行比较,评分准确、偏差较小,从而验证了神经网络模型的有效性。
在分析葡萄酒和葡萄理化指标关系时,首先采取相关性分析筛选显著相关指标,剔除不相关指标;然后采取多元线性回归方程
,求出回归系数矩阵
和回归常量矩阵
,对葡萄酒和葡萄的理化指标关系进行明确表征。
关键词:
神经网络;主成分分析;多元线性回归分析
一、问题重述
葡萄酒的质量一般通过聘请一批有资质的评酒员对葡萄酒进行品尝后,对其分类指标打分及求和获得总分而确定。
葡萄酒的质量受酿酒葡萄的直接影响,且葡萄酒和酿酒葡萄的质量可在一定程度上由其检测的理化指标反映。
请参照某年份一些葡萄酒的评价结果(附件1)和这些葡萄酒和其酿酒葡萄的成分数据(附件2、附件3),建立数学模型分析研究下列问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二、问题分析
题中已提供27种红葡萄酒和28种白葡萄酒的品尝评分情况和这些葡萄酒及其酿酒葡萄的理化指标和芳香物质的数据。
主要根据这些数据,分析研究酿酒葡萄的理化指标和质量以及葡萄酒的理化指标、评价结果和质量之间的关联和影响,并论证可否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
针对问题一,考虑每种酒都由两组各十名评酒员评分,可对两组评酒员的品尝评分表进行t检验,分析两组评价结果是否存在显著性差异;在假设所有提供的数据准确可信的前提下,两组评价结果的可信度主要由各组数据相对于整体评分情况的偏差程度衡量。
针对问题二,对附件二和附件三中的葡萄理化指标进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标(以下简称主要指标);再建立神经网络模型,根据葡萄酒品尝评分进行分层抽样,选取与之对应的红、白酿酒葡萄各6种,将其主要指标作为输入数据,对应葡萄酒的品尝评分作为输出数据建立具有一个隐含层的BP神经网络,对神经网络进行训练,使其准确智能的给出葡萄酒的评分,根据评分结果对酿酒葡萄进行分级。
针对问题三,对附件二中酿酒葡萄和葡萄酒所共有的理化指标做相关性分析,筛选出显著相关的理化指标,将葡萄酒理化指标作为因变量
,酿酒葡萄的筛选出显著相关的指标作为自变量
,尝试进行多元线性回归分析
,得出葡萄理化指标和葡萄酒理化指标之间的回归系数矩阵
和回归常量矩阵
。
针对问题四,利用问题二中的神经网络算法可以用葡萄酒理化指标作为评分标准,对葡萄酒质量进行评分,记此项得分为A,A即为早葡萄酒理化指标作用下的葡萄酒质量评分;又由于在问题三中已经得到葡萄理化指标与葡萄酒理化指标间的回归矩阵,因此可先将酿酒葡萄的主要指标转化成葡萄酒的理化指标,再输入到神经网络中运算,输出葡萄酒评分B,即为在酿酒葡萄理化指标作用下的葡萄酒质量评分。
求出A、B均值,即为酿酒葡萄、葡萄酒的理化指标共同作用下的葡萄酒最终质量评分。
将此评分与品酒师评分对比求出相对偏差,以检验模型是否可行、有效。
三、模型假设与约定
1假设附件中所有数据足够真实准确可信
2假设酿酒葡萄和葡萄酒仅与附件中所提供数据相关
四、符号说明及名词定义
两组葡萄酒品尝评分表的双侧检验显著性
两组共20个评酒员对第j种红葡萄酒的第i项指标的平均评分
两组共20个评酒员对第j种白葡萄酒的第i项指标的平均评分
第一组对红葡萄酒品尝评分表的偏差程度
第二组对红葡萄酒品尝评分表的偏差程度
第一组对白葡萄酒品尝评分表的偏差程度
第二组对白葡萄酒品尝评分表的偏差程度
第一组第m个评酒员对第j种红葡萄酒第i项指标的评分
第二组第m个评酒员对第j种红葡萄酒第i项指标的评分
第一组第m个评酒员对第j种白葡萄酒第i项指标的评分
第二组第m个评酒员对第j种白葡萄酒第i项指标的评分
红、白葡萄与葡萄酒指标名称相同的理化指标矩阵
红、白葡萄酒的理化指标矩阵
红、白葡萄多元线性回归系数矩阵
红、白葡萄多元线性回归常量矩阵
神经网络求得红、白葡萄指标分析得分与品酒员评分的相对偏差
经红葡萄酒和酿酒葡萄的理化指标得出的第i种红葡萄酒评分
评酒员对第i种红葡萄酒评分的平均分
经白葡萄酒和酿酒葡萄的理化指标得出的第i种白葡萄酒评分
评酒员对第i种白葡萄酒评分的平均分
五、模型的建立、求解与检验
1问题一的分析求解
(1)分析两组评酒员的评价结果有无显著性差异
为检验两组评酒员的评价结果有无显著差异性,对每一组对红葡萄酒的每一项评分分别求和,作为t检验的样本数据,借助SPSS软件进行t检验分析,所得结果如下:
表格1
一、二组对红葡萄酒各项指标评分的差异显著性成对t检验
评估指标
成对差分
t
df
Sig.
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
外观-澄清度
-0.22222
1.49928
0.09124
-0.40186
-0.04258
-2.435
269
0.016
外观-色调
0.53333
1.75571
0.10685
0.32297
0.74370
4.991
269
0.000
香气-纯正度
-0.32222
2.16680
0.13187
-0.58185
-0.06260
-2.444
269
0.015
香气-浓度
0.00000
1.36608
0.08314
-0.16368
0.16368
0.000
269
1.000
香气-质量
1.05185
1.85464
0.11287
0.82963
1.27407
9.319
269
0.000
口感-纯正度
0.06296
1.85329
0.11279
-0.15910
0.28502
0.558
269
0.577
口感-浓度
-0.01481
1.88709
0.11484
-0.24092
0.21129
-0.129
269
0.897
口感-持久性
-0.00741
1.70281
0.10363
-0.21144
0.19662
-0.071
269
0.943
口感-质量
0.90370
1.49534
0.09100
0.72453
1.08287
9.930
269
0.000
平衡-整体评价
0.56296
1.31961
0.08031
0.40485
0.72108
7.010
269
0.000
由上表,两组评酒员对红葡萄酒评价结果的差异显著性分析如下:
表格2
两组对红葡萄酒评价结果的显著性差异分析
评估指标
Sig
差异显著性
外观-澄清度
0.016*
显著
外观-色调
0.000**
极其显著
香气-纯正度
0.015*
显著
香气-浓度
1.000
基本无差异
香气-质量
0.000**
极其显著
口感-纯正度
0.577
不显著
口感-浓度
0.897
不显著
口感-持久性
0.943
不显著
口感-质量
0.000**
极其显著
平衡-整体评价
0.000**
极其显著
相同方法对白葡萄酒进行分析,结果如下:
表格3
一、二组对白葡萄酒各项指标评分的差异显著性成对t检验
评估指标
成对差分
t
df
Sig.
均值
标准差
均值的标准误
差分的95%置信区间
下限
上限
外观-澄清度
-0.16071
1.37537
0.08219
-0.32251
0.00108
-1.955
279
0.052
外观-色调
-2.03214
2.14084
0.12794
-2.28399
-1.78029
-15.884
279
0.000
香气-纯正度
0.52500
1.20902
0.07225
0.38277
0.66723
7.266
279
0.000
香气-浓度
-1.39286
2.09521
0.12521
-1.63934
-1.14638
-11.124
279
0.000
香气质量
-0.01429
1.53097
0.09149
-0.19439
0.16582
-0.156
279
0.876
口感-纯正度
-0.91429
1.92507
0.11504
-1.14075
-0.68782
-7.947
279
0.000
口感-浓度
-0.09286
1.55840
0.09313
-0.27619
0.09047
-0.997
279
0.320
口感-持久性
0.76429
1.73147
0.10348
0.56059
0.96798
7.386
279
0.000
口感-质量
0.67857
1.94279
0.1161
0.45002
0.90712
5.845
279
0.000
平衡-整体评价
0.11786
1.52766
0.09129
-0.06186
0.29757
1.291
279
0.198
由上表,两组评酒员对红葡萄酒评价结果的差异显著性分析如下:
表格4
两组对白葡萄酒评价结果的显著性差异分析
评估指标
Sig
差异显著性
外观-澄清度
0.052
不显著
外观-色调
0.000**
极其显著
香气-纯正度
0.000**
极其显著
香气-浓度
0.000**
极其显著
香气-质量
0.876
不显著
口感-纯正度
0.000**
极其显著
口感-浓度
0.320*
显著
口感-持久性
0.000**
极其显著
口感-质量
0.000**
极其显著
平衡-整体评价
0.198*
显著
两组评酒员的评价结果显著性差异情况如以上两表所示。
(2)两组评酒员的评价结果的可信度比较
在假设所有提供的数据足够准确可信的前提下,两组评价结果的可信度主要由各组数据相对于整体评分情况的偏差程度衡量。
红、白葡萄酒的偏差程度分别以各自两组评分的平均值为基准,将每一项评估指标两组20人的评分取平均值作为这一项指标得分的基准,即
第一组对红葡萄酒品尝评分表的偏差程度
第二组对红葡萄酒品尝评分表的偏差程度
第一组对白葡萄酒品尝评分表的偏差程度
第二组对白葡萄酒品尝评分表的偏差程度
解得
由于
,
,所以第一组对红、白葡萄酒的品尝评分的偏差程度皆大于第二组,即第二组对红、白葡萄酒的评价结果可信度较高。
2问题二的模型建立与求解
(1).酿酒葡萄的主要指标筛选
由于酿酒葡萄的理化指标项目繁多复杂,为简化理化指标对葡萄酒评分的影响,对附件二中理化指标进行相关性分析和主成分分析。
首先对附件二中对同一指标多次测量的数据做取平均值处理,借助SPSS软件对数据进行相关性分析和主成分分析,筛选出影响葡萄酒评分的主要指标,所得结果如下表所示。
表格5红葡萄指标与酒评分相关性分析表格6白葡萄指标与酒评分相关性分析
显著相关指标
相关系数
蛋白质
0.514**
DPPH
0.407*
总酚
0.448*
葡萄总黄酮
0.504**
颜色b*
-0.435*
颜色C
-0.438*
pH
0.429*
显著相关指标
相关系数
颜色b*
0.539**
颜色C
0.460*
可溶性固形物
0.419*
葡萄总黄酮
-0.364*
酒石酸
0.453*
果穗质量
-0.406*
表格7
红葡萄理化指标的主成分分析结果
主成分
包含成分名称
贡献率(%)
第一主成分
蛋白质,花色苷,DPPH,总酚,单宁,葡萄总黄酮
22.217
第二主成分
总糖,干物质含量,可溶性固形物,颜色a*
37.981
第三主成分
白藜芦醇,颜色b*,颜色c
51.412
表格8
白葡萄理化指标的主成分分析结果
主成分
包含成分名称
贡献率(%)
第一主成分
总糖,干物质含量,果穗质量,颜色b*,颜色C,氨基酸
22.217
第二主成分
总酚,总黄酮,颜色H,酒石酸
37.981
第三主成分
固酸比,可滴定酸,颜色a*
51.412
通过相关性及主成分分析得到决定葡萄酒评分的酿酒葡萄主要指标如下:
红葡萄:
蛋白质、单宁、DPPH、干物质含量、花色苷、颜色b*、颜色C、总酚、葡萄总黄酮、总糖等十项指标;
白葡萄:
氨基酸、干物质含量、果穗质量、固形物、酒石酸、颜色b*、颜色C、总酚、葡萄总黄酮、总糖等十项指标。
(2)BP神经网络模型的建立与酿酒葡萄的分级
对葡萄酒根据品尝评分进行分层抽样,选取综合评分高、中、低的红葡萄酒所对应的酿酒葡萄各2种,将选取出的6种葡萄的10项主要理化指标和对应的葡萄酒评分输入神经网络中,进行学习,训练曲线如下:
图表1BP神经网络对红葡萄指标的训练曲线
图表2BP神经网络对白葡萄指标的训练曲线
分别输入所有红、白葡萄的主要指标到神经网络,得到葡萄的评价结果如下图(其中实线为BP网络评分,虚线为品酒员评分):
图表3BP神经网络与品酒员对红葡萄的评分对比图
图表4BP神经网络与品酒员对白葡萄的评分对比图
根据酿造的葡萄酒的整体评分,假设葡萄分级标准如下:
红葡萄:
8.5分以下为二等,8.5——9.0分为一等,9.分0以上为特等;
白葡萄:
9.0分以下为二等,9.0——9.5分为一等,9.5分以上为特等。
整理所有葡萄得分分级如下表:
表格9红、白葡萄评分
红葡萄序号
BP得分
等级
白葡萄序号
BP得分
等级
9
9.3782
特等
3
9.6751
特等
13
9.2142
17
9.6714
19
9.1783
21
9.6084
14
9.11
5
9.6049
10
9.1043
23
9.5908
2
9.102
28
9.5864
27
9.0778
9
9.5559
25
9.0514
14
9.5493
5
9.0397
4
9.5488
23
9.0271
20
9.5337
26
8.9319
一等
26
9.5246
8
8.9116
11
9.4727
一等
3
8.8997
15
9.4308
16
8.8956
1
9.4006
20
8.8657
13
9.3646
12
8.8523
25
9.2736
4
8.7986
2
9.2002
6
8.7331
8
9.1758
24
8.7279
22
9.171
17
8.6787
10
9.0902
21
8.5375
19
8.8999
二等
22
8.5031
27
8.8498
18
8.4958
二等
6
8.8449
15
8.4633
16
8.8369
7
8.419
24
8.667
1
8.4116
18
8.6538
11
8.4057
12
8.6141
7
8.6117
3问题三的模型建立与求解
在附件二葡萄的理化指标中分别选取与葡萄酒理化指标一一对应的十项理化指标,作为葡萄酒理化指标的自变量进行分析。
假设葡萄酒理化指标分别与葡萄的理化指标有如下线性关系:
其中葡萄的理化指标为自变量X,葡萄酒的理化指标为因变量Y,矩阵
为多元线性回归系数矩阵,
为多元线性回归常量矩阵。
为简化多元线性回归模型,对葡萄酒的每个理化指标分别与所选出的葡萄理化指标做相关性分析,筛选出显著相关的理化指标,排除不显著相关的理化指标以简化模型。
借助SPSS软件进行相关性分析,得到数据如下(空白处表示变量间无相关性):
表格10红葡萄与红葡萄酒理化指标相关系数
花色苷
总酚
单宁
总黄酮
白藜芦醇
DPPH
颜色L1
颜色a
颜色b
颜色H
颜色C
酒花色苷
.923
.613
.661
.441
.569
酒总酚
.774
.875
.743
815
.814
-.443
酒单宁
.720
.817
.718
.684
.753
-.464
酒总黄酮
.709
.883
.701
.823
.764
酒白藜芦醇
.459
.567
.421
酒DPPH
.671
.875
.700
.814
.778
.-392
酒色L1
.-834
.754
.677
.609
-.707
.494
.593
酒色a
.573
.-626
.-542
.526
酒色b
酒色H
-.443
酒色C
-.399
-.533
-.463
-.454
表格11白葡萄与白葡萄酒理化指标相关系数
总酚
单宁
总黄酮
白藜芦醇
DPPH
颜色L1
颜色a
颜色b
颜色H
颜色C
酒总酚
.547
.573
.588
.450
.499
酒单宁
.428
.574
.495
.409
.377
酒总黄酮
.744
.697
.607
酒白藜芦醇
酒DPPH
.422
.425
.428
.387
酒色L
酒色a
.401
.434
.364
酒色b
.409
酒色H
.430
.361
酒色C
.412
借助SPSS软件对二者进行多元线性回归分析,得到参数变换矩阵如下(空白处为零):
表格12红葡萄与红葡萄酒理化指标相关系数
表格13白葡萄酒与白葡萄对应参数变换矩阵
根据以上参数矩阵,可以得出葡萄酒与酿酒葡萄理化指标之间的关系,其表达式为
红葡萄:
白葡萄:
4问题四的模型建立、求解与检验
(1)模型建立与求解
首先利用问题二中的神经网络,将葡萄酒理化指标作为输入数据,输出葡萄酒评分A。
类比问题三中多元回归分析的方法,得到红、白葡萄理化指标中影响葡萄酒评分的10种主要指标与对应葡萄酒理化指标的变换矩阵如下:
表格14红葡萄十项主要指标与对应葡萄酒理化指标回归矩阵
表格15白葡萄十项主要指标与对应葡萄酒理化指标回归矩阵
据此矩阵将酿酒葡萄理化指标中影响葡萄酒评分的10项主要指标转化为成葡萄酒的理化指标,再将得到的葡萄酒理化指标作为输入数据,利用神经网络中进行评分,输出葡萄酒评分B。
将葡萄酒评分A、B取均值,得到以下数据
表格16由红葡萄酒和酿酒葡萄的理化指标得出的红葡萄酒评分
序号
评分
序号
评分
序号
评分
1
8.4117
10
8.9986
19
8.9735
2
9.0816
11
8.5947
20
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国大学生数学建模竞赛 A题论文 葡萄酒 全国大学生 数学 建模 竞赛 论文