数学建模A题优秀论文59135.docx
- 文档编号:8187692
- 上传时间:2023-01-29
- 格式:DOCX
- 页数:37
- 大小:249.01KB
数学建模A题优秀论文59135.docx
《数学建模A题优秀论文59135.docx》由会员分享,可在线阅读,更多相关《数学建模A题优秀论文59135.docx(37页珍藏版)》请在冰豆网上搜索。
数学建模A题优秀论文59135
2012高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名):
1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:
年月日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要
葡萄酒的质量评价是研究葡萄酒的一个重要领域,目前葡萄酒的质量主要由评酒师感官评定。
但感官评定存在人为因素,业界一直在尝试用葡萄的理化指标或者葡萄酒的理化指标定量评价葡萄酒的质量。
本题要求我们根据葡萄以及葡萄酒的相关数据建模,并研究基于理化指标的葡萄酒评价体系的建立。
对于问题一,我们首先使用EXCEL对附件一中的数据进行平均值处理(见正文表5-1、表5-2),再通过方差分析法比较两组品酒员对红白葡萄酒评分的波动性大小。
通过对总分平均值和方差大小的观察,可以知道两组评分具有显著性差异,而且第二组评分结果更加可信。
对于问题二,我们采用主成分分析和主成分估计的方法,对红白酿酒葡萄的一级理化指标进行了数据标准化处理,基于主成分分析法对其进行了因子分析,并得到相关系数矩阵B。
进而得到酿酒葡萄各单指标的特征值和特征向量(见正文表5-3、表5-7)。
根据特征值的大小,选取十个主成分理化指标,并根据它们的百分比求得其在整体中的贡献率和累计贡献率,并以这些指标来代表所有的酿酒葡萄。
此时,根据附件二中的代表理化指标的比重和所求的贡献率求得各种红白酿酒葡萄的综合评价得分(见正文表5-5、表5-9)。
然后根据得分高低排序,并自定区间分为四个等级(见正文表5-6、表5-10)。
对于问题三,首先对附件二中酿酒葡萄和葡萄酒共同的一级理化指标通过EXCEL进行处理,多次测试的指标求取其平均值作为参考数据。
其中,红葡萄酒有五个理化指标共有(见正文表5-12),白葡萄酒有四个理化指标共有(见正文表5-13)。
利用SPSS软件中的T检验的简单相关性分析原理,分析理化指标之间的相关性,然后构造出相关图,更直观合理的表现显著相关关系。
对于问题四,利用问题二得到的主成分理化指标,分析附件2中葡萄酒所有的理化指标,同样使用主成分分析的方法对葡萄酒的理化指标进行数据标准化、计算相关系数矩阵等操作。
最后我们使用偏相关分析的原理和多元线性回归的方法对所有的17种理化指标进行处理,得到线性回归方程,相关性强即说明线性关系比较明显,对其质量的影响较大。
关键词:
主成分分析、偏相关分析、数据标准化、相关系数、SPSS软件T检验、
MATLAB、多元线性回归
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:
1.分析附件1中两组品酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析
2.1问题一
针对问题一,判断两组品酒员的评价结果有无显著性差异和结果的可靠性比较,我们通过计算平均值和方差来观察。
对于同一组品酒员同一种类的葡萄酒,根据每一位品酒员的总分求和,再求平均值,得出红白葡萄酒的整体平均值,可以直接比较评价结果有无显著差异性。
再将得出的整体平均值和红白葡萄酒不同酒样品的平均值结合求出两组品酒员评价结果的方差,根据波动性的大小,判断哪一组结果更可信。
2.2问题二
针对问题二,根据酿酒葡萄的理化指标和葡萄酒的质量,使用主成分分析的方法对这些酿酒葡萄进行分级。
首先对原始数据进行标准化处理,计算出相关系数矩阵,通过计算出的特征值和特征向量来选择数个主成分,从而计算出综合评价值,最后根据综合评价分数的高低对葡萄酒进行分级。
2.3问题三
针对问题三,根据附件2中提供的酿酒葡萄与葡萄酒的理化指标数据,分析他们之间的联系。
首先我们通过EXCEL对数据进行处理,挑选出两者共有的理化指标,多次测量的求取其平均值作为参考数据,整理归纳之后,利用SPSS软件T检验求出理化指标的相关系数和标准误差,并分析它们之间的联系。
2.4问题四
针对问题四,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
我们利用问题二得到的主成分理化指标,分析附件2中葡萄酒所有的理化指标,同样使用主成分分析的方法对葡萄酒的理化指标进行数据标准化、计算相关系数矩阵等操作。
最后我们使用偏相关分析的原理和多元线性回归的方法对所有的17种理化指标进行处理,相关性强即说明线性关系比较明显,对其质量的影响较大。
三、基本假设
1、两组品酒员之间的分数是相对独立的;
2、两组品酒员是随机分配的;
3、制作葡萄酒的工艺和酿酒环境都是统一且稳定的;
4、假设品酒员的系统误差较小,忽略不计;
5、只考虑红葡萄酿成红葡萄酒,白葡萄酿成白葡萄酒,而不考虑多种葡萄混合酿成的葡萄酒;
6、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质量;
7、假设文中引用到的数据和其他文章内容都真实可信。
四、符号说明
:
酿酒红葡萄综合评价得分;
:
酿酒白葡萄的总额和评价得分;
:
酿酒红葡萄中十种主成分指标的比重;
:
酿酒白葡萄中十种主成分指标的比重;
:
两种样本之间同一理化指标之间的相关系数;
:
在控制了第
个因素的影响所计算的第
、
第二个因素之间的偏相关系数;
:
用红葡萄酿成的红葡萄酒的质量(因变量);
:
用红葡萄酿成的红葡萄酒的16个理化指标(自变量);
:
用白葡萄酿成的白葡萄酒的质量(因变量);
:
用白葡萄酿成的白葡萄酒的15个理化指标(自变量)。
五、模型的建立与求解
5.1判断两组品酒员的评价结果有无显著性差异和结果的可靠性比较
根据附件一提供的数据,以红葡萄酒的评价结果为例,利用EXCEL分别计算出十位品酒员对27中红葡萄酒样品的平均值,如表5-1所示。
红葡萄酒得分均值
酒样品
分组
酒样品1
酒样品2
酒样品3
酒样品4
酒样品5
酒样品6
酒样品7
第一组
62.7
80.3
80.4
68.6
73.3
72.2
71.5
第二组
68.1
74
74.6
71.2
72.1
66.3
65.3
酒样品
分组
酒样品8
酒样品9
酒样品10
酒样品11
酒样品12
酒样品13
酒样品14
第一组
72.3
81.5
74.2
70.1
53.9
74.6
73
第二组
66
78.2
68.8
61.6
68.3
68.8
72.6
酒样品
分组
酒样品15
酒样品16
酒样品17
酒样品18
酒样品19
酒样品20
酒样品21
第一组
58.7
74.9
79.3
59.9
78.6
78.6
77.1
第二组
65.7
69.9
74.5
66.7
72.6
75.8
72.2
酒样品
分组
酒样品22
酒样品23
酒样品24
酒样品25
酒样品26
酒样品27
第一组
77.2
85.6
78
69.2
73.8
73
第二组
71.6
77.1
71.5
68.2
72
71.5
表5-1
由图表数据计算可知,第一组对红葡萄酒的整体平均分为73.05556分,第二组对红葡萄酒的整体平均分为70.56296分,由此可见,第一组对红葡萄酒的评价较第二组要高一些。
同理,我们用同样的方法对白葡萄酒进行计算比较,如表5-2所示。
白葡萄酒得分均值
酒样品
分组
酒样品1
酒样品2
酒样品3
酒样品4
酒样品5
酒样品6
酒样品7
第一组
82
74.2
78.3
79.4
71
68.4
77.5
第二组
77.9
75.8
75.6
76.9
81.5
75.5
74.2
酒样品
分组
酒样品8
酒样品9
酒样品10
酒样品11
酒样品12
酒样品13
酒样品14
第一组
71.4
72.9
74.3
72.3
63.3
65.9
72
第二组
72.3
80.4
79.8
71.4
72.4
73.9
77.1
酒样品
分组
酒样品15
酒样品16
酒样品17
酒样品18
酒样品19
酒样品20
酒样品21
第一组
72.4
74
78.8
73.1
72.2
77.8
76.4
第二组
78.4
67.3
80.3
76.7
76.4
76.6
79.2
酒样品
分组
酒样品22
酒样品23
酒样品24
酒样品25
酒样品26
酒样品27
酒样品28
第一组
71
75.9
73.3
77.1
81.3
64.8
81.3
第二组
79.4
77.4
76.1
79.5
74.3
77
79.6
表5-2
由图表数据计算可知,第一组对白葡萄酒的整体平均分为74.01071分,第二组对白葡萄酒的整体平均分为76.53214分,由此可见,第二组对白葡萄酒的评价较第一组要高一些。
根据以上数据,使用MATLAB编程求取每一组对红白葡萄酒的方差。
第一组对红葡萄酒评价结果的方差为53.9141,第二组对红葡萄酒评价结果的方差为15.3755;第一组对白葡萄酒评价结果的方差为23.0788,第二组对白葡萄酒评价结果的方差为10.0547。
由此可知,第一组评价结果的方差明显比第二组要大,所以两组品酒员的评价结果具有显著性差异,且第二组的评价结果更为可靠。
5.2根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级
(1)主成分分析的相关知识
主成分分析(principalcomponentanalysis)是1901年Pearson对非随机变量引入的,1933年Hotelling将此方法推广到随机向量的情形,主成分分析和聚类分析有很大的不同,它有严格的数学理论作基础。
主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。
通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。
由此可见,主成分分析实际上是一种降维方法。
(2)主成分分析法的步骤
1)对原始数据进行标准化处理
根据对附件二中数据的分析,整理出红白酿酒葡萄和红白葡萄酒中各成分的含量,对于多次测量的数据我们采用平均值作为参考数据。
再MATLAB中用ZSCORE函数直接对原始数据进行标准化处理。
2)计算相关系数矩阵B
根据得出的标准化数据,使用MATLAB中的CORRCOEF函数直接得出相关系数矩阵B。
3)计算特征值和特征向量
计算相关系数矩阵B中的特征值和特征向量,使用EIG函数直接得出。
酿酒红葡萄的特征值如表5-3所示。
红葡萄的特征值
指标
特征值
氨基酸总量
蛋白质
VC含量
花色苷
酒石酸
苹果酸
特征值
0.0000
0.0000
0.0000
0.0000
0.0034
0.0102
指标
特征值
柠檬酸
多酚氧化酶活力
褐变度
DPPH自由基
总酚
单宁
特征值
0.0159
0.0324
0.0431
0.0615
0.0712
0.1120
指标
特征值
葡萄总黄酮
白藜芦醇
黄酮醇
总糖
还原糖
可溶性固形物
特征值
0.2002
0.2180
0.2538
0.2948
0.3728
0.4936
指标
特征值
PH值
可滴定酸
固酸比
干物质含量
果穗质量
百粒质量
特征值
0.5139
0.6907
0.7377
0.9615
1.2694
1.4187
指标
特征值
果梗比
出汁率
果皮质量
果皮颜色L*
果皮颜色a*
果皮颜色b*
特征值
1.7414
1.9998
2.8403
3.7341
4.9414
6.9682
表5-3
根据上表计算得出的特征值大小,在上述30个指标中选取较大的十个指标,分别是果皮颜色b*、果皮颜色a*、果皮颜色L*、果皮质量、出汁率、果梗比、百粒质量、果穗质量、干物质含量和固酸比十种,根据他们所占的百分比可求得各种指标的贡献率和累计贡献率,整理如图表5-4所示。
指标
特征值
贡献率
累计贡献率
果皮颜色b*
6.9682
23.227
23.227
果皮颜色a*
4.9414
16.471
39.698
果皮颜色a*
3.7341
12.447
52.145
果皮质
2.8403
9.467
61.612
出汁率
1.9998
6.666
68.278
果梗比
1.7414
5.8046
74.0826
百粒质量
1.4187
4.729
78.8116
果穗质量
1.2694
4.2313
83.0429
干物质含量
0.9615
3.205
86.2479
固酸比
0.7377
2.459
88.7429
表5-4
4)选择主成分,计算综合评价值
根据得出的贡献率大小可以看出,这十个指标的累计贡献率都比较大,所以选取这十个指标成分为酿酒红葡萄的主成分。
这里我们采用了主成分估计的方法,即将原来的回归自变量变换到另一组变量,即主成分,选择其中一部分重要的主成分作为新的自变量(此时丢弃了一部分,影响不大的自变量,这实际达到了降维的目的)。
所以我们在基于主成分分析的评价体系之下,由累计贡献率得到贡献率,即作为因子的综合评分的权重,不同品种葡萄的总评价得分的表达式即为:
(1)
对27种酿酒红葡萄通过公式
(1)进行统计计算,可得出总分如图表5-5所示。
红葡萄的总评价得分
红葡萄
得分
红葡萄1
红葡萄2
红葡萄3
红葡萄4
红葡萄5
红葡萄6
红葡萄7
总分
0.5365
0.3986
0.3913
0.4873
1.0480
0.5761
0.3993
排名
17
26
27
21
2
13
25
红葡萄
得分
红葡萄8
红葡萄9
红葡萄10
红葡萄11
红葡萄12
红葡萄13
红葡萄14
总分
0.6108
0.5421
0.6605
0.5162
0.5837
0.4874
0.5652
排名
10
16
8
18
12
20
14
红葡萄
得分
红葡萄15
红葡萄16
红葡萄17
红葡萄18
红葡萄19
红葡萄20
红葡萄21
总分
0.5160
0.4415
0.9680
0.6006
0.5422
0.8795
0.4525
排名
19
23
4
11
15
5
22
红葡萄
得分
红葡萄22
红葡萄23
红葡萄24
红葡萄25
红葡萄26
红葡萄27
总分
0.4233
0.7227
1.0344
0.7294
1.4061
0.6490
排名
24
7
3
6
1
9
表5-5
根据表5-5中计算出的总分,通过四个区间划分四个等级,四个区间为(0.3,0.5),(0.5,0.7),(0.7,0.9),(0.9,1.5),得到酿酒红葡萄的等级划分如图表5-6所示。
红葡萄等级
等级
酿酒红葡萄种类
一级
26、5、24、17
二级
20、25、23
三级
10、27、8、18、12、6、14、19、9、1、11、15
四级
13、4、21、16、22、7、2、3
表5-6
根据同一种方法,可求得酿酒白葡萄的特征值如图表5-7所示。
白葡萄的特征值
指标
特征值
氨基酸总量
蛋白质
VC含量
花色苷
酒石酸
苹果酸
特征值
0.0000
0.0000
0.0000
0.0010
0.0036
0.0129
指标
特征值
柠檬酸
多酚氧化酶活力
褐变度
DPPH自由基
总酚
单宁
特征值
0.0167
0.0568
0.0639
0.0851
0.1195
0.2191
指标
特征值
葡萄总黄酮
白藜芦醇
黄酮醇
总糖
还原糖
可溶性固形物
特征值
0.2704
0.3102
0.3383
0.4264
0.4707
0.7176
指标
特征值
PH值
可滴定酸
固酸比
干物质含量
果穗质量
百粒质量
特征值
0.8527
0.9321
1.0323
1.1958
1.3276
1.4695
指标
特征值
果梗比
出汁率
果皮质量
果皮颜色L*
果皮颜色a*
果皮颜色b*
特征值
1.5673
1.8720
2.1078
3.7277
5.0914
5.7116
表5-7
同理,根据上表计算得出的特征值大小,在上述30个指标中选取较大的十个指标,分别是果皮颜色b*、果皮颜色a*、果皮颜色L*、果皮质量、出汁率、果梗比、百粒质量、果穗质量、干物质含量和固酸比十种,根据他们所占的百分比可求得各种指标的贡献率和累计贡献率,整理如图表5-8所示。
指标
特征值
贡献率
累计贡献率
果皮颜色b*
5.7116
19.035
19.035
果皮颜色a*
5.0914
16.698
35.733
果皮颜色a*
3.7277
12.425
48.158
果皮质
2.1078
7.025
55.183
出汁率
1.8720
6.239
61.422
果梗比
1.5673
5.2242
66.6462
百粒质量
1.4695
4.898
71.5442
果穗质量
1.3276
4.4252
75.9694
干物质含量
1.1958
3.9859
79.9553
固酸比
1.0323
3.441
83.3963
表5-8
基于主成分分析的评价体系之下,由累计贡献率得到贡献率,即作为因子的综合评分的权重,不同品种葡萄的总评价得分的表达式即为:
(2)
对28种酿酒白葡萄通过公式
(2)进行统计计算,可得出总分如图表5-9所示。
白葡萄的总评价得分
白葡萄
得分
白葡萄1
白葡萄2
白葡萄3
白葡萄4
白葡萄5
白葡萄6
白葡萄7
总分
5.4676
4.2358
5.8966
3.9074
4.0371
6.4058
5.6057
排名
12
21
9
25
22
7
11
白葡萄
得分
白葡萄8
白葡萄9
白葡萄10
白葡萄11
白葡萄12
白葡萄13
白葡萄14
总分
6.9602
4.6762
5.1731
7.3001
6.8431
6.9369
4.4607
排名
3
19
15
2
5
4
20
白葡萄
得分
白葡萄15
白葡萄16
白葡萄17
白葡萄18
白葡萄19
白葡萄20
白葡萄21
总分
9.9875
6.5263
3.9638
6.0746
5.0971
5.1256
3.7371
排名
1
6
24
8
17
16
26
白葡萄
得分
白葡萄22
白葡萄23
白葡萄24
白葡萄25
白葡萄26
白葡萄27
白葡萄28
总分
3.2668
5.3287
5.7281
4.7295
4.0001
5.2995
2.8329
排名
27
13
10
18
23
14
28
表5-9
同理,根据表5-9中计算出的总分,通过四个区间划分四个等级,四个区间为(2,4),(4,6),(6,8),(8,10),得到酿酒白葡萄的等级划分如图表5-10所示。
白葡萄等级
等级
酿酒白葡萄种类
一级
15
二级
11、8、13、12、16、6、18
三级
3、24、7、1、23、27、10、20、19、25、9、14、2、5、26
四级
17、4、21、22、28
表5-10
5.3分析酿酒葡萄与葡萄酒的理化指标之间的联系
(1)SPSS软件中T检验简单相关性分析有关原理
相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。
相关系数一般可以通过计算得到。
作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母ρ表示。
相关系数的数值范围是介于–1与+1之间(即–1≤r≤1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。
两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。
如果其绝对值等于零1,则表示两个变量完全直线相关。
如果其绝对值为零,则表示两个变量完全不相关(不是直线相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 优秀论文 59135