数学建模A题范文Word下载.docx
- 文档编号:21801915
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:27
- 大小:273.57KB
数学建模A题范文Word下载.docx
《数学建模A题范文Word下载.docx》由会员分享,可在线阅读,更多相关《数学建模A题范文Word下载.docx(27页珍藏版)》请在冰豆网上搜索。
葡萄酒的评价
摘要
本文是关于葡萄酒评价方面的问题,具体分析阐述了对评酒员评价结果的分析检验和酿酒葡萄的分级,应用matlab,excel,spss等软件,结合F检验、聚类分析、典型相关分析等各种统计学方法,研究了葡萄、葡萄酒的理化指标与葡萄酒质量之间的联系。
针对问题一,本文利用excel软件对各组评酒员的评分进展了整理和分析。
在此根底上,对各个样品计算两组评价员评分的样本方差
和方差D,运用F检验公式:
检验是否有显著性差异,结果为:
两组评酒员对红葡萄酒样品5、17、24的评价结果有显著性差异,其它样品无显著性差异;
对白葡萄酒样品2、、5、6、8、14、18、27的评价结果有显著性差异,对其它样品无显著性差异;
且第二组评酒员的结果更加可信。
针对问题二,考虑到葡萄酒的质量受酿酒葡萄的直接影响,我们首先根据葡萄酒的得分通过聚类分析得到初步排名,之后集合主成分分析法和相关性分析得出影响葡萄酒质量的主要理化指标加权求和得到新的排名,结合两个方面结果是,红酒中好酒有3、9、23差酒有10、25;
白葡萄酒中好酒有5、28差酒有16、13、8。
针对问题三,我们先使用spss软件对各个理化指标进展典型相关性分析,筛选出有较大相关性的成分,然后运用matlab软件进展一元线性回归,得到一元回归模型:
即葡萄的理化指标X与葡萄酒的理花指标Y之间的线性关系。
针对问题四,可以与三题相似的方法,即典型相关性分析,找出理化指标中与葡萄酒的质量有较大相关性的物质,然后用这些物质与葡萄酒的质量进展多元线性回归,
得到如下回归函数:
并且通过验证,我们认为可以用葡萄的蛋白质、DPPH自归基、葡萄总黄酮、PH值、果皮颜色a、果皮颜色b和葡萄酒的总黄酮、白藜芦醇、DPPH半抑制体来评价葡萄酒的质量。
关键词:
F检验;
K-均值分类;
主成分分析;
典型相关性分析;
一元线性回归;
多元线性回归;
一问题重述
这次论文要解决的问题是葡萄酒的评价问题,葡萄酒的评价是个很抽象和模糊的概念,没有固定的指标可以测量,每个人对同一种葡萄酒的评价都会不一样,而且,这对一个人的味觉要求特别高,必须要经过一定的训练才能掌握这样技巧,于是,评酒员这一职业就诞生了,实际生活中,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进展品评。
每个评酒员在对葡萄酒进展品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
有了以上数据以后,需要我们完成以问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进展分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二根本假设
1、所有的葡萄均正常,没有腐烂变质的现象。
2、所有葡萄酒在由一样工艺酿制而成。
3、所有葡萄酒都储存在一样材料的容器中。
4、所有的理化指标均测量无误。
三符号说明
~
葡萄中各理化指标
葡萄酒中各理化指标
检验
方差
样本方差
四问题分析
葡萄酒的评价是一个复杂的过程,需要综合考虑不同评价员的评分,而且葡萄酒和葡萄的组成成分非常复杂,它们也要影响葡萄酒的质量,对如此繁多的数据,我们就必须依靠计算机工具,运用数学统计学知识对它们进展处理,并找出各个含量之间的关系,联系生活实际,对葡萄酒作出有理有据的评价。
对于问题一:
要想得到两组评价员的评价结果有无显著差异,并对它们的可靠性作出判断,我们首先就应该将两组评价员的对27组红葡萄酒和28组白葡萄酒的评价结果整理出来,再运用统计学中的F检验进展假设与检验,再通过计算各组评价员的评价结果的方差和区分度,进而判断谁的结果更加可信。
对于问题二:
需要对葡萄进展分级,由于葡萄酒的质量与酿酒葡萄的好坏有直接关系,所以我们可以根据葡萄酒的质量对酿酒葡萄做一个简单的分级,之后,我们用主成分分析法算出每一组样本葡萄的哪些指标该葡萄的主成分,然后通过数据分析判断出这些成分哪些对葡萄酒的质量作出了贡献,筛选出主要成分后,对不同葡萄的成分做加权求和,以此作为葡萄分级的另一个依据。
对于问题三:
要想得到葡萄与葡萄酒的指标间的联系,即得到它们之间的函数关系表达式,我们必须对各种指标进展插值和拟合处理。
但是,由于它们各自的指标太多,也不知道互相之间谁与谁有关系,有什么样的关系,所以不能草率地进展拟合。
为此,首先必须要对数据进展筛选和比拟,为此可以采用spss软件进展典型相关性分析,找出酿酒葡萄部和葡萄酒部各指标之间的相关性,和酿酒葡萄的指标与葡萄酒的指标间的相关性,从而选出具有代表性的指标进展拟合,得到一元线性回归方程。
对于问题四:
题中想要求出理化指标对质量的影响,即各理化指标与质量的线性或非线性关系,但是,由于理化指标太多,并且并非没个理化指标都会对葡萄酒的质量造成影响,所以首先必须进展数据的筛选,这里我们使用spss软件进展典型相关性分析,找出哪些指标与质量有较大的关系,然后将这些指标设为自变量,将质量设为因变量,对它们进展多元线性拟合,最后得到一个多元表达式以后,我们就可以通过这个方程来对葡萄酒的质量进展验证,如果验证的结果与评价员打分的结果根本吻合的话,就说明可以用葡萄与葡萄酒的理化指标来对葡萄酒的质量进展评价。
五模型的建立与求解
5.1模型的准备
为了方便下面模型的建立与求解,我们需要对附件中的数据进展预处理,计算出下面需要用到的数据,例如,各个数据的平均值,方差,样本方差等,并制成表格,对于葡萄的分级,我们可以上网参考一下国家标准或者国外葡萄酒工业兴旺国家的标准进展分级。
5.2问题1模型的建立与求解
根据题一的要求,要求得两组评价员的评价结果有无显著性差异,就必须求出两组评价员的评价结果。
对于红葡萄酒样品一,我们先求出第一组评价员的所打分数的平均值,如下表所示:
评酒员
组数
1
2
3
4
5
6
7
8
9
10
第一组
51
66
49
54
77
61
72
74
62
第二组
68
71
80
52
53
76
73
70
67
表一:
对红葡萄酒样品一的评价表
对于评价结果我们采用F检验法,采用公式:
其中
,
我们假设
:
第一组数与第二组数无明显差异,计算F的值,得到F=1.134618,取显著性水平
,查F分布表得和。
由于0.2481<
1.134618<
4.03,所以承受原假
设,即认为两组数据无明显差异。
同样的,对于红葡萄酒和白葡萄酒的所有样品使用上述方法检验,得到它们的F值,然后比拟它们是否在0.2481与4.03之间,判断它们是否有无显著性差异得到下表:
表二:
红葡萄酒的评价
样品
F
差异
无
有
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
表三:
白葡萄酒的评价
171
28
通过观察上表,我们可以得到如下结论:
对于红葡萄酒,两组评酒员对第样品5、17、24的评价结果有显著性差异,对其它样品无显著性差异;
对于白葡萄酒,两组评酒员对样品2、、5、6、8、14、18、27的评价结果有显著性差异,对其它样品无显著性差异。
接下来我们就应该对两组评价员的评价结果进展判断,找出谁的评价结果更加可信,我们就用谁的结果,因此,
第一步:
计算两组评价员对红、白葡萄酒评价的方差D
根据公式
,得到如下方差表:
表四:
对红葡萄酒评价的方差
一组
二组
表五:
对白葡萄酒评价的方差
83
181
329
40
114
146
35
165
191
44
128
38
96
63
159
104
154
103
118
160
130
141
42
58
79
126
45
155
125
39
100
30
48
93
32
那么,为了更加直观地看出这两组评价员谁的评价结果的方差大小,我们用excel作出他们对白、红葡萄酒的方差折线图如下:
图一:
两组评酒员对白葡萄酒评价的方差
图二:
两组评酒员对红葡萄酒评价的方差
从上面两幅折线图中,我们可以看出,无论是对于白葡萄酒还是对于红葡萄酒,第二组评价员评价结果的方差普遍小于第一组,那么我们可以认为,第一组评价员在评价同一种样品时,各个组员间的评价结果差异不大,评价结果更加稳定,即我们认为第二组的评价结果更加可信。
5.3问题2模型的建立、求解与分析
问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进展分级,葡萄酒由酿酒葡萄酿制而成,如此酿酒葡萄的质量与葡萄酒的质量有着直接的关系,如此可以根据葡萄酒的质量对酿酒葡萄做一个简单的分级,在根据主成分分析从葡萄的理化指标中筛选出对葡萄质量产生影响的主要因素,根据所得各主要因素的贡献率给个因素加权作为系数,求出葡萄中主成分的含量,并进展排名,之后将此排名与之前根据葡萄酒质量所得出的排名综合,进而得出较准确的对酿酒葡萄的分级。
首先,根据第一问得出的结果,我们采用第二组评酒员的结果作为判断葡萄酒质量的依据,根据各葡萄酒的,我们得出了红葡萄酒和白葡萄酒的排名,虽然是,葡萄酒质量的排名,但由于葡萄酒的质量由酿酒葡萄的质量决定,所以上表可以看作是葡萄质量的排名,以上表中葡萄酒的分数作为酿酒葡萄质量的分数,可以对酿酒葡萄作出初步的分级,针对葡萄酒的成绩,我们用聚类分析的方法,得出了葡萄的初步分级,运行的得到的图样如下:
图三:
红葡萄酒的聚类分析图样
图四:
白葡萄酒的聚类分析图样
以以上K-均值聚类分子为依据我们得到的对葡萄的分级如下表所示:
表六:
以葡萄酒质量为准的红葡萄分级
等级
葡萄种类
优
2、3、9、17、23、20
良
4、5、14、19、21、22、24、26、27
中
1、10、12、13、16、25
差
6、7、8、11、15、18
表七:
以葡萄酒质量为准的白葡萄分级
5、9、17
1、10、15、21、22、25、28
2、3、4、6、7、13、14、18、19、20、23、24、26、27
18、11、12、16
虽然酿酒葡萄所对应葡萄酒的质量能在一定程度上反映酿酒葡萄的质量,但葡萄的质量还应以葡萄本身的成分来区分其级别,为了得到更准确的分级,我们又对附件中所给酿酒葡萄中的理化指标做了一些分析。
首先我们将指标中的二级指标去掉,的到27组一级指标,对这些指标,做出主成分分析,以累积贡献率达到85%为准得到9个主要成分,得到的贡献率结果如下:
表八:
主成分分析结果
特征根
贡献率
在以上过程得到的九个指标中,我们做出了酿酒葡萄中各成分含量与其名次的散点图,找出与名次相关性较大的几种物质,主要有花色苷、总酚、DPPH自由基、单宁。
而其他物质如总糖如此与葡萄酒名次相关性不大,得到的图像如下:
图五:
单宁含量随相应葡萄酒名次的变化关系
图六:
总酚含量随相应葡萄酒名次的变化关系
图七:
DPPH自由基含量随相应葡萄酒名次的变化关系
图八:
花色苷含量随相应葡萄酒名次的变化关系
图九:
葡萄总黄酮含量随相应葡萄酒名次的变化关系
总糖含量随相应葡萄酒名次的变化关系
由以上各图知,单宁、总酚、DPPH自由基的含量越高,红酒的名次越靠前。
而总糖含量与名次并没有明显关系。
花色苷、葡萄总黄酮等物质的含量与名次有与单宁相似关系,由于图太多,这里不予展示。
根据以上结果和总成分分析中得到的各物质的贡献率,我们各主要成分加上权重作为系数,对酿酒葡萄的主要成分做加权求和,得到,酿酒葡萄主成分的总含量,并作出排序。
得到结果后,将此结果与之前用葡萄酒的到的排名求和得到一组数,以这组数为准再次对酿酒葡萄进展分级,以红酒为例结果如下:
表九:
红葡萄以两种方式所得排名的比拟综合
红葡萄酒
分数
主成分含量
分数名次
主成分名次
名次总和
34
41
37
33
综和上表容,我们对红葡萄酒作出如下分级:
表十:
红葡萄分级
3、9、23
10~25
21、19、22、2、20、12、17、6
25~40
5、14、4、24、1、7、18、16、8、26、11、13、15
10、25
用一样的方法,我们可以得到白葡萄的分级如下:
表十一:
白葡萄分级
5、28
10、25、15、9、27、24、3、4、21、20、22、17
23、26、14、2、1、6、18、7、12、19、11
16、13、8
5.4问题3模型的建立与求解
根据问题三的要求,要想得到葡萄与葡萄酒的指标间的联系,即得到它们之间的函数关系表达式,我们必须对各种指标进展插值和拟合处理。
为此,首先必须要对数据进展筛选和比拟,从而选出具有代表性的指标进展拟合。
我们采用spss软件进展典型相关性分析,找出酿酒葡萄部和葡萄酒部各指标之间的相关性,和酿酒葡萄的指标与葡萄酒的指标间的相关性。
步骤如下:
我们用x1到x34表示酿酒葡萄的34个指标,用y1到y9表示葡萄酒的9个指标,用spss软件酿酒葡萄部各指标间的相关性系数,如如下出了系数大于0.8的各个物质与其相关系数:
表十二:
酿酒红葡萄部各指标的相关性系数表
X11
X13
X30
X31
X32
X33
X34
X10
X29
从上面两个表中可以看出:
X10、X11、X13之间的相关性系数很大且都为正,这就表示他们之间高度正相关,他们具有相似的变化规律,所以我们只选择其中的X13进展下一步的分析,同理地,在X29、X30、X31、X32、X33、X34之中,我们选择X31进展下一步的分析,其余的不予考虑。
同理我们得到红葡萄酒部各物质相关性系数大于0.8的表如下:
表十三:
红葡萄酒部各物质相关系数
Y3
Y4
Y6
Y8
Y2
我们从中选择Y3进入下一步的分析,将Y4、Y6、Y8剔除。
然后我们将选择出来的X、Y进展典型相关性分析,由spss软件求得x与y的相关性系数,下面列出系数较大的物质,如下表:
表十四:
酿酒红葡萄与红葡萄酒的指标间相关性系数表
X4
X6
X9
X12
Y1
Y7
我们的目的是得到Y与各个X之间的关系,由经验知,葡萄部各成分的含量与葡萄酒成分含量是成线性相关的,所以,我们分别对各个X与Y进展一元线性回归,为此,我们用matlab的工具箱得到Y1与X4的函数:
其拟合图如下:
葡萄酒中花色苷随葡萄中花色苷变化的拟合图像
为了检验该拟合曲线的拟合精度,我们作出残差图如下:
图十:
葡萄与葡萄酒中花色苷拟合度的参差分析图
从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型
能较好的符合原始数据,而第二个数据可视为异常点而剔除。
使用同样的方法,我们对其它的X和Y进展一元线性回归分析,得到如下几组函数:
其中,符号分别代表了葡萄酒中花色苷、单宁、总酚、总黄酮、白藜芦醇、DPPH半抑制体积
〔IV50〕、L*(D65)、a*(D65)、b*(D65)等主要成分的含量,
分别代表了葡萄中花色苷、苹果酸、褐变度、DPPH自由基、总酚、单宁、葡萄总黄酮、白藜芦醇、果皮颜色等的含量。
由上述各式可以看出葡萄中的花色苷、苹果酸、褐变度、DPPH自由基、总酚、单宁与葡萄酒中的花色苷的含量,葡萄中DPPH自由基、总酚、单宁、葡萄总黄酮的含量影响葡萄酒中总酚的含量,而葡萄的果皮颜色会影响葡萄酒中L*(D65)、a*(D65)、b*(D65)的含量。
以上函数非常明晰地表示出了各个Y与X之间的线性关系,其中Y6Y8Y4与Y3的相关性系数很大,认为他们的变化关系相似,所以Y6Y8Y4与Y3有一样的函数表达式,即,这里就不予列出。
对于酿酒白葡萄和白葡萄酒指标间的关系,经验正,它与红葡萄的关系一样,可以通用以上的函数表达式。
5.5问题4模型的建立
对于该题,想要求出理化指标对质量的影响,即各理化指标与质量的线性或非线性关系,但是,由于理化指标太多,并且并非没个理化指标都会对葡萄酒的质量造成影响,所以首先必须进展数据的筛选,这里我们使用spss软件进展
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 范文