葡萄酒的评价全国数学建模大赛优秀Word文档格式.docx
- 文档编号:20815304
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:44
- 大小:387.58KB
葡萄酒的评价全国数学建模大赛优秀Word文档格式.docx
《葡萄酒的评价全国数学建模大赛优秀Word文档格式.docx》由会员分享,可在线阅读,更多相关《葡萄酒的评价全国数学建模大赛优秀Word文档格式.docx(44页珍藏版)》请在冰豆网上搜索。
对于问题二:
根据葡萄酒质量的综合得分,将其划分为优、良、合格、不合格四个等级,并对酿酒葡萄的理化指标进行主成分分析,得出对葡萄影响较大的理化指标:
红葡萄主要理化指标
DPPH自由基、葡萄总黄酮、PH值、花色苷、蛋白质、黄酮醇、固酸比、果梗比
白葡萄主要理化指标
氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇
并根据酿酒葡萄的理化指标和葡萄酒的质量,利用模糊综合评价模型对葡萄酒进行了分类,结果如下:
等级数
级数
红酒数量
红葡指标
白酒数量
白葡指标
次品
4
3
1
普通
11
7
良好
2
12
20
19
16
优质
5
对于问题三:
先对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。
利用通径方法建立了数学模型,得出了它们之间的线性回归方程:
对于问题四:
在前面主成分分析和葡萄酒分级的基础上,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。
运用SPSS软件,通过matlab编程运算,求出受它们综合影响的线性回归方程。
在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
最后,对模型进行了改进和推广。
关键词T检验主成分分析Logistic回归模型
一、问题的重述
葡萄酒作为体现时尚品味的元素,同名茶、咖啡一样备受追捧。
在物质社会的今天,人们酿造葡萄酒的品质还是有待鉴定的,因此,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
此外,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,现需要用数学建模方法研究解决以下问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题的分析
针对问题一:
分析评酒员的评价结果有无显著性差异,需要从反面来论证,要从假设性检验角度来分析问题。
由于样本容量较大,近似地服从正态分布。
因此,本论文采用了使用Matlab做T检验,从而确定两组评价有无显著性差异。
为了确定哪一组的结果更可信,建立了一种可以替代可信度的模型。
又考虑到该样本涉及到的是正态分布,则数据的离散程度是对其影响最大的因素,所以采用用标准差与平均值的比值作为可信度模型
来衡量可信度的高低。
针对问题二:
该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级,故我们要对酿酒葡萄的理化指标和葡萄酒的质量进行综合评价,但是在进行综合评价以前我们有分别要对它们二者分别进行分析。
在第一问中,我们已经对葡萄酒的整体进行了打分,因此,葡萄酒的质量实际上已经分好类了,那么我们就需要对酿酒葡萄的理化指标进行分析。
但是,由于影响酿酒葡萄的理化指标的因素有30个,要使问题得到简化,我们只需取其几个主要的影响因素,因此,采用主成分分析法来分析主要影响因素。
然而,葡萄酒的质量的单位系与酿酒葡萄的理化指标的单位系不同,因此不能直接加减来判断,所以,我们采用了模糊综合评价模型来对酿酒葡萄进行分级。
针对问题三:
对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。
利用通径方法建立了数学模型,得出了它们之间的线性回归方程
针对问题四:
基于前面主成分分析和葡萄酒分级的基础,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。
三、基本假设
1、各个样品酒中原产地相似,酿酒葡萄的产地对葡萄酒的质量影响相同;
2、酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;
3、葡萄酒的酿造工序和贮藏条件相同;
4、各评酒员的资质较高,在对葡萄酒品平时都是客观的,不存在主观偏好;
5、仪器对样本理化指标和所含芳香物质的测试不存在随机误差,附件所给的数据真实、准确、可靠;
6、酒样品容量较大时,认为各组样本服从正态分布且相互独立;
7、两种葡萄酒和酿酒葡萄的分级标准相同,且葡萄酒分为优、良、合格、不合格四个级别;
8、假设附件1中,酒样品为一级指标,外观、口感、香气分析和整体评价为二级指标,澄清度、色调、纯正度、浓度、持久性和质量为三级指标;
四、符号定义
:
表示澄清度,色调等指标个数,
;
表示评酒员的个数,
表示第b个评酒员对a指标的评分;
表示酒样品数,
表示第
种酒样品评分的均值;
表示总体均值;
表示两组对应红(白)酒的均值差;
表示对均值差(
)做t检验时的统计量;
:
表示拒绝域;
表示总体可信度的指标;
表示酿酒葡萄的理化指标数,
种酒样品的第
中理化指标的值;
表示对
标准化后的值;
表示相关系数矩阵的第
个特征值;
表示主要理化指标的贡献率;
表示主要理化指标的累计贡献率;
表示主要理化指标的综合评价函数,
表示显著性水平;
表示方差;
表示相关系数矩阵的特征向量;
表示子集
中含有
个评判因素;
表示
个因数的权数分配;
五、模型的建立与求解
5.1、问题一模型的建立与求解
5.1.1显著性差异的T检验
针对于如何确定有无显著性差异,我们从假设检验的角度出发,通过使用Matlab做T检验,分析它们的均值与方差来确定显著性。
1、对数据均值进行分析计算
均值即每种酒样品的平均得分,它表示每个评酒员对每种酒样品评定的质量的具体值,其公
为:
,(5.1.1)
其中,a表示附件1中的三级指标;
b表示评酒员的个数。
将各种葡萄酒样品各个评分代入式子(5.1.1),运用excel计算可得出如下结果:
表1第一组红葡萄酒整体均值
酒样品
6
8
9
10
13
14
平均得分
62.7
80.3
80.4
68.6
73.3
72.2
71.5
72.3
81.5
74.2
70.1
53.9
74.6
73
15
17
18
21
22
23
24
25
26
27
58.7
74.9
79.3
59.9
78.6
79.1
77.1
77.2
85.6
78
69.2
73.8
表2第二组红葡萄酒整体均值
68.1
74
71.2
72.1
66.3
65.3
66
78.2
68.8
61.6
68.3
72.6
65.7
69.9
74.5
65.4
75.8
71.6
68.2
72
表3第一组白葡萄酒整体均值
82
78.3
79.4
71
68.4
77.5
70.4
72.9
74.3
63.3
65.9
28
品均得分
72.4
78.8
73.1
77.8
76.4
75.9
81.3
64.8
表4第二组白葡萄整体均值
77.9
75.6
76.9
75.5
79.8
71.4
73.9
78.4
67.3
76.7
76.6
79.2
77.4
76.1
79.5
77
79.6
2、对数据方差进行分析计算
方差即各个数据与平均数之差的平方的平均数,它表示两组葡萄酒质量的波动大小,其公
,(5.1.2)
其中,m表示酒样品数;
表示组数,
=1,2.
将以上各种葡萄酒样品的均值代入式子(5.1.2),可求得各组的方差,结果如下:
表5两组红、白葡萄酒的方差
53.91410256
23.30787037
15.82439
10.05485
3、成对数据进行T检验
根据表1、表2、表3和表4显示的结果,我们可将两组中红、白酒样品分别形成相应的成对数据,形式如下表:
表6两组酒样品的成对数据及差值
酒样品号
……
x1
x2
x27
y1
y2
y27
x-y(d)
d1
d2
d27
首先,假设:
,
且独立,则
,其中
然后,T检验问题为:
零假设
即
对立假设
,即
.
此时,用T统计量
,(5.1.3)
其中,
,
表示酒样品数,(红酒
,白酒
);
在零假设成立的前提下,此
统计量服从
分布。
这时,零假设的
(
)显著水平的拒绝域是如下的样本区域:
.(5.1.4)
将表1和表2中的数据代入式子(5.1.3)中,可求得红葡萄酒的统计量t值,通过查表法将m值代入(5.1.4)可以求得显著水平的拒绝域。
结果为:
=2.04569
=2.04106
所以可得评酒员对红葡萄酒的评价没有显著性差异。
同理,我们可计算出白葡萄酒的统计量t值,即
=-2.66648,不在拒绝域内,所以,结果可得两组评酒员对白葡萄酒的评价存在显著性差异。
5.1.2可信度模型的建立及求解
针对可信度的问题,我们用H表示可信度。
在一定程度上,当平均值相等时,标准差能反映一个总体的离散程度,即标准差越大,离散程度越大,则表明这个总体的水平不稳定;
标准差越小,反之水平越稳定。
基于标准差和平均值的性质,我们用标准差与平均值比值的大小来表示一个总体可信度的高低。
因而,我们建立一个可信度模型:
其中,H表示标准差与平均值的比值,即
可见,H值越大时它的可信度越低,H值越小时可信度越高。
由此,可算得两组红葡萄酒样本的标准差与平均值的比值,如下表:
表7两组红、白葡萄酒的均值标准差与平均值的比值
由以上表格显示的结果可得出如下结论:
对于两组中的红葡萄酒,有:
,所以第二组对红葡萄酒的评价结果的可信度更高;
对于两组中的白葡萄酒,有:
,所以第二组对白葡萄酒的评价结果的可信度更高;
综上所述:
第二组更可信。
5.2、问题二模型的建立和求解
5.2.1对酿酒葡萄的质量进行分类
该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,而在第一问中我们已经对葡萄酒进行了综合评分,现将其结果分为优、良、合格、不合格四类,。
对其质量进行等级分类,结果如下表格:
表8红葡萄酒质量的等级分类
等级(均值)
优(75以上)
9、20、23
良(70—75)
2、3、4、5、14、17、19、21、22、24、26、27
合格(65—70)
1、6、7、8、10、12、13、15、16、18、25
不合格(65以下)
表9白葡萄酒质量的等级分类
优质(75以上)
1、2、3、4、5、6、9、10、14、15、18、19、20、21、22、23、24、25、26、27、28
良(70—75)
7、8、11、12、13
5.2.2对酿酒葡萄的理化指标进行主成分分析
1、建立主成分分析数学模型
样本观测数据矩阵为:
,
将酿酒葡萄的理化指标带入X中,求得了X的矩阵。
将
个观测变量综合成为
个新的变量(综合变量),即
简写为:
)
为综合评分函数,
为主成分系数,
为各样品酿酒葡萄的理化指标,n为1~27个葡萄样品,p为1~30个理化指标,
为理化指标的观测数据矩阵。
第一步:
对原始数据进行标准化处理
,
又:
第二步:
计算样本相关系数矩阵
为方便,假定原始数据标准化后仍用
表示,则经标准化处理后的数据的相关系数为:
第三步:
用雅克比方法求相关系数矩阵
的特征值(
)和相应的特征向量
。
解特征方程
,求出特征值
因为R是正定矩阵,所以其特征值
都为正数,将其按大小顺序排列,即
.特征值是各主成分的方差,它的大小反映了各个主成分的影响力。
第四步:
选择重要的主成分,并写出主成分表达式
主成分分析可以得到
个主成分,但是由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取
个主成分,而是根据各个主成分累计贡献率的大小选取前
个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重,即
=
表示主成分的贡献率,贡献率越大,说明该主成分所包含的原始变量的信息越强。
又累计贡献率为:
所以,特征值大于1且累计贡献率达80%-95%的特征值
所对应的1,2,…,
)其中整数
即为主成分的个数。
第五步:
计算主成分得分
根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,即为主成分得分,具体形式可如下:
又
2、运用SPSS软件计算数据
根据SPSS软件算出葡萄酒质量的等级与酿酒葡萄的理化指标的相关度(附录二),由附录中分析得出:
30种酿酒葡萄的理化一级指标对葡萄分级有一定影响,它们在葡萄中的含量决定葡萄的质量。
以27种红(28种白)葡萄的30个理化指标构成27(28)
30的矩阵,利用MATLAB软件进行主成分分析(MATLAB主成分分析的源代码见附录1),经过有限次剔出后确定保留的成分,再用相关矩阵的特征值与特征向量特征值算得主成分、主成分个数及主成分贡献率,由以上数据得出综合评分。
红葡萄的理化指标经过有限次剔出后,保留了8个主成分:
x10、x13、x19、x4、x2、x15、x21、x25,分别代表DPPH自由基、葡萄总黄酮、PH值、花色苷、蛋白质、黄酮醇、固酸比、果梗比(主成分按照贡献率降幂排列);
理化指标的综合评分(分数越低,排名越靠后)是:
表10红葡萄主要成分的综合评分
红葡萄样品
排名
主成分综合分
-0.7986
-0.3447
-0.3379
0.5151
0.3369
0.5603
0.3001
-0.3156
-0.4675
2.2129
0.4172
-0.0247
1.6312
0.7737
0.3125
-3.0269
-1.0608
0.041
0.0088
0.3684
0.6661
0.1339
0.0811
-0.1872
-0.7932
-0.0697
0.3187
同理可算出,白葡萄的相关信息:
白葡萄的理化指标经过有限次剔出后,保留了11个主成分,:
x1、x22、x18、x23、x16、x6、x17、x11、x13、x5、x15,分别代表氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇(主成分按照贡献率降幂排列);
表11白葡萄主要成分的综合评分
白葡萄样品
0.5604
0.1665
-0.3528
-0.2285
-2.1077
-0.2566
1.002
0.55
-0.8539
-0.0338
0.4645
0.0712
0.2672
0.394
0.8677
0.5384
0.7039
0.3253
-1.55
0.5309
1.3999
0.2879
1.6136
0.4433
0.3471
0.0026
-1.4436
-0.2726
5.2.2采用模糊综合评价模型来对酿酒葡萄进行分级
1、多层次模糊综合评判模型的建立:
(1)对评判因素集合U,将其划分成2个子集,并使它们满足:
(5.2.1)
这样,就得到了第二级评判因素集合:
(5.2.2)
表示酿酒葡萄的质量,
酿酒葡萄的理化指标
在(5.2.2)式中,Ui={Uik}(i=1,2,…,m;
k=1,2,…,nk)表示子集Ui中含有nk个评判因素。
其中
=(外观,香气、口感、整体评价)
=(酿酒葡萄的主要理化指标)
(2)对于每一个子集Ui中的nk个评判因素,按单层次模糊综合评判模型进行评判,如果
中的诸因数的权数分配为
,其评判决策矩阵为
,则得到第i个子集Ui的综合评判结果:
(5.2.3)
(3)对U中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒 评价 全国 数学 建模 大赛 优秀