葡萄酒论文终极版 2.docx
- 文档编号:3775237
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:35
- 大小:230.36KB
葡萄酒论文终极版 2.docx
《葡萄酒论文终极版 2.docx》由会员分享,可在线阅读,更多相关《葡萄酒论文终极版 2.docx(35页珍藏版)》请在冰豆网上搜索。
葡萄酒论文终极版2
葡萄酒的评价
摘要
评判葡萄酒的方法是通过聘请一批有资质的评酒员进行品尝并对其打分,通过求和确定葡萄酒的质量。
本文通过对所给数据的统计、分析、处理,建立了相对较好的模型评价葡萄酒的质量。
对于问题一,首先我们利用MATLAB软件制作Q-Q图,根据所得到的图观察得到,这些点可近似拟合成一条直线,从而证明该组数据满足正态分布。
然后利用T-检验方法判断评酒员的评价有无显著差异,最终得出两组评酒员的评价结果存在显著性差异的结论。
关于哪组评价结果更可信的问题,我们采用了方差分析法,根据所得到的红、白葡萄酒均值和方差表,经过计算比较,我们发现第二组的方差小于第一组的方差。
由于方差越小则数据越稳定,于是我们得到第二组评酒员的评价结果更可信的结论。
对于问题二,我们选择利用灰色关联分析法。
我们根据附件一中评分员的评分得出葡萄酒的得分,并对其标准化,将所得的数据作为葡萄酒质量的评分。
对于酿酒葡萄的理化指标,首先我们通过参考文献确定对葡萄酒影响较大的酿酒葡萄的理化指标,再采用均值化无差异法对数据求标准化值,然后利用变异系数法求得筛选出来的葡萄的理化指标的权重,通过计算权重和标准化值最后求得酿酒葡萄的综合评分。
再用均值化无差异法求葡萄和葡萄酒的标准化值。
将所得到的两组数据做和并排序,从而将酿酒葡萄划分为优、良、中、差四个等级。
对于问题三,我们采用了单个拟合和综合拟合的方法。
题目中要求寻找酿酒葡萄和葡萄酒的理化指标的关系,我们首先从参考文献中找到了对葡萄酒的主要理化指标有重大影响的酿酒葡萄的理化指标。
然后利用MATLAB软件进行拟合,建立线性回归方程,从而得出酿酒葡萄的部分理化指标对葡萄酒的理化指标的影响系数和两者之间的函数表达式,可见表红、白葡萄酒的拟合关系。
为了进一步确定两者之间的相关关系,我们又对附件二和附件三中的数据进行处理,利用MATLAB软件再次进行拟合,从而得出酿酒葡萄与葡萄酒的理化指标之间呈正相关关系的结论。
对于问题四,我们采用了拟合的方法。
根据问题二,我们得到了酿酒葡萄理化指标的综合得分和葡萄酒的质量分。
采用变异系数法求出各葡萄酒样品评分的权重作为葡萄酒理化指标的综合得分。
将葡萄酒的质量分化为十分位,然后利用MATLAB软件进行拟合,从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,所得结果见表8、9。
并且得出能用葡萄和葡萄酒的理化指标来评价葡萄酒质量的结果。
关键词:
品评葡萄酒T-检验方法MATLAB方差分析法
灰色关联分析法均值化无差异法变异系数法
一、问题的重述
葡萄酒是由新鲜的葡萄或者葡萄汁经过发酵而成的酒精饮料。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
尝试建立数学模型解决如下问题:
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、符号说明及名词定义
符号
符号说明
第一组第m个评酒员对于第i个样品第j个指标的评价值
第二组第m个评酒员对于第i个样品第j个指标的评价值
第一组的平均值总分样品
第二组的平均值总分样品
第一组每个样本的方差
第二组每个样本的方差
、
第一、二组方差之和
第i个元素的变异系数即标准差系数
第i个元素的标准差
第i种指标的权重
第i个元素的平均数
(i=1,2…27)、
(i=1,2…28)
第i种葡萄的各项理化指标对应的向量
A=
、A=
向量构成的矩阵
第i种葡萄的综合分
第i种红葡萄的第j个指标
因变量
(j=1,2,3,…k)
自变量
(i=1,2,3…k)
参数
三、基本假设
1.假设外界因素不影响葡萄酒的质量。
2.假设外界因素不影响酿酒葡萄的理化指标。
3.假设各评酒员对葡萄酒的评分客观公正,不掺杂主观因素。
4.假设二级指标对酿酒葡萄和葡萄酒的影响忽略不计。
四、问题分析
4.1问题一分析
根据附件一所给数据,采用均值填充法对缺失数据进行预处理。
在判断有无显著性差异的过程中我们采用T-检验方法。
由于应用T-检验方法的前提是该组数据满足正态分布。
于是我们运用MATLAB软件绘制Q-Q图,通过对所得图形的观察,发现该组数据的散点图近似为一条直线。
得出其满足正态分布,于是应用T-检验方法判断有无显著性差异。
针对哪一组结果更可信的问题,我们采用方差分析法,通过对各组数据的计算,得出所有样品的均值与方差表。
通过分析方差判断稳定性,从而判断哪一组结果更可信。
4.2问题二分析
将第一问得出的两组评酒员对葡萄酒样品的评分的平均值作为葡萄酒质量的指标。
由于葡萄酒的质量取决于酿酒葡萄的好坏,所以我们首先通过分析所酿得的葡萄酒的理化指标来判断酿酒葡萄中的对葡萄酒影响较大的理化指标,然后推断葡萄的等级。
首先通过参考文献我们确定了对葡萄酒影响较大的理化指标,然后拟采用均值化无差异法求解出标准化值,再利用变异系数法求得各理化指标的权重。
通过权重和标准化值之间的计算出葡萄各理化指标的综合评分。
再次利用均值化无差异法分别求解出酿酒葡萄和葡萄酒的理化指标的标准化值,并将两组标准化值相加得出总分,所得的总分按从大到小的顺序排列。
最后按照所得总分的大小,将其分为优、良、中、差四个等级。
4.3问题三分析
根据题目要求,首先要确定酿酒葡萄的理化指标对葡萄酒的理化指标的影响,我们通过参考文献得出与葡萄酒的理化指标相关的酿酒葡萄的理化指标。
然后拟采用拟合的方法分别求出酿酒葡萄和葡萄酒的理化指标之间的关系。
为了进一步确定两者之间的关系,我们将附件二和附件三中与葡萄酒的理化指标相关的酿酒葡萄的理化指标求均值,将葡萄酒的理化指标作为自变量,将与之有很大关联的相应的酿酒葡萄的理化指标作为因变量,拟建立线性回归方程,利用MATLAB软件进行拟合。
通过观察分析最后得到的拟合图,得出函数表达式。
4.4问题四分析
在问题二的解决过程中我们得到了酿酒葡萄的理化指标的综合评分以及葡萄酒质量的评分。
利用变异系数法对葡萄酒质量分的数据进行处理,求出权重,作为葡萄酒质量的综合评分。
然后将葡萄酒质量分的数据化为十分制数据。
将所求得的十分制数据作为因变量,将葡萄和葡萄酒的理化指标的综合评分作为自变量,利用MATLAB软件进行拟合。
从而得出葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
五、模型的建立与求解
5.1问题一的模型建立与求解
5.1.1对附件1数据的处理
观察附件1的数据发现数据中存在异常、缺失的情况,因此将异常数据进行修改与剔除,之后判断显著性差异分析。
通过均值填补法将第一组白葡萄酒的样品8中品酒员9持久性分数16改为6,样品三中品酒员7的持久性77改为7,
将第一组红葡萄酒的样品20中品酒员4的色调得分补充为6。
5.1.2检验法的模型建立与求解
对于附件1中的四个表格,由于无论红酒还是白酒都以100分为基准,所以品酒员通过对不同指标评分然后累加就可得到此样品的最终得分。
通过用excel对数据的处理对红、白葡萄酒每组样品最终得分的均值与方差的的求解得到下表所示结果:
表1:
红、白葡萄酒评价差异表
红葡萄酒
白葡萄酒
平均值
方差
平均值
方差
第一组
第二组
第一组
第二组
第一组
第二组
第一组
第二组
酒样品1
62.7
68.1
83.61
73.69
82
77.9
83
23.29
酒样品2
80.3
74
35.81
14.6
74.2
75.8
180.96
44.16
酒样品3
80.4
74.6
41.24
27.64
85.3
75.3
328.61
128.24
酒样品4
68.6
71.2
97.24
37.16
79.4
76.9
40.24
37.89
酒样品5
73.3
72.1
55.81
12.29
71
81.5
113.8
23.65
酒样品6
72.2
66.3
53.76
19.01
68.4
75.5
146.44
20.45
酒样品7
71.5
65.3
93.25
56.41
77.5
74.2
35.25
37.96
酒样品8
72.3
66
39.61
58.6
71.4
72.3
165.24
28.01
酒样品9
81.5
78.2
29.65
23.16
72.9
80.4
83.49
95.64
酒样品10
74.2
68.8
27.36
32.56
74.3
79.8
194.41
63.36
酒样品11
70.1
61.6
63.69
34.24
72.3
71.4
159.41
79.04
酒样品12
53.9
68.3
71.69
22.61
63.3
72.4
104.21
126.04
酒样品13
74.6
68.8
40.44
13.76
65.9
73.9
153.69
42.09
酒样品14
73
72.6
32.4
20.84
72
77.1
102.8
14.29
酒样品15
58.7
65.7
77.01
37.21
72.4
78.4
118.44
48.64
酒样品16
74.9
69.9
16.29
18.09
74
67.3
160.2
74.01
酒样品17
79.3
74.5
79.21
8.25
78.8
80.3
129.76
34.61
酒样品18
68.1
65.4
42.49
45.24
73.1
76.7
140.89
27.21
酒样品19
78.6
72.6
42.64
49.64
72.2
76.4
41.76
23.44
酒样品20
79.2
75.8
23.44
35.16
77.8
76.6
57.96
45.04
酒样品21
77.1
72.2
104.49
31.96
76.4
79.2
159.44
57.96
酒样品22
77.2
71.6
45.56
21.84
71
79.4
124.8
48.24
酒样品23
85.6
77.1
29.24
22.29
75.9
77.4
39.29
10.44
酒样品24
78
71.5
67.4
9.65
73.3
76.1
100.01
34.69
酒样品25
69.2
68.2
58.16
39.36
77.1
79.5
30.49
95.85
酒样品26
73.8
72
28.16
37.4
81.3
74.3
65.61
92.61
酒样品27
73
71.5
44.8
18.45
64.8
77
129.96
32
酒样品28
81.3
79.6
72.41
22.84
5.1.2.1正态分布的检验
通过T检验来推论差异发生的概率,进而判断两个均值的差异是否显著。
通过表一利用matlab软件里的正态分布拟合函数进行曲线拟合,得出正态分布的拟合曲线图如下:
红葡萄酒
白葡萄酒
曲线近似为一条直线,因此我们认为品酒员对红、白葡萄酒的评分均值服从正态分布。
5.1.2.2T检验法模型的建立与求解
问题要求对评酒员评价结果有无显著性差异,将其每个指标求取平均值,检验对两个平均数差异是否显著的T检验对问题求解。
提出假设:
:
即两组评酒员每个指标均值相等
:
,即存在显著性差异。
确定显著性水平:
规定显著性水平
=0.05
检验方法与结论:
用
,
(m=1,2…10)分别表示一、二组第m个评酒员对于第i个样品第j个指标的评价值,分别用
,
表示平均值总分样本。
用matlab进行计算求解,
红葡萄T检验的H值及p值
白葡萄酒T检验的H值及p值
结果如表2:
葡萄酒的品种
H值
P值
差异显著程度
第一组
红葡萄酒
1
0.0115
显著
第二组
红葡萄酒
第一组
白葡萄酒
1
0.0447
显著
第二组
白葡萄酒
由表可知,两组存在显著性差异。
5.1.3方差分析模型
运用excle软件求得每个葡萄酒样本的方差
第一组:
每个样本的方差,第二组
每个样本的方差
对两组方差求和
=
,
=
由表一得:
对于红葡萄酒
=1424.25>
=821.11
对于白葡萄酒
=
=3262.57>
=1411.69
所以无论红葡萄酒还是白葡萄酒第二组稳定性都比较强,所以第二组更可信。
5.2问题二的模型建立与求解
5.2.1酿酒葡萄的理化指标筛选
根据问题一中各个评分的参考因素以及查找相关资料从众多酿酒葡萄的理化指标选择相应的主要理化指标,这样使原先的问题简化从而利用主要部分进行进一步分类。
表3
标准
相关关系
评价类型
花色苷
单宁
醇
总糖
酸
Vc
出汁率
果穗质量
总酚
外
观
+
+
香
气
+
+
+
口
感
+
+
+
整
体
+
其中“+”表示指标与相应评分员评分指标的主要影响指标,空格表示因素对评分指标无影响。
5.2.2变异系数法确定各指标权重
通过上面的分析确定了花色苷、单宁、醇、总糖、vc、酸、出汁率、果穗质量、总酚共九个元素。
对于给出的数据,每一个因素之间的数量级及量纲不同,为了进行比较消除相应的影响,通过变异系数来表示各个指标取值的差异程度。
变异系数公式如下:
(i=1,2…8)
其中:
是第i个元素的变异系数即标准差系数
是第i个元素的标准差
是第i个元素的平均数
各个因数的权重计算:
表示第i种指标的权重,
运用excle对附件二中的数据进行处理得到下表:
VC含量
花色苷
总酸
总酚
单宁
总糖
果穗质量
出汁率
总醇
平均数
0.495156
105.3771
12.56519
14.70907
13.88789
204.0741
239.8903
67.19975
67.19975
标准差
1.916669
87.94032
5.145247
6.50648
6.496386
22.6589
158.5961
7.144717
7.144717
变异系数
3.870842
0.83453
0.409484
0.442345
0.467773
0.111033
0.661119
0.106321
0.106321
权重
0.552207
0.119052461
0.05841626
0.063104
0.066732
0.01584
0.094314
0.015167
0.015167
5.2.3红葡萄各项指标的综合处理
由上表得到九个理化指标的平均值,用每种样品各项理化数据的值除以相应的理化指标的均值得到新的数,每一个样品得到一个确定的向量,用相应的向量乘以相应的指标的权重得到对应的综合得分,思路可用相应的矩阵表述如下。
用
(i=1,2…27)表示第i种葡萄的各项理化指标对应的向量,用着27个向量构成一个矩阵A=
其中
表示第i种红葡萄的第j种理化因素,用均值无差异化消除各个指标见间的数量级及量纲的差异公式如下:
则第i种葡萄的综合分
.
例如对第一种葡萄用上述方法得
(0.5069,3.8720,1.7589,1.6048,
1.5855,1.0201,0.7626,1.1667,1.667)
权重向量为
(0.5522,0.1191,0.5842,0.0631,0.0667,0.1584,0.0943,0.0152,0.0152)
葡萄样品
1
2
3
4
5
6
总体得分
1.115154
0.667805
0.840243
0.401928
0.635751
0.449019
葡萄样品
7
8
9
10
11
12
总体得分
0.429536
0.786624
1.184551
11.72169
0.331144
0.352726
葡萄样品
13
14
15
16
17
18
总体得分
0.314195
0.541945
0.356919
0.397423
0.475829
0.456101
葡萄样品
19
20
21
22
23
24
总体得分
0.476845
0.428216
0.411228
0.443560
0.714623
0.593001
葡萄样品
25
26
27
总体得分
0.344845
0.946419
0.390434
综合得分为
*
=1.115154
用同样的方法得出其他葡萄理化指标的综合得分如下表:
表5
5.2.4红葡萄酒质量分的确定
为了更准确的表示评分,现在选择两个评酒员对某一种酒的评分的均值作为该酒的评分。
如下表:
表6
酒种类
1
2
3
4
5
6
7
8
评分
65.4
77.15
77.5
69.9
72.7
69.25
68.4
69.15
酒种类
9
10
11
12
13
14
15
16
评分
79.85
71.5
65.85
61.1
71.7
72.8
62.2
72.4
酒种类
17
18
19
20
21
22
23
24
评分
76.9
66.75
75.6
77.5
74.65
74.4
81.35
74.75
酒种类
25
26
27
评分
68.7
72.9
72.25
5.2.5每一种葡萄酒质量分的确定
与上述方法类似对葡萄酒的评分与红葡萄酒理化指标数量级差异用上法消除,用
(i=1,2…28)表示第i种葡萄的各项理化指标对应的向量,用着28个向量构成一个矩阵A=
其中
表示第i种红葡萄的第j个指标,用均值无差异化消除各个指标见间的数量级及量纲的差异公式如下:
综合评分为
,用此方法可以计算出红葡萄的质量评分如下表7:
排序号
1
2
3
4
5
6
7
8
葡萄种类
葡萄样品9
葡萄样品10
葡萄样品1
葡萄样品26
葡萄样品3
葡萄样品8
葡萄样品23
葡萄样品2
评分
1.785625421
1.759062798
1.681579257
1.42733784
1.268471297
1.186659095
1.080677235
1.010454587
排序号
9
10
11
12
13
14
15
16
葡萄种类
葡萄样品5
葡萄样品24
葡萄样品14
葡萄样品19
葡萄样品17
葡萄样品18
葡萄样品6
葡萄样品22
评分
0.961034545
0.898162104
0.820383623
0.722878922
0.721817379
0.691268951
0.68164752
0.671822051
排序号
17
18
19
20
21
22
23
24
葡萄种类
葡萄样品7
葡萄样品20
葡萄样品21
葡萄样品4
葡萄样品16
葡萄样品27
葡萄样品15
葡萄样品12
评分
0.652373772
0.649042718
0.623658808
0.608869901
0.604241692
0.592365854
0.54301938
0.536233254
排序号
25
26
27
葡萄种类
葡萄样品25
葡萄样品11
葡萄样品13
评分
0.523869487
0.503308248
0.478977904
表7
5.2.6对红葡萄进行分级
酿酒红葡萄最终分类为
一级
9
10
1
26
二级
3
8
23
2
三级
5
24
14
19
17
四级
18
6
22
7
20
21
4
16
五级
27
15
12
25
11
13
5.2.7对白葡萄进行分级
白葡萄酒变异系数及权重
VC含量
花色苷
总酸
总酚
单宁
总糖
果穗质量
出汁率
总醇
平均数
506.8398
1.474592361
12.7967857
7.736773
3.746217
193.3539
197.2736
71.28869
71.28869
标准差
56.71493
1.040278548
4.12455543
3.022352
1.715633
22.08188
94.36267
5.329697
5.329697
变异系数
0.111899
0.705468559
0.32231183
0.390648
0.457964
0.114204
0.478334
0.074762
0.074762
权重
0.040983
0.258379866
0.11804762
0.143076
0.167731
0.041828
0.175191
0.027382
0.027382
白葡萄的评分
葡萄样品
1
2
3
4
5
6
总体得分
1.802683
1.642875
2.183120
1.906424
1.650056
2.077871
葡萄样品
7
8
9
10
11
12
总体得分
2.427270
2.282920
2.311682
1.952005
1.974722
1.742790
葡萄样品
13
14
15
16
17
18
总体得分
2.108591
1.632406
2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒论文终极版 葡萄酒 论文 终极