欢迎来到冰豆网! | 帮助中心 分享价值,成长自我!
冰豆网
全部分类
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • 党团工作>
  • ImageVerifierCode 换一换
    首页 冰豆网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    数学建模之葡萄品种的分类.docx

    • 资源ID:11638596       资源大小:174.94KB        全文页数:35页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数学建模之葡萄品种的分类.docx

    1、数学建模之葡萄品种的分类葡萄品种的分类摘要随着社会各个领域的不断发展,统计分类已经逐步渗透到每个角落,本文中,我们将举出其中一例,通过题中一些已知种类葡萄(红葡萄或白葡萄)的理化指标和未知种类(红葡萄或白葡萄的)理化指标,采用合适的指标运用三种不同方法对葡萄品种进行分类。首先使用模糊数学的方法,运用MATLAB对数据进行处理,并进行进一步的运算,由切比雪夫距离法对问题进行建模:原始数据处理变成模糊矩阵,处理模糊矩阵成为相似矩阵,找相似矩阵闭包,从而找到模糊等价矩阵,选取合适的值,进行分类最终求得结果。方法二使用聚类分析法,利用spass软件中的系统聚类分析对已知数据进行处理,并得到树状图,观察

    2、树状图选取合适的分类指标,把红葡萄和白葡萄样品分别分为五类。方法三通过综合分析方法从各方面、多角度出发,对问题展开全方位的分析,由隶属函数得出综合得分进行分类。问题一属于归类问题,由于红葡萄和白葡萄属于不同种类,所以本文运用模糊数学、聚类分析以及综合评价三种方法把他们分别划分为不同品种,并一一进行分析解释。问题二,在问题一的基础上,我们已经把红葡萄及白葡萄进行品种划分,接下来将待分类葡萄先进行种类划分,再将其分别放入各自的种类中按照原来的分类方法划分品种即可。关键词:模糊数学 聚类分析法 切比雪夫距离法 综合评价 隶属函数一、 问题重述在酿造葡萄酒时,选用不同品种的葡萄及不不同的酿造工艺,会得

    3、到不同种类的葡萄酒,附件中给出了一些已知种类葡萄(红葡萄或白葡萄)的理化指标和未知种类(红葡萄或白葡萄的)理化指标,且这些葡萄来自于不同的葡萄品种,同一种类不同品种的葡萄在理化指标上会稍有不同。请选取合适的指标,用多种方法完成以下任务:1、将已知种类的红葡萄和白葡萄样本分成若干不同的品种(不需要指明品种);2、区分出待检测葡萄的种类及品种,并对结果进行解释。二、题设分析2.1问题分析2.1.1问题一的分析本题中红葡萄及白葡萄的指标有54种,考虑到指标数量较多,不能简单粗略地识别出品种的分类,我们对数据进行了一定的处理,多次测量的指标数据,我们用它的平均值进行代替。因为归属于分类题型,有多种方法

    4、可以进行求解,本文中采用其中的模糊数学、系统聚类以及综合评价法这三种方法分别做出问题一的解答。2.1.2问题二的分析问题二要求我们区分出待检测葡萄的种类及品种,并对结果进行解释。已知数据中共有六个待测样品,从已知样品中我们可以观察到,红葡萄和白葡萄花色苷含量存在显著差异,从而我们很容易把待测样品分为红葡萄和白葡萄,结合问题一的结果,进而对待测样品进行归类。三、模型假设假设一: 已知样本葡萄中没有出现变异情况;四、符号说明方法三的符号说明:五、模型的建立及求解5.1.方法一模糊数学5.1.1问题一的求解1.模型的建立题目中给出了红葡萄,白葡萄两种,我们先对红葡萄进行数据处理与分类,白葡萄处理方法

    5、类似。根据模糊数学的分类方法,我们分为四步进行:原始数据处理变成模糊矩阵,处理模糊矩阵成为相似矩阵,找相似矩阵闭包,从而找到模糊等价矩阵,选取合适的值,进行分类 。2.建立模糊矩阵先对原始数据进行处理形成迷糊矩阵,我们先采用标准差标化,为了使所有的,在进行极差变化,具体操作如下: (1) (2) (3)根据(1)(2)(3)我们求出了模糊矩阵,数据见附录一。3.建立模糊相似矩阵确定相似系数的方法有多种,常用的有切比雪夫距离法,数量积法、夹角余弦法、相关系数法、最大最小值法、距离法、专家评分法等,根据实际需要我们选用了比较常见的切比雪夫距离法,方法如下: (4)其中Q为使所有的确定常数.则。根据

    6、(4)我们可以列出模糊相似矩阵,我们利用matlab算法很快求出其相似矩阵,定义为,数据和程序见附录一。4.建立模糊等价矩阵-找闭包从是上一步求出的22阶模糊相似矩阵出发,用平方法求其传递闭包,它就是将改造成的22阶模糊等价矩阵,再让由大变小,就可形成动态聚类图.我们通过编程求得它的闭包为。通过给定不同的值,得到了不同的分类。当截取值取0.4时分成了5类我们将此时的截取矩阵放在附录中,其具体分类如下:红葡萄分类表第一类样品1、样品3第二类样品2、样品5、样品10、样品15、样品16、样品17、样品18第三类样品7、样品8、样品12、样品20、样品21、样品22第四类样品11、样品13、样品14

    7、第五类样品6、样品9、样品195:白葡萄分类因为白葡萄于此方法相似,我们省略上面的分析。我们截取值取 时,分成了 类,具体分类如下:白葡萄分类表第一类样品1、样品7、样品9、样品13、样品14第二类样品2、样品3、样品4、样品5、样品6、样品8、样品10、样品11、样品12、样品15、样品16、样品17、样品18、样品19、样品20、样品21、样品22、样品23、样品24、样品25自此模糊分类已经完成,我们接下来采取聚类分析,进行分类,从而易于分析两者的联系与差别。5.2方法二系统聚类法5.2.1问题一的求解1.模型准备系统聚类法的基本原理:首先将一定数量的样本或指标各自看成一类,然后根据样本

    8、(或指标)的亲疏程度,将亲疏程度最高的两类进行合并,然后考虑合并后的类与其他类之间的亲疏程度,再进行合并。重复这一过程,直到将所有的样本(或指标)合并为一类。系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数、降低变量维度的目的。在本文中进行的是Q型聚类。类与类之间距离的计算方法主要有以下几种:最短距离法(Nearest Neighbor),是指两类之间每个个体距离的最小值

    9、;最长距离法(Farthest Neighbor),是指两类之间每个个体距离的最大值;组间联接法(Between-groups Linkage),是指两类之间个体之间距离的平均值;组内联接(Within-groups Linkage),是指把两类所有个体之间的距离都考虑在内;重心距离法(Centroid clustering),是指两个类中心点之间的距离;离差平方和法(Ward法),同类样品的离差平方和应当较小,类与类之间的离差平方和应当较大。2.模型的求解(1)红葡萄的分类我们利用spass软件中的聚类分析的方法来求解此问题,具体步骤如下:打开spass软件,在数据编辑窗口的主菜单中选择“分

    10、析(A)”“分类(F)”“系统聚类(H)”;在弹出的“系统聚类分析”对话框中,将“样品”变量选入“标注个案(C)”中,将其他变量选入“变量框”中。在“分群”单选框中选中“个案”,表示进行的是Q型聚类。在“输出”复选框中选中“统计量”和“图”,表示要输出的结果包含以上两项。单击“统计量(S)”按钮,在“系统聚类分析:统计量”对话框中选择“合并进程表”、“相似性矩阵”。单击“绘制(T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“冰柱”,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。单击“方法(M)”按钮,弹出“系统聚类分析:方法”对话框,我们选择“聚类方法(M)”选项条中的

    11、“组间联接”和“度量标准-区间(N)”选项条中的“平方Euclidean距离”以及“转换值-标准化(S)”选项条中的“全局从0到1”。通过以上步骤,我们从spass输出中得到了红葡萄聚类表,垂直冰柱图见附录二中的图表1、图表2,树状图见下文中的图表3以及近似矩阵图。下面我们对所得结果进行分析:近似矩阵图表分析:近似矩阵图表显示的是用平方Euclidean距离计算的近似矩阵表,其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越大,表示两样本距离越大。聚类表分析:图表1显示的是聚类表,该表反映的是每一阶段聚类的结果,系数表示的是“聚合系数”,第2列和第3列表示的是聚合的类。垂直冰

    12、柱图分析:图表2冰柱图,是反映样本聚类情况的图,如果按照设定的类数,在那类数的行上从左到右就可以找到各类所包含的样本。红葡萄树状图分析:图表3红葡萄树状图图表3用“组间联接”聚类法生成的树状聚类图。如果将所有样本分为五类的话,可以得到如下分类:红葡萄分类表第一类样品11、样品14、样品5第二类样品3、样品19、样品15、样品20、样品21、样品4、样品22、样品9、样品12、样品16第三类样品6、样品17、样品10第四类样品7、样品13第五类样品2、样品8、样品18、样品1(2)白葡萄的分类由于红葡萄分类及白葡萄分类都是采用spass软件进行聚类分析,具体操作步骤在红葡萄分类中已经罗列,此处不

    13、再赘述,我们同样从spass输出中得到了白葡萄的近似矩阵,聚类表,垂直冰柱图见附录一中的图表4、表5,树状图见下文中的图表6及近似矩阵图。白葡萄树状图分析:图表6葡萄树状图图表6用“组间联接”聚类法生成的树状聚类图。如果将所有样本分为五类的话,可以得到如下分类:白葡萄分类表第一类样品7、样品15、样品12、样品1、样品9第二类样品5、样品14、样品11第三类样品4、样品16、样品6、样品10、样品8、样品19、样品22、样品21、样品2、样品3、样品18、样品13、样品17、样品24第四类样品20第五类样品235.2.2问题二的求解由常识可得红葡萄和白葡萄的颜色有很大区别,我们观察数据发现红葡

    14、萄和白葡萄花色苷的含量有很大差别,大多数红葡萄的花色苷的含量为7-410花色苷mg/100g鲜重,而白葡萄的花色苷含量为0-5花色苷mg/100g,所以我们按照种类依据以上结论可以近似把待测样品分为白葡萄和红葡萄。如下表:红葡萄待测样品1、待测样品2、待测样品3白葡萄待测样品4、待测样品5、待测样品6我们把待测样品1、2、3分别命名为a样品23、24、25放入原红葡萄的数据中,用spass中的系统聚类分析再次进行分类,得到以下树状图:图表7由树状图图表7可得,a样品23、24、25即待测样品1、2、3为红葡萄的第二类。我们把待测样品4、5、6分别命名为b样品25、26、27放入原白葡萄的数据中

    15、,用spass中的系统聚类分析再次进行分类,得到以下树状图:图表8由树状图图表8可得,b样品25即待测样品4为白葡萄的第二类,b样品26、27即待测样品5、6为白葡萄的第三类。5.3方法三综合评价法5.3.1问题一的求解1.数据预处理:问题给了54个指标,我们首先将一级指标和二级指标进行分开处理,为了体现两者的区别,给其不同的权数。我们这样定义:一级指标权数为0.8,二级指标权数为0.2。接下来观察数据可知,各样品每种指标值相对集中,但不同指标相差却很悬殊,于是我们进行极值归一化处理,接下来给出统一的隶属规则:其中() ,于是得到了红葡萄的22个样品54中指标的归一化值。数据见附录。归一处理后

    16、的数据就能进行综合处理,求出其综合得分,公式如下:由于红白葡萄处理方式相同,直接将其两者综合得分给出如下:样品种类红葡萄综合得分白葡萄综合得分112.891038968.654822544212.118850298.79429087837.1512377969.915321206410.7409058411.416606158.90134535411.3059550968.89405381210.74974367713.663134398.114080117813.47307849.77080735997.9561771397.751901956109.1654808558.590889104

    17、118.89494117110.86310063128.7204723888.3105880431310.996206178.594606584147.039435969.228831971159.8680273448.100729393168.99340882511.884408531710.286342429.4016720031812.891201469.973062641196.08503621410.6168707207.71749045813.5649665217.21454883111.33865216228.3635503369.9263368272315.1470505224

    18、12.95381607如果我们将红葡萄白葡萄均分成四种,只需将各综合得分进行排序,求出各样品区间,然后进行适当的分组。我们将上述表格进行分类,对于红葡萄,我们分为,则分为如下四类:红葡萄分类表第一类样品19、样品14、样品3、样品21、样品20、样品9第二类样品22、样品12、样品6、样品11、样品5、样品10、样品15、样品16第三类样品17、样品4、样品13、样品2、样品1、样品18第四类样品8、样品7同理对白葡萄分类,我们分为,分为如下四类:白葡萄分类表第一类样品9、样品15、样品7、样品12、样品10、样品13、样品2、样品1第二类样品14、样品17、样品8、样品3、样品22、样品18

    19、、样品19、样品6、样品11第三类样品5、样品21、样品4、样品16、样品24第四类样品20、样品23自此我们将红白葡萄均分成了四类。 六、模型评价模型优点本文运用了三种模型方法进行求解。第一种方法模糊数学是建立在模糊集合基础上的一种预测和评价方法。它的优点在于评价方式与人们的正常思维模式很接近,用程度语言描述对象。第二种方法系统聚类法,利用spass软件解决问题,简单易操作,每个变量之间的关系一目了然。第三种方法综合评价法,考虑全面,具体分析问题使结果更加简单易懂,清晰明了。模型的推广此模型是对葡萄进行分类,我们可以利用这个模型迁移到物品分类领域上来,我们只需要将一些系数修正即可,再加上各个

    20、领域的特殊情况,那么此模型一定也能较好的发挥其作用。七、参考文件1 庞庆华,现代综合评价方法与案例精选M,清华大学出版社。2 韩中庚,数学建模方法及其应用M,北京市:高等教育出版社 ,2009年。附录附录一问题一:方法一:程序:%:红葡萄分类程序U1=Untitled1;for i=1:size(u1) for j=1:54 v(i,j)=(u(i,j)-mean(u(:,j)/std(u(:,j); endendm=zeros(size(u1),54);for i=1:size(u1) for j=1:54 m(i,j)=(v(i,j)-min(v(:,j)/(max(v(:,j)-min(

    21、v(:,j) endend%:数据预处理,建立模糊矩阵d=zeros(size(u1));for i=1:size(d,1) for j=1:size(d,2) for k=1:size(m,2) d(i,j)=max(abs(m(i,k)-m(j,k); end r(i,j)=1-d(i,j); endend%:建立相似矩阵flag=0;p=0;while flag=0 for i=1:size(u1) for j=1:size(u1) for k=1:size(u1) B(i,j)=max(min(r(i,k),r(k,j);%r与r取内积,先取小后取大 end end end if al

    22、l(B(i,j)0.4) r(i,j)=1; else r(i,j)=0; end endend%:求截集矩阵c=zeros(size(u1))for j=1:size(u1) for k=1:size(u1) if r(j,:)=r(k,:); c(j,k)=k else c(j,k)=0 end endEnd%:分种类%:白葡萄分类%:白葡萄利用了u2=Untitled2,故将上述u1均改为u2即可红葡萄氨基酸总量蛋白质VC含量花色苷鲜重酒石酸(g/L)葡萄样品10.460.310.021.000.00葡萄样品20.490.650.000.540.70葡萄样品30.500.200.010.

    23、180.15葡萄样品40.380.460.000.280.67葡萄样品51.000.230.010.100.07葡萄样品60.600.000.010.130.34葡萄样品70.430.330.020.580.33葡萄样品80.551.000.050.581.00葡萄样品90.200.271.000.090.03葡萄样品100.580.260.010.000.65葡萄样品110.660.030.000.060.36葡萄样品120.220.560.000.140.20葡萄样品130.150.530.000.330.33葡萄样品140.600.120.010.080.14葡萄样品150.620.27

    24、0.010.270.31葡萄样品160.550.340.000.040.13葡萄样品170.660.010.010.170.40葡萄样品180.590.260.010.410.18葡萄样品190.220.230.000.100.07葡萄样品200.000.470.040.130.46葡萄样品210.100.190.010.070.37葡萄样品220.270.450.010.130.62红葡萄苹果酸(g/L)柠檬酸(g/L)多酚氧化酶活力褐变度DPPH自由基1/IC50葡萄样品11.000.730.580.850.52葡萄样品20.230.310.510.560.59葡萄样品30.250.220

    25、.130.000.18葡萄样品40.170.570.530.060.45葡萄样品50.080.000.660.030.20葡萄样品60.400.220.380.290.00葡萄样品70.731.001.001.000.49葡萄样品80.190.440.160.281.00葡萄样品90.080.100.000.310.31葡萄样品100.450.760.100.020.21葡萄样品110.260.450.270.050.04葡萄样品120.000.460.440.020.54葡萄样品130.190.650.780.740.38葡萄样品140.270.210.420.070.10葡萄样品150.2

    26、00.050.500.110.42葡萄样品160.010.180.050.010.22葡萄样品170.400.310.280.280.22葡萄样品180.250.160.150.290.81葡萄样品190.090.060.100.060.36葡萄样品200.030.330.540.010.29葡萄样品210.030.500.320.420.18葡萄样品220.370.950.080.370.12红葡萄总酚单宁葡萄总黄酮白藜芦醇(mg/kg)黄酮醇(mg/kg)葡萄样品10.730.890.320.110.11葡萄样品20.870.950.520.170.19葡萄样品30.190.240.090

    27、.110.19葡萄样品40.480.520.360.010.03葡萄样品50.190.550.200.070.04葡萄样品60.130.090.040.010.06葡萄样品70.380.910.270.210.86葡萄样品81.001.000.830.170.42葡萄样品90.140.630.100.450.20葡萄样品100.000.040.001.000.17葡萄样品110.250.160.060.010.00葡萄样品120.350.290.220.400.29葡萄样品130.360.490.240.221.00葡萄样品140.050.080.130.000.03葡萄样品150.470.480.320.130.22葡萄样品160.270.210.260.040.05葡萄样品170.430.410.240.150.09葡萄样品180.980.991.000.360.32葡萄样品190.230.270.130.060.21葡萄样品200.050.000.040.060.09


    注意事项

    本文(数学建模之葡萄品种的分类.docx)为本站会员主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 冰点文档网站版权所有

    经营许可证编号:鄂ICP备2022015515号-1

    收起
    展开