完整word版Unscrambler97PCAPLS建模分析流程.docx
- 文档编号:24716331
- 上传时间:2023-05-31
- 格式:DOCX
- 页数:35
- 大小:2.11MB
完整word版Unscrambler97PCAPLS建模分析流程.docx
《完整word版Unscrambler97PCAPLS建模分析流程.docx》由会员分享,可在线阅读,更多相关《完整word版Unscrambler97PCAPLS建模分析流程.docx(35页珍藏版)》请在冰豆网上搜索。
完整word版Unscrambler97PCAPLS建模分析流程
byliao
2013.1.23
红外光谱分析
化学计量学软件Unscrambler9.7PLS1红外光谱分析建模(帮助里自带例题消费者对果酱质量的偏爱性分析-tutor_b每一步超详细步骤,自己总结加翻译)PCA\PLS2\PLS1
问题1:
找到覆盆子果酱主要的感官质量特征
问题2:
找出主要感官质量特征和化学测量值的关系
问题3:
通过主要感官质量特征预测未知样的参数
看重
PCA解释方差图(theExplainedVariance:
残余方差曲线),得分和权重
PLS2解释方差图(theExplainedVariance:
残余方差曲线):
残余方差曲线,得分,权重,模型预测能力-PredictedvsMeasured
PLS1解释方差图(theExplainedVariance:
残余方差曲线),
模型预测能力-PredictedvsMeasured,
模型系数RW-RegressionCoefficients,
预测时:
模型预测错误率RMSEP
基本设置:
1打开自带例子tutorialB
LAB为化学变量;Absorban吸收性Soluble可溶解性Acidity酸性为设备变量(比色法测得),6个变量放在设备变量里
preference变量是消费者偏爱性
20个样品:
12个用来建模,叫做校正集;其他8个为预测集。
2插入类别变量Cultivar、HarvestTime
Edit-Insert-CategoryVariable
同理,收获时间分类变量HarvestTime,变量名为蓝色。
数据表中双击选择对应值如下图
3样品、变量设置
Modify-EditSet
样品:
变量:
问题1:
找到覆盆子果酱主要的感官质量特征解决方法
1PCA建模
因为只考虑X变量
分析:
1解释残余方差图
选中右下方,Plot-VariancesandRMSEP
得到解释方差图,3个主成分描述了92%的验证变量信息、97%的校正变量信息。
2解释得分图:
选中得分图,Edit-Options-SampleGrouping-EnableSampleGrouping,再按下图设置:
得到:
按照收获时间分类,分成了三类,以不同颜色标示。
3解释权重矩阵
选中权重矩阵,View-CorrelationLoadings
显示REDNESSandCOLOUR在主成分1的最右边,离得很近,远离中心,非常接近100%解释方差椭圆(内椭圆为50%解释方差),得出颜色和发红性很相关,也意味着得分图右边的样品这两个变量的含量值很高。
主成分2轴上,R.SMELLandR.FLAV在正上方,两者很相关,且与在正下方的FLAV呈负相关。
在得分图上,越往上,有很高R.SMELLandR.FLAV。
得分图和相关权重图显示C2H3andC1H3有很高的REDNESSandCOLOUR特性值;C1H2有很大的off-flavour特性。
在得分图上的样品点的位置对应权重图上相对应位置上的特性变量值。
主成分3描述的变量是sweetness,bitternessandchewingresistance
Plot-Loadings,选择PC1vs.PC3
4解释影响图
左下角是,位于图右上方的样品是outliers,应该被去除。
本图中没有outliers.
保存PCA模型为“TutorialBPCA”。
问题2:
找出主要感官质量特征和化学测量值的关系解决方法
1建立PLS2模型
因为考虑X和Y变量
Task-Regression
点击setup
在PC5处预测误差达到最小值。
但是第一个最小预测误差是在前两个主成分后的0.84,这是必须选择的主成分来避免过拟合。
2找出outliers
下方的warning:
找出outliers。
点击Window-WarningList
点击outliers得出:
1解释方差图
选中左下方图,Plot-VariancesandRMSEP--看模型如何描述6个Y变量_查看解释方差explainedvariance.
theExplainedVariance:
残余方差曲线显示,两个主成分是最佳的。
变量很好地被这两个主成分描述。
85%thecolorvariation(variables1and2),80%的sweetness(6)可以被化学和测量变量解释。
注意:
只有23%的总Y变量被模型解释(用两个主成分)。
total为蓝色。
2解释得分图
得分图
Edit-Options
PC1描述收获时间。
收获时间1在最左边,收获时间在最右边,分的很开。
得分图不显示培养变量Cultivar的信息。
结合loading权重图可以得到更多的信息。
3解释权重图
选中权重图,Plot-LoadingWeights
显示spectrophotometriccolormeasurements(L,A,andB)与colorintensityandredness是负相关的。
Sweetness就像期望的一样与酸度Acidity负相关。
但是R.Flavor与thePLS-factors弱相关(靠近原点、弱的PLS权重)
问题1PCA模型分析结果是jamqualityvariedbothwithrespecttocolor,flavor,andsweetness(果酱质量主要以color,flavor,andsweetness)区分。
现在的模型中显示,chemicalandinstrumental变量主要预测colorandsweetness,但是不能预测Y-variableFlavor。
采用其他设备变量X,例如气相色谱数据,可以提高Y-variableFlavor的预测能力。
1解释模型预测能力图
模型预测能力
选中右下角图,Plot-PredictedvsMeasured:
variableRedness,modelwithtwoPCs
最终四幅图:
保存PLS2模型为“TutorialBInst-Sens”
问题3:
通过主要感官质量特征预测未知样的参数解决方法
1建立PLS1预测模型
Task-Regression
2解释模型预测能力--残余方差图
选中左下角图,点击Window-CopyTo-1
预测方差在0.143时停止降低,因此选择两个主成分PC1、PC2.
3解释预测和测量图PredictedvsMeasured
选中右下角图,点击Plot-PredictedvsMeasured
预测能力很好,虽然一些样品不是很好地被预测,但是总的相关系数很好0.9213,
4解释模型系数BwandB
模型系数告诉我们每一个感官变量对消费者的累计重要性,这些变量可以很好地预测Y变量Preference。
Plot-RegressionCoefficients,选择Weightedcoefficients(BW),两个主成分
双击图中显示屏位置,可以使画出的图是全屏
Edit-Options-bars
Edit-Mark-SignificantX-VariablesOnly
统计分析上,Redness,ColorandSweetness对于预测Preference很重要。
RaspberrySmell也很重要,但是是副作用对应偏爱。
Thickness看起来很重要,因为有很大的副作用,但是该模型不能显示其重要性。
保存模型为“TutorialBSens-Pref”
5打开结果矩阵
File-Import-UnscramblerResults-ImportdataintoNewdatatable
6输出模型
Results-Regression
点击Export
FullASCII-MODexport包含了outliers探测等的所有结果,且可以被其他软件识别。
7预测新变量
Task-Predict
预测存在一些不确定性的限制,模型不是太好,但是这个模型可以被用来预测新果酱样品的偏爱性,预测哪一个样品将会被消费者接受。
保存预测结果为“TutorialBPredict1”。
7RMSEP(预测均方根误差值)
查找原始单元中的错误-RMSEP(预测均方根误差值)
Results-Regression--TutorialBSens-Pref
Plot-andRMSEP
图中显示了所有主成分的偏爱性的预测均方根误差。
前两个主成分的RMSEP是0.83,这意味着预测新样品误差在0.8左右,在可以接受的感官质量特征分析水平内,在所有测量中都有一定的不确定性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word Unscrambler97PCAPLS 建模 分析 流程