案例库 项目八假设检验 回归分析与方差分析.docx
- 文档编号:27971170
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:11
- 大小:69.50KB
案例库 项目八假设检验 回归分析与方差分析.docx
《案例库 项目八假设检验 回归分析与方差分析.docx》由会员分享,可在线阅读,更多相关《案例库 项目八假设检验 回归分析与方差分析.docx(11页珍藏版)》请在冰豆网上搜索。
案例库项目八假设检验回归分析与方差分析
项目八假设检验、回归分析与方差分析
实验3方差分析
实验目的学习利用Mathematica求单因素方差分析的方法.
基本命令
1.调用线性回归软件包的命令< 作方差分析时,必须调用线性回归软件包的命令 < 或输入调用整个统计软件包命令 < 2.线性设计回归的命令DesignedRegress 在线性回归模型 Y? ? X? ? ? ? 中,向量Y是因变量,也称作响应变量.矩阵X称作设计矩阵,? 是参数向量? ? 是误差向量? ? ? ? ? ? ? ? ? DesignedRegress也是作一元和多元线性回归的命令,它的应用范围更广些.其格式与命令Regress的格式略有不同: DesignedRegress[设计矩阵X,因变量Y的值集合, RegressionReport->{选项1,选项2,选项3,…}] RegressionReport(回归报告)可以包含: ParameterCITable(参数? 的置信区间表? ? ? ? ? PredictedResponse(因变量的预测值),MeanPredictionCITable(均值的预测区间), FitResiduals(拟合的残差),SummaryReport(总结性报告)等,但不含BestFit. 实验准备—将方差分析问题纳入线性回归问题 在线性回归中,把总的平方和分解为回归平方和与误差平方和之和,并在输出中给出了方差分析表.而在方差分析问题中,也把总的平方和分解为模型平方和与误差平方和之和,其方法与线性回归中的方法相同.因此只要把方差分析问题转化为线性模型的问题,就可以利用线性回归中的设计回归命令DesignedRegress做方差分析. 单因素试验方差分析的模型是 (3.1) 上式也可改写成 (3.2) 给定具体数据后,还可(2.2)式写成线性模型的形式: Y? ? X? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 其中X称为设计矩阵,它的元素是0或1.由于(3.2)的每一个等式的右边都有 因此X的第一列都是1,线性模型中就有了必须要有的常数这一列. 是线性模型中的参数. 相当于线性模型中常数项 相当于线性模型中的参数 当然也可以用 或 代替 .Y是因变量(向量),? ? 是误差向量.可以通过下面的例子来了解和熟悉此方法. 实验举例 例3.1(教材例3.1)今有某种型号的电池三批,它们分别是A,B,C三个工厂所生产的.为评比起质量,各随机抽取5只电池为样品,经试验得其寿命(单位: h)如下表: A 40 42 48 45 38 B 26 28 34 32 30 C 39 50 40 50 43 试在显着性水平0.05下检验电池的平均寿命有无显着的差异.若差异是显着的,试求均值差 及 的置信水平为95%的置信区间. 这是方差分析问题,先把它转化为线性模型: Y? ? X? ? ? ? ? 令 则线性模型(3.3)与方差分析模型(3.1)完全等价.模型(3.3)完全可以用DesignedRegress命令作设计回归,得到所要的方差分析表. 我们面临的任务是: (1)检验3个总体的均值是否相等,即作假设检验 (2)求均值差 及 的置信水平为95%的置信区间. 任务 (1)等价于对模型(3.3)作检验: 而任务 (2)等价于求 的置信区间.在DesignedRegress命令中加入选项 RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport} 后便能完成上述任务. 用回归分析作单因素方差分析 完成对模型的假设检验和对模型参数的区间估计任务.输入设计矩阵和数据 X1={{1.0,0,0},{1,0,0},{1,0,0},{1,0,0},{1,0,0},{1,1,0},{1,1,0},{1,1,0}, {1,1,0},{1,1,0},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1}}; Y1={40,42,48,45,38,26,28,34,32,30,39,50,40,50,43}; 再输入设计回归命令 DesignedRegress[X1,Y1,RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}] (*回归报告输出参数的置信区间,均值的置信区间和总结报告*) 执行后得到输出 EstimateSECI 142.61.89912{38.4622,46.7378} {ParameterCITable->2-12.62.68576{-18.4518,-6.74822} 31.82.68576{-4.05178,7.65178} MeanPredictionCITable-> ObservedPredictedSECI 40.42.61.89912{38.4622,46.7378} 42.42.61.89912{38.4622,46.7378} 48.42.61.89912{38.4622,46.7378} 45.42.61.89912{38.4622,46.7378} 38.42.61.89912{38.4622,46.7378} 26.30.1.89912{25.8622,34.1378} 28.30.1.89912{25.8622,34.1378} 34.30.1.89912{25.8622,34.1378} 32.30.1.89912{25.8622,34.1378} 30.30.1.89912{25.8622,34.1378} 39.44.41.89912{40.2622,48.5378} 50.44.41.89912{40.2622,48.5378} 40.44.41.89912{40.2622,48.5378} 50.44.41.89912{40.2622,48.5378} 43.44.41.89912{40.2622,48.5378} EstimateSETStatPValue 142.61.8991222.43143.63987×10-11 {ParameterCITable->2-12.62.68576-4.69140.00052196 31.82.685760.67020.515421 Rsquared->0.739904,AdjustedRSquared->0.696554, EstimatedVariance->18.0333,ANOVATable-> DFSumOfsqMeanSqFratioPvalue Model2615.6307.817.06840.000309602 Error12216.418.0333 Total14832. 从参数置信区间表(ParameterCITable)可知: 的点估计是42.6,估计量的标准差为1.89912, 的置信水平为0.95的置信区间是(38.4622,46.7378). 的点估计是? 12.6,标准差为2.68576, 的置信水平为0.95的置信区间是 的点估计是1.8,标准差为2.68576, 的置信水平为0.95的置信区间是 从均值置信区间表(MeanPredictionCITable)知: 的点估计, 的置信区间同参数置信区间表, 的点估计为30.0,置信度为0.95的置信区间是 的点估计为44.4,置信度为0.95的置信区间是 从参数表(ParameterTable)知: 关于 是否等于零的假设检验结果是否定的,即 不等于零.关于 是否等于零的假设检验结果是不否定原假设,即不否定 等于零的假设. 从Rsquared->0.739904知Y的变化中的74%是由模型引起的,26%是由误差引起的. 从EstimatedVariance->18.0333知模型中的误差项? 的方差的估计是? ? ? ? ? ? ? ? 最后从方差分析表知平方和的分解结果是: 总的平方和? 832.0,模型引起的平方和(效应平方和)? ? ? ? ? ? ? 误差平方和? ? ? ? ? ? ? ? 作假设检验? 时? ? 统计量F的观察值为17.0684,F的P值为0.000309602,检验结果显然否定原假设,即三个工厂生产的电池的平均寿命有显着差异. 总结起来: 三个工厂生产的电池的平均寿命有显着差异. 的置信水平为0.95的置信区间是(6.74822,18.4518). 的置信水平为0.95的置信区间是 ? ? ? ? ? ? ? 看来只有 的置信区间未能求得.只要改变设计矩阵X,再作一次设计回归. 输入 X2={{1.0,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{0,1,1},{0,1,1},{0,1,1}, {0,1,1},{0,1,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1}}; ? ? DesignedRegress[X2,Y1,RegressionReport-> {ParameterCITable,MeanPredictionCITable,SummaryReport}] 就能得到类似于对 的设计回归结果(输出结果省略了),从参数置信区间表可以得到 的置信水平为0.95的置信区间是 例3.2(教材例3.2)将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效.下表中列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比.试在水平 下检验这些百分比的均值有无显着的差异. 青霉素四环素链霉素红霉素氯霉素 29.627.35.821.629.2 24.332.66.217.432.8 28.530.811.018.325.0 32.034.88.319.024.2 本例也是单因素方差分析问题.输入 X3={{1.0,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,1,0,0,0},{1,1,0,0,0}, {1,1,0,0,0},{1,1,0,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0}, {1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,0,1},{1,0,0,0,1}, {1,0,0,0,1},{1,0,0,0,1}}; Y3={29.6,24.3,28.5,32.0,27.3,32.6,30.8,34.8,5.8,6.2,11.0,8.3,21.6,17.4, 18.3,19.0,29.2,32.8,25.0,24.2}; DesignedRegress[X3,Y3,RegressionReport-> {ParameterCITable,MeanPredictionCITable,SummaryReport}] 执行以后得到输出 {ParameterCITable-> EstimateSECI 128.61.50456{25.3931,31.8069} 22.7752.12777{? 1.76024,731024} 3? 20.7752.12777{? 25.3102,? 16.2398} 4? 9.5252.12777{? 14.0602,? 4.98976} 5? 0.82.12777{? 5.33524,3.73524} {ParameterTable-> EstimateSETStatPValue 128.61.5045619.00886.58118×10? 12 22.7752.127771.304180.21183 3? 20.7752.12777? 9.763736.83788×10? 8 4? 9.5252.12777? 4.476510.000443597 5? 0.82.12777? 0.375980.712196 Rsquared->0.915985,AdjustedRSquared->0.893581, EstimatedVariance->9.05483,ANOVATable-> DFSumofsqMeanSqFratioPvalue Model41480.82370.20640.88496.73978×10? 8 Error15135.8229.05483 Total191616.65 因为F检验的P值非常小,所以即使在检验的水平 时,这些百分比的均值有显着差异. 注: 利用Mathematica语句,我们也可以直接编程计算方差分析表.有兴趣的读者可参考更高一级的实验教材(如[10],[11]等). 实验习题 1.设有三台机器用来生产规格相同的铝合金薄板.取样,测量薄板的厚度精确至千分之一厘米,得结果如下表: 考察机器这一因素对薄板厚度有无显着的影响 2.下表给出了小白鼠在接种3种不同菌型的伤寒杆菌后存活的天数 试问,小白鼠在接种了不同菌型的伤寒杆菌后存活的天数是否有显着性差异
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 案例库 项目八假设检验 回归分析与方差分析 案例 项目 假设检验 回归 分析 方差分析