实验2回归分析Word格式文档下载.docx
- 文档编号:15900766
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:14
- 大小:180.46KB
实验2回归分析Word格式文档下载.docx
《实验2回归分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《实验2回归分析Word格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
FitResiduals(拟合的残差),SummaryReport(总结性报告)等.
3.抹平“集合的集合”的命令Flatten
命令Flatten[A]将集合的集合A抹平为只有一个层次的集合.例如,输入
Flatten[{{1,2,3},{1,{3}}}]
则输出
{1,2,3,1,3}.
4.非线性拟合的命令NonlinearFit
使用的基本格式为
NonlinearFit[数据,拟合函数,(拟合函数中的)变量集,(拟合函数中的)参数,选项]
拟合函数中既有变量又有参数,变量的个数要与数据的形式相应.参数集中往往需
要给出各参数的初值.选项的内容主要是指定拟合算法、迭代次数和精度.
实验举例
例2.1(教材例2.1)某建材实验室做陶粒混凝土实验室中,考察每立方米
混凝土的水泥用量(kg)对混凝土抗压强度
的影响,测得下列数据:
(1)画出散点图;
(2)求y关于x的线性回归方程
并作回归分析;
(3)设
kg,求y的预测值及置信水平为0.95的预测区间.
先输入数据:
aa={{150,56.9},{160,58.3},{170,61.6},{180,64.6},{190,68.1},{200,71.3},
{210,74.1},{220,77.4},{230,80.2},{240,82.6},{250,86.4},{260,89.7}};
(1)作出数据表的散点图.输入
ListPlot[aa,PlotRange->
{{140,270},{50,90}}]
则输出图2.1.
图2.1
(2)作一元回归分析,输入
Regress[aa,{1,x},x,RegressionReport->
{BestFit,
ParameterCITable,SummaryReport}]
{BestFit->
10.2829+0.303986x,ParameterCITable->
EstimateSECI
110.28290.850375{8.388111,12.1776},
x0.3039860.00409058{0.294872,0.3131}
ParameterTable->
EsimateSETstatPValue
110.28290.85037512.09222.71852
x0.3039860.0040905874.31374.88498
Rsquared->
0.998193,AdjustedRSquared->
0.998012,
EstimatedVariance->
0.0407025,ANOVATable->
DFSumOfSqMeanSqFratioPValue
Model11321.431321.435522.524.77396
Error102.39280.23928
Total111323.82
现对上述回归分析报告说明如下:
BestFit(最优拟合)->
10.2829+0.303986x表示一元回归方程为
;
ParameterCITable(参数置信区间表)中:
Estimate这一列表示回归函数中参数a,b的点估计为
=10.2829(第一行),
=0.303986(第二行);
SE这一列的第一行表示估计量
的标准差为0.850375,第二行表示估计量
的标准差为0.00409058;
CI这一列分别表示
的置信水平为0.95的置信区间是(8.388111,12.1776),
的置信水平为0.95的置信区间是
(0.294872,0.3131).
ParameterTable(参数表)中前两列的意义同参数置信区间表;
Tstat与Pvalue这两列的第一行表示作假设检验(t检验):
时,T统计量的观察值为12.0922,检验统计量的P值为2.71852
这个P值非常小,检验结果强烈地否定
接受
第二行表示作假设检验(t检验):
时T统计量的观察值为74.3137,检验统计量的P值为4.88498
这个P值也非常小,检验结果强烈地否定
接受
.
0.998193,表示
它说明y的变化有99.8%来自x的变化;
AdjustedRSquared->
0.998012,表示修正后的
0.998012.
0.0407025,表示线性模型
中方差
的估计为0.0407025.
ANOVATable(回归方差分析表)中的DF这一列为自由度:
Model(一元线性回归模型)的自由度为1,Error(残差)的自由度为
Total(总的)自由度为
SumOfSq这一列为平方和:
回归平方和
1321.43,残差平方和
2.3928,总的平方和
1323.82;
MeanSq这一列是平方和的平均值,由SumOfSq这一列除以对应的DF得到,即
FRatio这一列为统计量
的值,即
最后一列表示统计量F的P值非常接近于0.因此在作模型参数
的假设检验(F检验):
时,强烈地否定
即模型的参数向量
因此回归效果
非常显著.
(3)在命令RegressionReport的选项中增加
RegressionReport->
{SinglePredictionCITable}
就可以得到在变量x的观察点处的y的预测值和预测区间.虽然
不是观察点,但是可以用线性插值的方法得到近似的置信区间.输入
aa=Sort[aa];
(*对数据aa按照水泥用量x的大小进行排序*)
regress2=Regress[aa,{1,x},x,RegressionReport->
{SinglePredictionCITable}]
(*对数据aa作线性回归,回归报告输出y值的预测区间*)
执行后输出
{SinglePredictionCITable->
ObservedPredictedSECI
56.955.88080.55663{54.6405,57.121}
58.358.92060.541391{57.7143,60.1269}
61.661.96050.528883{60.7821,63.1389}
64.665.00030.519305{63.8433,66.1574}
68.168.04020.51282{66.8976,69.1828}
71.371.08010.509547{69.9447,72.2154}}
74.174.11990.509547{72.9846,75.2553}
77.477.15980.51282{76.0172,78.3024}
80.280.19970.519305{79.0426,81.3567}
82.683.23950.528883{82.0611,84.4179}
86.486.27940.541391{85.0731,87.4857}
89.789.31920.55663{88.079,90.5595}
上表中第一列是观察到的y的值,第二列是y的预测值,第三列是标准差,第四列是相应的预测区间(置信度为0.95).从上表可见在
时,y的预测值为77.1598,置信度为0.95的预测区间为(76.0172,75.2553),在
时,y的预测值为80.1997,置信度为0.95的预测区间为{79.0426,81.3567}.利用线性回归方程,可算得
时,y的预测值为78.68,置信度为0.95的预测区间为(77.546,79.814).
利用上述插值思想,可以进一步作出预测区间的图形.
先输入调用图软件包命令
Graphics`
执行后再输入
{observed2,predicted2,se2,ci2}
=Transpose[(SinglePredictionCITable/.regress2)[[1]]];
(*取出上面输出表中的四组数据,分别记作observed2,predicted2,se2,ci2*)
xva12=Map[First,aa];
(*取出数据aa中的第一列,即数据中x的值,记作xva12*)
Predicted3=Transpose[{xva12,predicted2}];
(*把x的值xva12与相应的预测值predicted2配成数对,它们应该在一条回
归直线上*)
lowerCI2=Transpose[{xva12,Map[First,ci2]}];
(*Map[First,ci2]取出预测区间的第一个值,即置信下限.x的值xva12与相应
的置信下限配成数对*)
upperCI2=Transpose[{xva12,Map[Last,ci2]}];
(*Map[Last,ci2]取出预测区间的第二个值,即置信上限.x的值xva12与相应
的置信上限配成数对*)
MultipleListPlot[aa,Predicted3,lowerCI2,upperCI2,
PlotJoined->
{False,True,True,True},
SymbolShape->
{PlotSymbol[Diamond],None,None,None},
PlotStyle->
{Automatic,Automatic,Dashing[{0.04,0.04}],
Dashing[{0.04,0.04}]}]
(*把原始数据aa和上面命令得到的三组数对predicted3,lowerCI2,upperCI2
用多重散点图命令MultipleListPlot在同一个坐标中画出来.图形中数据
aa的散点图不用线段连接起来,其余的三组散点图用线段连接起来,而
且最后两组数据的散点图用虚线连接.*)
则输出图2.2.
图2.2
从图形中可以看到,由Y的预测值连接起来的实线就是回归直线.钻石形的点是原始数
据.虚线构成预测区间.
多元线性回归
例2.2(教材例2.2)一种合金在某种添加剂的不同浓度下,各做三次试验,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验2 回归分析 实验 回归 分析