工程数学作业实验06北工大软件学院.docx
- 文档编号:23154578
- 上传时间:2023-05-08
- 格式:DOCX
- 页数:23
- 大小:172.44KB
工程数学作业实验06北工大软件学院.docx
《工程数学作业实验06北工大软件学院.docx》由会员分享,可在线阅读,更多相关《工程数学作业实验06北工大软件学院.docx(23页珍藏版)》请在冰豆网上搜索。
工程数学作业实验06北工大软件学院
1.回归分析
法国经济数据分析,考虑进口总额Y与三个自变量:
国内总产值X1,存储量X2,总消费量X3(单位为10亿法郎)之间的关系。
现收集了1949年至1959年共11年的数据,如表6.1所示,试对此数据进行分析。
表6.1法国经济分析数据
序号
X1
X2
X3
Y
1
149.3
4.2
108.1
15.9
2
161.2
4.1
114.8
16.4
3
171.5
3.1
123.2
19.0
4
175.5
3.1
126.9
19.1
5
180.8
1.1
132.1
18.8
6
190.7
2.2
137.7
20.4
7
202.1
2.1
146.0
22.7
8
212.4
5.6
154.1
26.5
9
226.1
5.0
162.3
28.1
10
231.9
5.1
164.3
27.6
11
239.0
0.7
167.6
26.3
(1)求出Y关于X1,X2和X3的线性回归方程,并对方程作显著性检验;
(2)分析所得到的回归方程是否合理,对变量作逐步回归;
(3)假设某年的国内总产值(X1)、存储量(X2)和总消费量(X3)分别为240、4.5和170(单位为10亿法郎),给出该年进口总额(Y)的预测值、相应的置信区间和预测区间(α=0.05)。
解:
(1)
输入程序:
X1<-c(149.3,161.2,171.5,175.5,180.8,190.7,202.1,212.4,226.1,231.9,239)
X2<-c(4.2,4.1,3.1,3.1,1.1,2.2,2.1,5.6,5.0,5.1,0.7)
X3<-c(108.1,114.8,123.2,126.9,132.1,137.7,146.0,154.1,162.3,164.3,167.6)
Y<-c(15.9,16.4,19,19.1,18.8,20.4,22.7,26.5,28.1,27.6,26.3)
lm.sol<-lm(Y~X1+X2+X3)
summary(lm.sol)
运行结果:
Call:
lm(formula=Y~X1+X2+X3)
Residuals:
Min1QMedian3QMax
-0.52367-0.389530.054240.226440.78313
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)-10.127991.21216-8.3556.9e-05***
X1-0.051400.07028-0.7310.488344
X20.586950.094626.2030.000444***
X30.286850.102212.8070.026277*
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
Residualstandarderror:
0.4889on7degreesoffreedom
MultipleR-squared:
0.9919,AdjustedR-squared:
0.9884
F-statistic:
285.6on3and7DF,p-value:
1.112e-07
结果分析:
可知Y关于
的线性回归方程:
y=-10.12799-0.05140x1+0.58695x2+0.28685x3
其中:
x1无标记说明不显著,x2标记“***”说明极为显著,x3标记“*”显著。
(2)由
(1)中的数据可以得知新的分析函数anova(lm.sol)R程序
输入程序:
X1<-c(149.3,161.2,171.5,175.5,180.8,190.7,202.1,212.4,226.1,231.9,239)
X2<-c(4.2,4.1,3.1,3.1,1.1,2.2,2.1,5.6,5.0,5.1,0.7)
X3<-c(108.1,114.8,123.2,126.9,132.1,137.7,146.0,154.1,162.3,164.3,167.6)
Y<-c(15.9,16.4,19,19.1,18.8,20.4,22.7,26.5,28.1,27.6,26.3)
lm.sol<-lm(Y~X1+X2+X3,data=blood)
summary(lm.sol)
anova(lm.sol)
运行结果:
Call:
lm(formula=Y~X1+X2+X3)
Residuals:
Min1QMedian3QMax
-0.52367-0.389530.054240.226440.78313
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)-10.127991.21216-8.3556.9e-05***
X1-0.051400.07028-0.7310.488344
X20.586950.094626.2030.000444***
X30.286850.102212.8070.026277*
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
Residualstandarderror:
0.4889on7degreesoffreedom
MultipleR-squared:
0.9919,AdjustedR-squared:
0.9884
F-statistic:
285.6on3and7DF,p-value:
1.112e-07
>anova(lm.sol)
AnalysisofVarianceTable
Response:
Y
DfSumSqMeanSqFvaluePr(>F)
X11192.361192.361804.88331.738e-08***
X2110.53210.53244.07000.0002936***
X311.8821.8827.87650.0262771*
Residuals71.6730.239
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1
结果分析:
可以看出均能通过显著性检验,因此可得到更为恰当与精确的Y与
,
的线性关系:
Y=-9.742740+0.596052x2+0.212305x3
(3)由
(1)与
(2)中的线性方程可分别得出对应的Y值为28.94179和29.03138
输入程序:
new<-data.frame(X1=240,X2=4.5,X3=170)
predict(lm.sol,new,interval="confidence",level=0.95)
predict(lm.sol,new,interval="prediction",level=0.95)
运行结果:
fitlwrupr
128.9424828.1992429.68572
fitlwrupr
128.9424827.5681730.31678
结果分析:
Y的预测值为28.94248,置信区间为[28.19924,29.68572],预测区间为[27.56817,30.31678]
解:
(1)对数据做方差分析
设:
H0为4个品系无显著差异,对立假设H1为有差异
输入R程序:
lamp<-data.frame(
X=c(63,65,64,65,61,68,65,65,63,64
56,54,58,57,57,57,60,59,63,62
61,61,67,62,62,60,67,66,63,65
53,58,60,56,55,60,59,61,60,59),
A=factor(rep(1:
4,c(10,10,10,10))))
lamp.lm<-lm(X~A,data=lamp)
anova(lamp.aov)
运行结果为:
AnalysisofVarianceTable
Response:
X
DfSumSqMeanSqFvaluePr(>F)
A3323.48107.8317.5253.51e-07***
Residuals36221.506.15
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
运行结果分析:
由于P值=3.51e-07<0.05,H0假设不成立,所以4个品系小麦株高有显著差异。
(2)四中品系组合比较有以下几种情况:
1与2、1与3、1与4、2与3、2与4、3与4等6种情况。
1与2比较的R程序为:
lamp<-data.frame(
X=c(63,65,64,65,61,68,65,65,63,64
56,54,58,57,57,57,60,59,63,62),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
运行结果为:
DfSumSqMeanSqFvaluePr(>F)
A1180.000180.00032.9941.912e-05***
Residuals1898.2005.456
1与3比较的R程序为:
lamp<-data.frame(
X=c(63,65,64,65,61,68,65,65,63,64
61,61,67,62,62,60,67,66,63,65),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
运行结果为:
DfSumSqMeanSqFvaluePr(>F)
A14.0504.0500.78810.3864
Residuals1892.5005.139
1与4比较的R程序为:
lamp<-data.frame(
X=c(63,65,64,65,61,68,65,65,63,64
53,58,60,56,55,60,59,61,60,59),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
运行结果为:
DfSumSqMeanSqFvaluePr(>F)
A1192.200192.20038.0188.039e-06***
Residuals1891.0005.056
2与3比较的R程序为:
lamp<-data.frame(
X=c(56,54,58,57,57,57,60,59,63,62
61,61,67,62,62,60,67,66,63,65),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
DfSumSqMeanSqFvaluePr(>F)
A1130.05130.0517.9380.0004976***
Residuals18130.507.25
2与4比较的R程序为:
lamp<-data.frame(
X=c(56,54,58,57,57,57,60,59,63,62
53,58,60,56,55,60,59,61,60,59),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
运行结果为:
DfSumSqMeanSqFvaluePr(>F)
A10.2000.2000.02790.8692
Residuals18129.0007.167
3与4比较的R程序为:
lamp<-data.frame(
X=c(61,61,67,62,62,60,67,66,63,65
53,58,60,56,55,60,59,61,60,59),
A=factor(rep(1:
2,c(10,10))))
lamp.aov<-aov(X~A,data=lamp)
summary(lamp.aov)
运行结果为:
DfSumSqMeanSqFvaluePr(>F)
A1140.45140.4520.5040.0002604***
Residuals18123.306.85
运行结果分析:
1与3,2与4的P值均>0.05,故1与3,2与4品系小麦株高无显著差异;1与2,1与4,2与3,3与4的P值均<0.05,故1与2,1与4,2与3,3与4品系小麦株高有显著差异。
(3)
与上题结论一致
3.方差分析II(双因素方差分析)
为了提高化工厂的产品质量,需要寻求最优反应温度与反应压力的配合,为
此选择如下水平:
A:
反应温度(℃)607080
B:
反应压力(公斤)22.53
在每个AiBj条件下做两次试验,其产量如表6.3所示.
表6.3试验数据
A1
A2
A3
B1
4.6
4.3
6.1
6.5
6.8
6.4
B2
6.3
6.7
3.4
3.8
4.0
3.8
B3
4.7
1.3
3.9
3.5
6.5
7.0
(1)对数据作方差分析(考虑有交互作用的情况):
(2)计算各种反应温度下产量均值的估计,各种反应压力下产量均值的估计,以及同时考虑温度和压力下产量均值的估计;
(3)通过
(1)与
(2)计算结果来说明,在今后的生产中,我们将如何选择生产的反应温度和反应压力,使得这些条件对生产最有利(注意,一定要说明你的理由)。
解:
(1)从数据分析,可得:
输入程序:
tree<-data.frame(
Y=c(4.6,4.3,6.1,6.5,6.8,6.4,6.3,6.7,3.4,
3.8,4.0,3.8,4.7,4.3,3.9,3.5,6.5,7.0),
A=gl(3,6,18,labels=paste("A",1:
3,sep="")),
B=gl(3,2,18,labels=paste("B",1:
3,sep=""))
)
tree.aov<-aov(Y~A+B+A:
B,data=tree)
summary(tree.aov)
运行结果:
tree<-data.frame(
+Y=c(4.6,4.3,6.1,6.5,6.8,6.4,6.3,6.7,3.4,3.8,
+4.0,3.8,4.7,4.3,3.9,3.5,6.5,7.0),
+A=gl(3,6,18,labels=paste("A",1:
3,sep="")),
+B=gl(3,2,18,labels=paste("B",1:
3,sep=""))
+)
>tree.aov<-aov(Y~A+B+A:
B,data=tree)
>summary(tree.aov)
DfSumSqMeanSqFvaluePr(>F)
A23.97441.987226.6940.0001645***
B24.44112.220629.8280.0001069***
A:
B421.15895.289771.0568.337e-07***
Residuals90.67000.0744
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1
结果分析:
可知反应温度与反应压力均高度显著,二者间也有着高度交互作用。
(2)由题中已知条件可以推出反应温度与压力均值表格如下:
A1(60º)
A2(70º)
A3(80º)
均值
B1(2公斤)
4.6
4.3
6.1
6.5
6.8
6.4
5.78
B2(2.5公斤)
6.3
6.7
3.4
3.8
4
3.8
4.67
B3(3公斤)
4.7
4.3
3.9
3.5
6.5
7
4.98
均值
5.15
4.53
5.75
进一步可以得到反应温度与压力综合的表格
产量均值
A1(60º)
A2(70º)
A3(80º)
B1(2公斤)
4.45
6.3
6.6
B2(2.5公斤)
6.5
3.6
3.9
B3(3公斤)
4.5
3.7
6.75
从表中数据可以看出当反应压力B3(3公斤),反应温度为A3(80º)为最优的生产方案,其值为6.75。
(3)
从解
(2)中表格的数据分析可以看出产量随着压力的增加先抑后扬,随温度的增长也是先增后降,但是其规律存在一定的差异,从表中数据可以看出:
1)压力与温度都很高时产量较大,但是压力与温度过高就会对设备、人员、技术提出很高的要求,使生产成本过高;
2)适当的压力与温度条件下也可以得到较高的产量。
所以综合各方面的因素而言适当的反应温度与反应压力获得相对较高的产量降低生产的各方面要求以获取较大的生产利益为最优策略。
4、判别分析
(1)对Af蠓虫与Apf蠓虫做判别分析,
一.距离判别
由题目要求可以得出如下的R程序判别分析
discriminiant.distance<-function
(TrnX1,TrnX2,TstX=NULL,var.equal=FALSE){
if(is.null(TstX)==TRUE)TstX<-rbind(TrnX1,TrnX2)
if(is.vector(TstX)==TRUE)TstX<-t(as.matrix(TstX))
elseif(is.matrix(TstX)!
=TRUE)
TstX<-as.matrix(TstX)
if(is.matrix(TrnX1)!
=TRUE)TrnX1<-as.matrix(TrnX1)
if(is.matrix(TrnX2)!
=TRUE)TrnX2<-as.matrix(TrnX2)
nx<-nrow(TstX)
blong<-matrix(rep(0,nx),nrow=1,byrow=TRUE,
dimnames=list("blong",1:
nx))
mu1<-colMeans(TrnX1);mu2<-colMeans(TrnX2)
if(var.equal==TRUE||var.equal==T){
S<-var(rbind(TrnX1,TrnX2))
w<-mahalanobis(TstX,mu2,S)-mahalanobis(TstX,mu1,S)
}
else{
S1<-var(TrnX1);S2<-var(TrnX2)
w<-mahalanobis(TstX,mu2,S2)-mahalanobis(TstX,mu1,S1)
}
for(iin1:
nx){
if(w[i]>0)
blong[i]<-1
else
blong[i]<-2
}
blong
}
1.对于输入标本(1.24,1.80)
classX1<-matrix(
c(1.24,1.36,1.38,1.38,1.38,1.40,1.48,1.54,1.56,1.27,1.74,1.64,1.82,1.90,1.70,1.82,1.82,2.08),
nrow=9,byrow=F)
classX2<-matrix(
c(1.14,1.18,1.20,1.26,1.28,1.30,1.78,1.96,1.86,2.00,2.00,1.96),
nrow=6,byrow=F)
test<-matrix(c(1.24,1.80),nrow=1,byrow=T)
discriminiant.distance(classX1,classX2,test,var.equal=TRUE)
discriminiant.distance(classX1,classX2,test)
运行后可得:
>discriminiant.distance(classX1,classX2,test,var.equal=TRUE)
1
blong1
>discriminiant.distance(classX1,classX2,test)
1
blong2
可以得知当方差相同时标本(1.24,1.80)属于Af蠓虫;
当方差不相同时标本(1.24,1.80)属于Apf蠓虫;
2.对于标本(1.28,1.84)
classX1<-matrix(
c(1.24,1.36,1.38,1.38,1.38,1.40,1.48,1.54,1.56,1.27,1.74,1.64,1.82,1.90,1.70,1.82,1.82,2.08),
nrow=9,byrow=F)
classX2<-matrix(
c(1.14,1.18,1.20,1.26,1.28,1.30,1.78,1.96,1.86,2.00,2.00,1.96),
nrow=6,byrow=F)
test<-matrix(c(1.28,1.84),nrow=1,byrow=T)
discriminiant.distance(classX1,classX2,test,var.equal=TRUE)
discriminiant.distance(classX1,classX2,test)
运行后可以得出;
>discriminiant.distance(classX1,classX2,test,var.equal=TRUE)
1
blong2
>discriminiant.distance(classX1,classX2,test)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工程数学 作业 实验06北工大 软件学院 工程 数学 实验 06 北工大 软件 学院