R软件一元线性回归分析非常详细.docx
- 文档编号:8096399
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:7
- 大小:88.51KB
R软件一元线性回归分析非常详细.docx
《R软件一元线性回归分析非常详细.docx》由会员分享,可在线阅读,更多相关《R软件一元线性回归分析非常详细.docx(7页珍藏版)》请在冰豆网上搜索。
R软件一元线性回归分析非常详细
R软件一元线性回归分析(非常详细)
R软件一元线性回归分析
合金钢强度与碳含量的数据
序号
碳含量/%
合金钢强度/107pa
1
0.10
42.0
2
0.11
43.0
3
0.12
45.0
4
0.13
45.0
5
0.14
45.0
6
0.15
47.5
7
0.16
49.0
8
0.17
53.0
9
0.18
50.0
10
0.20
55.0
11
0.21
55.0
12
0.23
60.0
这里取碳含量为x是普通变量,取合金钢强度为y是随机变量
使用R软件对以上数据绘出散点图
程序如下:
>x=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45,0.14,45,0.15,47.5,0.16,49,0.17,53,0.18,50,0.2,55,0.21,55,0.23,60),nrow=12,ncol=2,byrow=T,dimnames=list(1:
12,c("C","E")))
>outputcost=as.data.frame(x)
>plot(outputcost$C,outputcost$E)
由于回归模型建立使用的是最小二乘法,而最小二乘法只是一种单纯的数学方法,存在着一定的缺陷,即不论变量间有无相关关系或有无显著线性相关关系,用最小二乘法都可以找到一条直线去拟合变量间关系。
所以回归模型建立之后,还要对其进行显著性检验:
在上面的结果中sd(
)=1.567,sd(
)=9.606。
而对应于两个系数的P值6.27e-09和7.59e-08,故是非常显著的。
关于方程的检验,残差的标准差
=1.309。
相关系数的平方R
=0.9503。
关于F分布的P值为7.585e-08,也是非常显著的。
我们将得到的直线方程画在散点图上,程序如下:
>abline(lm.sol)
得到散点图及相应的回归直线:
下面分析残差:
在R软件中,可用函数residuals()计算回归方程的残差。
程序如下:
>y.res=residuals(lm.sol);
plot(y.res)
得到残差图
从残差图可以看出,第8个点有些反常,这样我们用程序将第8个点的残差标出,程序如下:
>text(8,y.res[8],labels=8,adj=1.2)
这个点可能有问题,下面做简单处理,去掉该样本点,编程如下:
>i=1:
12;
outputcost2=as.data.frame(x[i!
=8,])
lm2=lm(E~C,data=outputcost2)
summary(lm2)
结果输出如下:
Call:
lm(formula=E~C,data=outputcost2)
Residuals:
Min1QMedian3QMax
-1.7567-0.5067-0.13080.68211.6787
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)28.1241.33521.065.75e-09***
C131.2938.21715.986.51e-08***
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
Residualstandarderror:
1.115on9degreesoffreedom
MultipleR-squared:
0.966,AdjustedR-squared:
0.9622
F-statistic:
255.3on1and9DF,p-value:
6.506e-08
由结果分析,去掉第8个点之后,回归方程系数变化不大,R2相关系数有所提高,并且p-值变小了,这说明样本点8可以去掉。
所得新模型较为理想。
总结程序如下:
>x2=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45,0.14,45,0.15,47.5,0.16,49,0.18,50,0.2,55,0.21,55,0.23,60),nrow=11,ncol=2,byrow=T,dimnames=list(1:
11,c("C","E")))
>outputcost=as.data.frame(x2)
>plot(outputcost$C,outputcost$E)
>lm.sol=lm(E~C,data=outputcost)
>summary(lm.sol)
Call:
lm(formula=E~C,data=outputcost)
Residuals:
Min1QMedian3QMax
-1.7567-0.5067-0.13080.68211.6787
Coefficients:
EstimateStd.ErrortvaluePr(>|t|)
(Intercept)28.1241.33521.065.75e-09***
C131.2938.21715.986.51e-08***
---
Signif.codes:
0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1
Residualstandarderror:
1.115on9degreesoffreedom
MultipleR-squared:
0.966,AdjustedR-squared:
0.9622
F-statistic:
255.3on1and9DF,p-value:
6.506e-08
>abline(lm.sol)
得到最后的散点图和回归直线
得到回归方程:
=28.124+131.293x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 软件 一元 线性 回归 分析 非常 详细