第4章-回归分析.ppt
- 文档编号:30799181
- 上传时间:2023-10-12
- 格式:PPT
- 页数:53
- 大小:280KB
第4章-回归分析.ppt
《第4章-回归分析.ppt》由会员分享,可在线阅读,更多相关《第4章-回归分析.ppt(53页珍藏版)》请在冰豆网上搜索。
1,2023/10/12,第四章试验数据的回归分析,2,2023/10/12,本章主要授课内容基本概念一元线性回归分析多元线性回归分析,3,2023/10/12,4.1基本概念,
(1)相互关系确定性关系:
变量之间存在着严格的函数关系,当一个或几个变量取一定值时,另一个变量有确定值与之相对应。
相关关系:
变量之间近似存在某种函数关系,当一个或几个相互关系的变量取一定值时,与之对应的另一个变量的数值虽然不确定,但它仍按某种规律在一定范围内变化。
相关关系是一种统计关系,具有一定的周期性。
变量之间的确定性关系和相关关系,在一定条件下是可以相互转换的。
4,2023/10/12,
(2)回归分析(regressionanalysis)处理变量之间相关关系最常用的统计方法,可以寻找隐藏在随机性后面的统计规律。
回归分析的主要内容:
确定回归方程:
变量之间近似的函数关系式检验回归方程的显著性试验结果预测回归分析的分类:
一元回归分析:
研究一个因素与试验指标间相关关系多元回归分析:
研究几个因素与试验指标间相关关系,5,2023/10/12,4.2一元线性回归分析/直线拟合4.2.1一元线性回归方程的建立,直线回归的一般数学模型,6,2023/10/12,例4-1:
为研究某合成物的转化率T(%)与试验中的压强p(atm,1atm=101.325kpa)的关系,得到如下的试验数据。
试采用最小二乘法确定转化率与压强的经验公式。
解:
(1)根据试验数据在直角坐标系绘制T-p散点图,如下所示,试验数据点近似于直线分布,故可设T-p的回归关系为T=b0+bp,7,2023/10/12,T=1.155+0.4573P,8,2023/10/12,4.2.2一元线性回归效果的检验,无重复数据的直线回归显著性检验方程显著性检验回归系数检验有重复数据的直线回归显著性检验失拟检验方程显著性检验回归系数检验,9,2023/10/12,1)方程显著性检验,1.无重复数据直线回归方程检验,H0:
0检验结果显著与否,表明在所得出的直线方程的基础上,x对y的决定作用是否显著。
直线回归方程把x=xi处的观察值yi分成了两部分:
其中:
是按照回归方程由xi决定的部分,或者说xi能控制的部分,ei则是xi不能控制的部分。
10,2023/10/12,定义:
是所有xi不能控制的y的变异总量是所有xi能控制的y的变异总量是y的总变异量即y的偏差平方和U称为回归平方和,其自由度为1;Q称为剩余平方和,其自由度为剩余自由度,即总自由度减去回归自由度。
在直线回归模型下,上述三者有如下关系:
11,2023/10/12,回归平方和与剩余平方和的计算:
12,2023/10/12,定义统计量给定显著性水平,如果FF(1,n-2),则表明回归方程显著存在(P),13,2023/10/12,经计算,对于例1的方程而言,因此,所求得的回归方程是极显著的(P0.01),14,2023/10/12,2)系数b的显著性检验,H0:
0定义统计量如果tt(n-2),则拒绝假设,即系数b显著,或者说x对y的线性决定作用显著。
对于直线回归,回归系数b的检验和方程显著性检验是一致的,只进行一种就可以了。
15,2023/10/12,3)系数b0的显著性检验,检验的统计量为,如果tt(n-2),则系数b0显著,或者说直线不通过原点。
H0:
00,16,2023/10/12,对例1因而,b0是显著的(P0.01),也就是说,回归直线不通过原点。
17,2023/10/12,1)回归直线建立有重复回归试验结果的数据表结构如下:
2.有重复数据的直线回归检验,18,2023/10/12,回归方程计算时,从无重复数据情况导出的公式仍然有效。
即但此时,虽然lxx、lyy、lxy的定义没有变化,但它的计算过程有点区别。
采用计算机处理时,可将每个重复数据单独当作一组数据输入,19,2023/10/12,例42下表是某试验中观察到的12个观察值,其中每个xi重复观察了2次。
求y关于x的回归方程。
20,2023/10/12,调用EXCEL,所求回归方程为,21,2023/10/12,2)失拟检验和方程显著性检验有重复数据的回归资料,通过重复的试验点可以估计误差。
因此,可以lyy分解成三部分(将误差从剩余平方和中分离出来):
22,2023/10/12,U为回归平方和,即x能控制的部分,自由度为fU=1;Qe为误差平方和,其自由度为fe=km-k=k(m-1)QLf为失拟平方和,它是由于模型选择不当而产生的估计值与实际值的差异。
其自由度为fLf=fT-fU-fe=n+k(m-1)-1-1-k(m-1)=n-2,23,2023/10/12,各种平方和的计算,24,2023/10/12,失拟检验方程显著性检验,25,2023/10/12,对例2而言,,26,2023/10/12,失拟检验和方程显著性检验的几种可能情形:
F显著,FLf也显著-回归方程可用,但另有更合适的模型F不显著,FLf显著-回归直线不可用,需另外寻找更合适的模型进行回归分析F显著,FLf不显著-回归模型合适,回归方程可用F不显著,FLf不显著-计算错误,27,2023/10/12,3)b0的显著性检验,28,2023/10/12,检验结果表明,b0不显著。
也就是说,回归直线应该通过原点,它的回归结果没有通过原点是由于误差造成的。
既然回归直线应该通过原点,则应该重新计算回归方程。
29,2023/10/12,对例2重新计算,得回归方程为,30,2023/10/12,有时候需要检验回归直线是否过定点(c,d)的问题。
处理这样的问题时,可以先把所有观察点(xi,yi)变为(xi-c,yi-d),再求回归方程对上面的方程进行直线是否过原点的检验,就相当于对方程y=b0+bx作通过顶点(c,d)的检验。
31,2023/10/12,
(1)相关系数定义:
用于描述变量x与y的线性相关程度,常用r来表示。
3.相关系数检验,r相关系数r2决定系数,32,2023/10/12,几点说明:
相关系数是与回归方程联系在一起的,同样的两个变量,采用不同的回归方程,就有不同的相关系数。
基于直线回归的相关系数称为简单相关系数,记作r。
给出相关系数时,更多的是用r2(与回归方程相联系的决定系数),33,2023/10/12,
(2)相关系数特点:
1r1r1:
x与y完全线性相关,即有精确的线性关系,(a)(b),34,2023/10/12,大多数情况下,x与y之间存在一定的线性关系;r0:
x与y正线性相关,直线斜率为正值,y随x的增大而增大;,(c)(d),35,2023/10/12,r0:
x与y没有线性关系,但可能存在其它类型的关系;相关系数r越接近1,x与y的线性相关程度越高,然而r值达到多大时,x与y之间存在线性相关,采用线性关系合理,须对r进行显著性检验;试验次数越少,r越接近1。
(e)(f),36,2023/10/12,对给定的显著性水平,查相关系数临界值rmin当,说明x与y之间存在显著的线性关系,相关系数检验,37,2023/10/12,例4-3:
试用相关系数法对例4-1中得到的经验公式进行显著性检验。
(=0.05),解:
因为,所以,38,2023/10/12,当=0.05,n=5时,查相关系数临界值得到rmin=0.8783,所以rrmin,所得的经验公式有意义。
注:
相关系数r有一个明显的缺点,即r接近于1的程度与试验数据组数n有关。
当n较小时,容易接近于1;当n较大时,容易偏小。
只有当试验次数足够多时,才能得出真正有实际意义的回归方程。
39,2023/10/12,4.3可化为线性的非线性回归,一些常用的简单非线性关系,可以通过变量代换,转变成线性变换进行回归分析。
得出直线回归方程后,再进行逆代换即可得出非线性方程。
如:
40,2023/10/12,4.3可化为线性的非线性回归,为确定多个试验因素对试验结果的影响,可以通过多元回归分析求出试验指标(因变量)y与多个试验因素(自变量)xj(j=1,2,p)之间的近似函数关系y=f(x1,x2,xp)。
多元线性回归分析是一种最简单、最常用的多元回归分析方法。
41,2023/10/12,4.3.1多元线性回归方程
(1)建立多元线性回归方程若因变量y与自变量xj(j=1,2,p)之间的近似函数关系式为:
则称上式为因变量y关于自变量x1,x2,xp的多元线性回归方程。
b1,b2,bp称为偏回归系数。
42,2023/10/12,
(2)求解多元线性回归方程,由最小二乘法,系数bj由下列方程组决定:
其中,43,2023/10/12,令则上面的方程组可以改写成,44,2023/10/12,例4-4:
在某化合物的合成试验中,为了提高产量,选取了原料配比(x1)、溶剂量(x2)和反应时间(x3)三个因素,试验结果如下表所示。
试用线性回归模型来拟合试验数据。
45,2023/10/12,解:
46,2023/10/12,即:
同样解得:
a=0.197,b1=0.0455,b2=-0.00377,b3=0.0715于是三元线性回归方程为:
y=0.197+0.0455x1-0.00377x2+0.0715x3,47,2023/10/12,4.3.2多元线性回归方程显著性检验,
(1)F检验法,48,2023/10/12,若F0.05(m,n-m-1)F0.01(m,n-m-1),则y与x1,x2,xm间有十分显著的线性关系。
49,2023/10/12,
(2)偏回归系数检验称为xj对y的方差贡献,它反映xj对y的作用大小。
其中cjj为中对角线上的元素。
即注意:
50,2023/10/12,从回归方程中剔除掉xk后,其余各xj的系数bj要重新计算。
从回归方程中剔除掉xk后,其余各xj的系数bj要重新计算,并重新进行方程显著性检验。
51,2023/10/12,定义R称为y与诸x之间的复相关系数。
复相关系数R反映了一个变量y与多个变量(x1,x2,xm)之间的线性相关程度,52,2023/10/12,R1时,y与变量x1,x2,xm之间存在严格的线性关系R0时,y与变量x1,x2,xm之间不存在任何线性相关关系,但可能存在其它非线性关系0R1时,变量之间存在一定程度的线性相关关系,复相关系数R一般取正值,0R1,决定系数:
复相关系数的平方R2,其大小反映了回归平方和SSR在总离差平方和SST中所占的比重,即,53,2023/10/12,复相关系数临界值Rmin:
Rmin与显著性水平和试验数据组数n有关,对于给定的显著性水平,当RRmin时,y与x1,x2,xm之间存在密切的线性关系,采用线性回归方程描述y与x1,x2,xm之间的关系才有意义。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析