1、应用MATLAB进行非线性回归分析报告应用MATLAB进展非线性回归分析摘 要早在十九世纪,英国生物学家兼统计学家高尔顿在研究父与子身高的遗传问题时,发现子代的平均高度又向中心回归大的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其他分支中。随着计算机的开展,各种统计软件包的出现,回归分析的应用就越来越广泛。回归分析处理的是变量与变量间的关系。有时,回归函数不是自变量的线性函数,但通过变换可以将之化为线性函数,从而利用一元线性回归对其进展分析,这样的问题是非线性回归问题。下面的第一题:炼钢厂出钢水时用的钢包,在使用过程中由于钢水与炉渣对耐火材料的侵蚀,使其容积不断增
2、大。要找出钢包的容积用盛满钢水时的质量与相应的实验次数的定量关系表达式,就要用到一元非线性回归分析方法。首先我们要对数据进展分析,描出数据的散点图,判断两个变量之间可能的函数关系,对题中的非线性函数,参数估计是最常用的“线性化方法,即通过某种变换,将方程化为一元线性方程的形式,接着我们就要对得到的一些曲线回归方程进展选择,找出到底哪一个才是更好一点的。此时我们通常可采用两个指标进展选择,第一个是决定系数,第二个是剩余标准差。进而就得到了我们想要的定量关系表达式。第二题:给出了某地区19712000年的人口数据,对该地区的人口变化进展曲线拟合。也用到了一元非线性回归的方法。首先我们也要对数据进展
3、分析,描出数据的散点图,然后用MATLAB编程进展回归分析拟合计算输出利用Logistic模型拟合曲线。关键词:参数估计,Logistic模型,MATLAB正文一、一元非线性回归分析的求解思路:求解函数类型并检验。求解未知参数。可化曲线回归为直线回归,用最小二乘法求解;可化曲线回归为多项式回归。二、回归曲线函数类型的选取和检验1、直接判断法2、作图观察法,与典型曲线比拟,确定其属于何种类型,然后检验。3、直接检验法适应于待求参数不多的情况4、表差法适应于多想式回归,含有常数项多于两个的情况三、化曲线回归为直线回归问题用直线检验法或表差法检验的曲线回归方程都可以通过变量代换转化为直线回归方程,利
4、用线性回归分析方法可求得相应的参数估计值。题目: 例 8.5.1炼钢厂出钢水时用的钢包,在使用过程中由于钢水与炉渣对耐火材料的浸蚀,其容积不断增大。现在钢包的容积用盛满钢水时的重量y (kg)表示,相应的试验次数用x表示。数据见表8.5.1,要找出y与x的定量关系表达式。表8.5.1 钢包的重量y与试验次数x数据序号xy序号xy12106.42811110.5923108.20914110.6034109.581015110.9045109.501116110.7657110.001218111.0068109.931319111.20710110.491) 1/y=a+b/xy=a+blnx
5、format longx=2 3 4 5 7 8 10 11 14 15 16 18 19;y=106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20;plot(x,y,k+);%数据的散点图x1=1./x;y1=1./y;plot(x1,y1,k+); %变换后数据的散点图x2=ones(13,1) x1;b,bint,rint,stats=regress(y1,x2);z=b(1)+b(2)*x1;yc=1./z;plot(x1,y1,k+,x1,z,r)%变换后数据的散点图和回归
6、直线图变换后数据的散点图与回归直线图R2=1-sum(y-yc).2)/lyy;%模型的拟合优度系数plot(x,y,k+,x,yc,r)%数据的散点图和回归曲线图legend(散点图,回归函数)b = 0.00896662968057 0.00082917436336R2 =0.97292374957556第一种方法的程序:format longx=2 3 4 5 7 8 10 11 14 15 16 18 19;y=106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20;plot(
7、x,y,k+);%数据的散点图x1=1./x;y1=1./y;plot(x1,y1,k+); %变换后数据的散点图x2=ones(13,1) x1;b,bint,rint,stats=regress(y1,x2);z=b(1)+b(2)*x1;yc=1./z;plot(x1,y1,k+,x1,z,r)%变换后数据的散点图和回归直线图n=length(x);lyy=sum(y.2)-n*(mean(y)2;R2=1-sum(y-yc).2)/lyy;%模型的拟合优度系数b = 0.00896662968057 0.00082917436336R2 =0.97292374957556用类似的方法可
8、以得出其它三个曲线回归方程,它们分别是:第二种方法的程序:format longx=2 3 4 5 7 8 10 11 14 15 16 18 19;y=106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20;x1=log(x);y1=y;x2=ones(13,1) x1;b,bint,rint,stats=regress(y1,x2);bz=b(1)+b(2)*x1;yc=z;n=length(x);lyy=sum(y.2)-n*(mean(y)2;R2=1-sum(y-yc).2)
9、/lyy;plot(x,y,k+,x,yc,c);legend(散点图,回归函数)b = 1.0e+002 * 1.06314674075167 0.01713977247928R2 =0.87731500489620第三种方法的程序:format longx=2 3 4 5 7 8 10 11 14 15 16 18 19;y=106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20;x1=sqrt(x);y1=y;x2=ones(13,1) x1;b,bint,rint,stats=
10、regress(y1,x2);bz=b(1)+b(2)*x1;yc=z;n=length(x);lyy=sum(y.2)-n*(mean(y)2;R2=1-sum(y-yc).2)/lyy;plot(x,y,k+,x,yc,k);legend(散点图,回归函数)b = 1.0e+002 * 1.06301275014382 0.01194728720517R2 = 0.78514164407253三种方法的拟合效果比拟:R2 =0.97292374957556R2 =0.87731500489620R2 = 0.785141644072531.原始数据下表给出了某地区19712000年的人口数
11、据表1。试分别用Matlab和SPSS软件,对该地区的人口变化进展曲线拟合。表1 某地区人口变化数据年份时间变量t=年份-1970人口y/人1971133 8151972233 9811973334 0041974434 1651975534 2121976634 3271977734 3441978834 4581979934 49819801034 47619811134 48319821234 48819831334 51319841434 49719851534 51119861634 52019871734 50719881834 50919891934 52119902034 51
12、319912134 51519922234 51719932334 51919942434 51919952534 52119962634 52119972734 52319982834 52519992934 52520003034 527根据上表中的数据,做出散点图,见图1。图1 某地区人口随时间变化的散点图从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,故可以用Logistic曲线模型进展拟合。因为Logistic曲线模型的根本形式为:所以,只要令:,就可以将其转化为直线模型:下面,我们分别用Matlab和SPSS软件进展回归分析拟合计算。2用Matla
13、b编程进展回归分析拟合计算源程序Nonlinear-Regression-Model.m,如下:clearclc% 读入人口数据19712000年y = 33815 33981 34004 34165 34212 34327 34344 34458 34498 34476 34483 34488 34513 34497 34511 34520 34507 34509 34521 34513 34515 34517 34519 34519 34521 34521 34523 34525 34525 34527;% 读入时间变量数据t年份1970t=1 2 3 4 5 6 7 8 9 10 11
14、12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30; % 线性化处理for t = 1:30, x(t)=exp(-t); y(t)=1/y(t,1);end% 计算,并输出回归系数Bc=zeros(30,1)+1;X=c,x;B=inv(X*X)*X*yfor i=1:30,% 计算回归拟合值 z(i)=B(1,1)+B(2,1)*x(i);% 计算离差 s(i)=y(i)-sum(y)/30;% 计算误差 w(i)=z(i)-y(i);end% 计算离差平方和SS=s*s;% 回归误差平方和QQ=w*w;% 计算回归平方和UU=
15、S-Q;% 计算,并输出F检验值F=28*U/Q% 计算非线性回归模型的拟合值for j=1:30, Y(j)=1/(B(1,1)+B(2,1)*exp(-j);end% 输出非线性回归模型的拟合曲线Logisic曲线plot(T,Y)上述程序运行后,输出1输出回归系数B与F检验值如下:B = 1.0e-004 * 0.2902 0.0182F = 47.87742输出Logistic模型拟合曲线总结文中给出了两道题对这次的论文应用MATLAB进展非线性回归分析进展说明,给出了进展非线性回归需要的步骤,画出了描述数据的散点图,参数估计等,通过比拟我们得到了需要的定量关系表达式,画出了拟合曲线。参考文献1金兰,回归分析与方差分析教学的几点思考J.统计教育,2006年 2王兵团,数学建模根底M,:清华大学,2004年