数学建模之逐步回归分析精品讲义Word文件下载.docx
- 文档编号:14678380
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:35
- 大小:1.06MB
数学建模之逐步回归分析精品讲义Word文件下载.docx
《数学建模之逐步回归分析精品讲义Word文件下载.docx》由会员分享,可在线阅读,更多相关《数学建模之逐步回归分析精品讲义Word文件下载.docx(35页珍藏版)》请在冰豆网上搜索。
逐步回归分析就是解决如何建立最优回归方程的问题。
2)最优回归模型的含义
最优回归模型的含义有两点:
(1)自变量个数
自变量个数要尽可能多,因为通过筛选自变量的办法,选取自变量的个数越多,回归平方和越大,剩余平方和越小,则回归分析效果就越好,这也是提高回归模型分析效果的重要条件。
(2)自变量显著性
自变量对因变量y有显著影响,建立最优回归模型的目的主要是用于预测和分析,自然要求自变量个数尽可能少,且对因变量y有显著影响。
若自变量个数越多,一方面预测计算量大,另一方面因n固定,所以增大,即造成剩余标准差增大,故要求自变量个数要适中。
且引入和剔除自变量时都要进行显著性检验,使之达到最优化状态,所以此回归方程又称为优化模型。
3最优回归模型的选择方法
最优回归模型的选择方法是一种经验性发展方法,主要有以下四种:
(1)组合优选法
组合优选法是指从变量组合而建立的所有回归方程中选取最优着。
其具体过程是:
(1)建立变量组合的所有回归方程
(2)优选回归方程
首先对每一个方程及自变量均作显著性检验,优选原则:
自变量全部显著,剩余标准差较小,既可选得最优回归方程。
2)剔除优选法
剔除优选法适指从包含全部自变量的回归方程中逐个剔除不显著自变量而求得最优回归方程的优选方法。
(1)建立多元回归方程
剔除自变量的原则是先求取偏回归平方和最小者并作显著性检验,若不显著则剔除。
终止原则是直至不显著自变量剔除完为至,而仅保留对因变量y有显著影响的自变量。
3)引入优选法
引入优选法是指将所有自变量经显著性检验而逐个引入对因变量有显著影响的自变量的优选方法。
(1)建立一元回归方程
引入原则是偏相关系数绝对值最大者,引入后并进行显著性检验,若显著则继续引进自变量,直至再无显著自变量引进为止。
4)逐步回归分析法
逐步回归分析法是指运用回归分析原理采用双检验原则,逐步引入和剔除自变量而建立最优回归方程的优选方法。
具体含义是:
(1)每步有二个过程即引进变量和剔除变量,且引进变量和剔除变量均需作F检验后方可继续进行,故又称为双重检验回归分析法。
(2)引入变量引入变量的原则是未引进变量中偏回归平方和最大者并经F显著性检验,若显著则引进,否则终止。
(3)剔除变量剔除原则是在引进的自变量中偏回归平方和最小者,并经F检验不显著,则剔除。
(4)终止条件即最优条件,再无显著自变量引进,也没有不显著自变量可以剔除,这也是最优回归方程的实质。
由此可知,它并没新的理论,只是多元回归分析基础上派生出的一种算法技巧。
现在就来介绍逐步回归分析的具体建模原理和方法步骤。
6.2逐步回归分析的数学模型
逐步回归分析的数学模型是指仅包含对因变量Y有显著影响自变量的多元线性回归方程。
为了利于变换求算和上机计算,将对其变量进行重新编号并对原始数据进行标准化处理。
6.2.1变量重新编号
1新编号数学模型
令,自变量个数为k-1,则其数学模型为:
式中,α=1,2,3,…,n
n:
样本个数
其中:
的偏回归平方和为:
:
为的算术平均值
的偏回归系数
为逆矩阵对角线对应元素
2回归数学模型
新编号的回归数学模型为:
6.2.2标准化数学模型
标准化回归数学模型是指将原始数据进行标准化处理后而建立的回归数学模型,即实质上是每个原始数据减去平均值后再除以离差平方和的方根。
1标准化回归数学模型
令 j=1,2,3,…,k
!
为离差平方和的方根
注意:
它们之间的区别,即离差平方和,离差平方和的方根,方差,标准差。
则回归数学模型为:
2标准化回归数学模型的正规方程组
标准化回归数学模型正规方程组的一般形式为:
因为,,
所以上述正规方程组可变为:
这样,数据标准化处理后的估计值0,并令,则可得数据标准化处理后的回归方程数学模型的正规方程组的一般形式为:
这样,数据标准化后的估计值应为0,并令,则可得:
其中:
称为相关系数矩阵。
解此方程组,即可求出,故可得标准化后的回归模型为:
标准化的回归模型的矩阵形式:
6.2.3标准化前后回归模型的关系
1标准化前后的回归模型
1)标准化前后回归模型为:
2)标准化后回归模型为:
2标准化前后的偏回归系数
标准化前后偏回归系数的关系可从变化过程反演得知:
令代入标准化前的回归模型可得:
整理后得:
将上式与标准化前的回归模型作比较,由待定系数法可知标准化前后回归模型的偏回归系数的关系为:
j=1,2,3,…k-1
于是,只要求出,即可求出,今后仅讨论标准化后的回归模型。
3标准化后的各种离差平方和
6.3求解求逆紧凑变换法
逐步回归分析每引进和剔除一个变量都要用到求解求逆紧奏变换法进行矩阵变换,最后求出方程组的解和逆矩阵。
现介绍其变换原理和方法步骤。
6.3.1求解求逆紧奏变换法的基本公式
由上述介绍可知,标准化后的正规方程组为:
可得增广矩阵,由经高斯消元法变换为,既可求出解和相应的逆矩阵。
故
经高斯消元法变换为:
=
D
其变换公式为:
说明:
公式
(1)是好理解的;
公式
(2)是指求算非主行和非主列的元素,实质上就是该元素减去其对应的主行与主列元素相乘并除以主元素。
举例,解下列方程组:
解:
利用上述高斯消元法的
(1)
(2)公式,解上述方程组的求解求逆变换过程如下:
由上述方程组可得高斯求解求逆变换法矩阵形式:
当=1,主元素为:
,根据高斯求解求逆变换法原理和方法,可得:
当=2,主元素为:
当=3,主元素为:
X
提出问题:
由上述高斯削元法变换可知,单位矩阵只是从后k逐列移至前k列,而只是起到形式作用。
这样,若利用计算机程序求解求逆就要多占用k*k个单元,试想能否节省k*k个单元呢?
从以上变换可知,如果能将后k列经过变换后放置前k列去,这样k*k个单元即可节省。
如何做呢?
这要找出后k列变换前后的关系。
若经过(-1)次变换得到,则第k+1+列除了第个元素为1,其余均为0,即,第k+1+列各元素值为:
若再对变换一次得,则第k+1+列各元素可由高斯消元法的公式
(1)
(2)变换为为:
这就相当于第k+1+列的第个元素1除以主元素,其余的元素都除以主元素并变号,于是可将第k+1+列放到对应的前列中,这样单位矩阵就节省了,上述整个过程就称为矩阵的求解求逆紧奏变换法。
将上述公式合并即得求解求逆紧奏变换法的公式:
说明:
(1)式为求主行各元素;
(2)式为求非主行非主列的各元素;
用公式
(2)求非主行所有元素,如:
。
(3)式为求主元素;
(4)式为求主列个各元素。
举例:
利用求解求逆紧奏变换法解上述方程组:
解:
,根据求解求逆紧凑变换法原理和方法,可得:
当=2,主元素为:
当=3,主元素为:
X
由两种方法比较可知,其结果一样,故求解求逆紧奏变换法可节
省K*K个存储单元。
6.3.2基本性质
1每作一次变换,就求得一组解和相应的逆矩阵;
2对作变换得,同变换次序无关,即与哪个作主元素无关;
3当,即,同一主元素作两次变换可还原;
4在矩阵中,具有下列对称性:
6.3.3求解求逆紧奏变换法与回归分析的关系
由上述分析可知,逐步回归分析要求解的正规方程组为:
则逐步回归分析中的求解求逆紧奏变换法的增广矩阵是:
在逐步回归分析中,每引进一个变量或者剔除一个变量,都要对R进行一次求解求逆紧奏变换法变换,最后求得,再恒等变换为,所以求解求逆紧奏变换法在逐步回归分析中十分有用。
6.4逐步回归分析的步骤
根据逐步回归分析的原理和方法,现介绍其具体步骤。
以表6–3()中地理数据为例。
地理数据4--5
台风编号
750314.5127.08.82.0-0.58.0248.0900
65097.5727.710.87.00.85.081.0354
60031.9428.313.613.0-0.21.7124.8566
65213.0427.312.113.00.21.5314.6521
73018.0728.55.7-2.0-0.62.7110.4333
61224.6428.515.814.01.42.0109.6359
74123.0227.45.40.00.64.6110.0589
62136.2028.212.012.00.02.5378.0416
66152.6929.012.76.01.315.787.8289
60052.8527.55.012.00.06.8152.2254
61261.0227.020.71.01.010.0148.5209
62081.6227.57.04.01.56.048.0428
65137.0227.35.8-17.01.810.0230.0673
63122.0927.314.5-11.00.08.5110.5395
59040.8328.711.8-13.02.34.0125.0327
60074.5627.07.0-4.0-0.34.0240.0829
63065.4329.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 逐步回归 分析 精品 讲义