线性回归分析法.docx
- 文档编号:25819068
- 上传时间:2023-06-15
- 格式:DOCX
- 页数:18
- 大小:78.32KB
线性回归分析法.docx
《线性回归分析法.docx》由会员分享,可在线阅读,更多相关《线性回归分析法.docx(18页珍藏版)》请在冰豆网上搜索。
线性回归分析法
一元线性回归分析和多元线性回归分析
一元线性回归分析
[•简单介绍
当只有一个自变量时,称为一元回归分析(研究因变量因和自变量因之间的相关关系);当自变量有两个或多个时,则称为多元回归分析(研究因变量因和自变量冋,囤,…,冋之间的相关关系)。
如果回归分析所得到的回归方程关于未知参数是线性的,则称为线性回归分析;否则,称为非线性回归分析。
在实际预测中,某些非线性关系也可以通过一定形式的变换转化为线性关系,所以,线性回归分析法成为最基本的、应用最广的方法。
这里讨论线性回归分析法。
2•回归分析法的基本步骤
回归分析法的基本步骤如下:
(1)搜集数据。
根据研究课题的要求,系统搜集研究对象有关特征量的大量历史数据。
山于回归分析是建立在大量的数据基础之上的定量分析方法,历史数据的数量及其准确性都直接影响到回归分析的结果。
(2)设定回归方程。
以大量的历史数据为基础,分析其间的关系,根据自变量与因变量之间所表现岀来的规律,选择适当的数学模型,设定回归方程。
设定回归方程是回归分析法的关键,选择最优模型进行回归方程的设定是运用回归分析法进行预测的基础。
(3)确定回归系数。
将已知数据代入设定的回归方程,并用最小二乘法原则计算出回归系数,确定回归方程。
这一步的工作量较大。
(4)进行相关性检验。
相关性检验是指对已确定的回归方程能够代表自变量与因变量之间相关关系的可靠性进行检验。
一般有囲检验、呂检验和回检验三种方法。
(5)进行预测,并确定置信区间。
通过相关性检验后,我们就可以利用已确定的回归方程进行预测。
因为回归方程本质上是对实际数据的一种近似描述,所以在进行单点预测的同时,我们也需要给岀该单点预测值的置信区间,使预测结果更加完善。
3.—元线性回归分析的数学模型
用一元线性回归方程来描述冋和冈之间的关系,即
++Ar~(0=1,2,…
式中,冋和回分别是自变量因和因变量国的第[3观测值,囤和区]是回归系数,H是观测点的个数,百]为对应于因的笫皿观测值区]的随机误差。
假设随机误差囤满足如下条件:
①服从正态分布;②区]的均值为零,即|e@,)=o|;③百]的方差等于囲;④各个区]间相互独立,即对于任何两个随机误差囤和囤,其协方差等于零即,cov(A/,aJ=0(/#7)0
基于上述假定,随机变量的数学期望和方差分别是
£()1)=勺+也(兀)]
(2・2)》:
£(△)—”,
如果不考虑式中的误差项,我们就得到简化的式子
X二绳+(2-3)
该式称为因对匡]的一元回归模型或一元回归方程,其相应的回归分析称为一元线性回归分析。
依据这一方程在直角坐标系中所作的直线就称为回归直线。
4.回归参数的估计
回归模型中的参数冋与冋在一般情况下都是未知数,必须根据样本观测数据區列来估计。
确定参数囚与冋值的原则是要使样本的回归直线同观察值的拟合状态最好,即要使得偏差最小。
为此,可以釆用最小二乘法的办法来解决。
对应于每一个因,根据回归直线方程式(2・3)可以求出一个回,它就是区]的一个估计值。
估计值和观测值之间的偏差要使模型的拟合状态最好,就是说要使凹个偏差平方和最小为标准来确定回归模型。
则式(2・1)用矩阵形式表示为
为了方便起见,记
V=
Or
•
f
△=
■■
a2
■
•
B=
1
•
1X2J订
LA«J
A
y=Ba+A(2-4)
设冈为误差囚的负估值,称为匡]的改正数或残差,G为回归参数回的估值,则可以写岀类似于参数平差的误差方程
7=Ba—y(2-5)
根据最小二乘原理|v7V=mmL求自由极值,得
=2V」B=0
A
da
即BrV=0(2-6)
将误差方程(Z5)代入,即得法方程为
BTBa=BTy(2-7)
二_力二切_喑2;=1/=!
^B=
BTy=
〜一n
sxy+nxy
nnx
—~2nxSxx+f~lX
于是可得回归参数的最小二乘估值为
a=(B'BYBry(2-8)
参数4与®的具体表达形式为
八1
x=——
S疝
(+"门x
y
1
兀-抚
\//
_-A1
■■
1
m=y%/s
(2-9)
a\=SXjS心
求出参数与忖以后,就可以得到一元线性回归模型
AAA
y=x(2-10)
山此,只要给定了一个因值,就可以根据回归模型求得一个胡作为实际值的预测值。
5•精度分析
对于给定的因,根据回归模型就可以求出冋的预测值。
但是用曲来预测匡]的
精度如何,产生的误差有多大是我们所关心的。
这里釆用测量上常用的精度指标来度量回归方程的可靠性。
一个回归模型的精度或剩余标准离差定义式为
(2-11)
由于参数的个数是2,观测值总数是回,多余观测是阳可,因此式中分母是(〃-2)。
运用估计平均误差可以对回归方程的预测结果进行区间估计。
若观察值围绕回归直线服从正态分布,且方差相等,则有68.27%的点落在囲的范围内,的范圉有95.45%的点落在内,有99.73%的点落在|±3b|的范用内。
根据参数平差理论可知,M的协因数矩阵为
4=何亦二丄[匕+応2)/〃-习(2_12)
gS”T1
从而,HI的方差估值为
6•线性回归效果的显著性检验
对一元线性回归模型的统计检验包括两个内容:
一是线性回归方程的显著性
检验;二是对回归系数进行统讣推断。
在一元线性回归分析中,线性回归效果的好坏取决于匡]与冈的线性关系是否密切。
若剧越大,因随因的变化趋势就越明显;若剧越小,匡]随匡]的变化趋势就越不明显。
特别的,当囱时,意味着匡]与匡]之间不存在线性相关关系,所建立的线性回归方程没有意义。
所以,只有当嗣时,因与因之间才有线性相关关系,所建立的线性回归方程才有实际意义。
因此,对线性回归效果好坏的检验,就归结为对统计假设冋:
舛=0;耳:
旳工0|的检验。
若拒绝回,就认为线性回归有意义;若不能拒绝回,就认为线性回归无意义。
下面介绍两种检验方法:
匡]检验法和相关系数检验法。
1•回检验法
进行F检验的关键在于确定一个合适的统计量及其所服从的分布。
当原假设成立时,根据F分布的定义可知
(2-14)
当给定显著性水平0=0.05或0.01,由F分
布分位数值表得临界值7a(I,--2)|,曲样本观测值计算出统计量F的实测值。
若|Fnf;
p(U-2)1,则
以显著水平叵]拒绝囤;若f|则以显著水平叵]接受闷。
一般按下述标准判断。
(1)若卩沁9(仏列,则认为线性回归方程效果极显著。
(2)若|®95(1,—2)SFv®99_(1,—2)则认为线性回归方程效果显著。
(3)若卩5』丿呵,则认为线性回归效果不显著。
2.相关系数检验法
相关系数检验法是通过因与因之间的相关系数对回归方程的显著性进行检验的,
由样本观测值,即陆,j心,儿),…儿),可以得到相关系数的实测值为
r几s’、
f-l1-1
(2-15)
相关系数|0“列,现作如下进一步分析。
(1)当巨]时,|5XV=0|,因而|q=0|,此时线性回归方程$二总+&;二山茂明因与囚之间不存在线性相关关系。
(2)当|0
此时称匡]与因正相关:
,〃丨丨广v0|时,蛋此时称匡]与因负相关;当阿越
接近于0时,此时因与因的线性关系越微弱;当回越接近于1时,此时因与囚的线性关系越强。
(3)当0]二1时,匡]与因完全线性相关,表明匡]与因之间存在确定的线性函数
关系;当T时,称匡]与因正相关;当9时,称因与因负相关。
当给定显著性水平[£>0.05或0.01,由
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析
![提示](https://static.bdocx.com/images/bang_tan.gif)