线性回归方程中的相关系数rWord文件下载.docx
- 文档编号:15291737
- 上传时间:2022-10-29
- 格式:DOCX
- 页数:15
- 大小:45.04KB
线性回归方程中的相关系数rWord文件下载.docx
《线性回归方程中的相关系数rWord文件下载.docx》由会员分享,可在线阅读,更多相关《线性回归方程中的相关系数rWord文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
服从均值为苓、方差为6,的正态分布。
(2)等方差件假设。
它假设对于所有的目、5的条件方差同为62,且6为常数。
即Var(f1/xi)=620
⑶独立性假设。
即零均值假设。
它假设在给定圧的条件下.5的条件期卑值为零,即E(ei)=Oo
(4)无口相关性。
假设随机误基项J的逐次观察值互不相关。
即Cov(5£
尸XiHj)。
(5)£
与x的不相关牲。
假设随机谋差项■与相应的口变呈凡对因变屋y的影响相互
独立。
换言之,两者对囚变Ey的影响是叮以区分的。
即Cov(t,,出)二0。
3.—元线性回归方程的检验
根拥原始数据,求岀冋归方程后就需要对冋归方程进行检验。
检验的假设是总体冋归系数为0。
另外耍检验冋归方程对因变量的预测效果如何。
⑴回归系数的显著性检验
•对叙率的检验,假设是:
总体回归系数为0。
•对截距的检验,假设是:
总体回归方程截距a=0°
(2)R?
判定系数
在判定一个线性回!
H育•线的拟合优度的好坏时,衣系数是一个電要的判世指标。
从公式可以得到判定系数竽于冋归平方和在总平方和屮所占•的比率,即R,体现了冋归模型所能解釋的因变址变异性的门分比。
如果R2=0.775.则说明变址y的变并中有77.5%是由变UxJI起的。
当R—1时.表不所有的观测点全部落在回归直线上。
当RM时,表示口变呈与冈变呈无线性关系。
为了尽叮能准确的反应模型的拟合度,SPSS输出中的AdjustedRSquare是消除了口
变呈个数影响的R?
的修匸值。
(3)方差分析
体现因变址观测值9均值之间的差界的偏差平方和S缶是由两个部分组成的,即|叫归平方和SS"
它们反应了口变氐X的重要程度;
残差平方和SS“它反应了实验误差以及其他盘外因索对实验结果的影响。
表示为:
SS产SS厂SS°
・,这两部分除以各口的口由度,得到它们的均方,统计量F=l叫归均方/残差均方。
当F值太丿、时,拒绝接受b=0的假设。
(4)Durbin-Watson检验
在对回归模空的诊断中,有一个非常重要的回!
H模型假设需要诊断,那就是回归模型中的误签项的独立件。
如果误并项不独立,那么对冋归模型的任何佔计与假设所作出的结论都是不可靠的。
其参数称为Du•或D。
D的取值范围是0<
D<
4,它的统计学意义如下:
•当残差与自变呈互为独立时,D~2°
•当相邻两点的残差为止相关时,D<
20
•当相邻两点的残差为负相关时,D>
2.
(5)残为崗示法,在直角坐标系中・以预测值为区1横轴,以y与之间区]的误丼s为纵轴(或学生化残葢与拟和值或一个自变星为纵轴),绘制残斧的散点图。
如果散点呈现出明显的规律性,则认为存在口相关性或者#线性或者#常数方差的问•题。
这样需要对数据、因变虽或口变W进行变换。
如果散点呈现随机分布,斜率为零,则认为口相关存在的可能性不大,独立性假设成立。
多元线性回归
1.多元线性回归的基本概念
根摇多个口变呈的最优组合建立回山方程來预测因变呈的回山分析称为多元回0」分析。
多元回归分析的模型为:
v*=bo+bixl十b?
x2十•…十big。
其中y*多为根据所有自变塑X计算出的估计值,bo为常数项,bi、b2...bn称为y对应于心、x2...xn的偏回归系数。
偏回归系数表示假设在其他丿祈右口变呈不变的情况卜•,某一个口变呈变化引起因变虽变化的比率。
多兀线性冋归模型也必须满足一兀线性冋归屮所述的假设理论。
2.多元线性回归分析中的参数
⑴复相关系数R,复相关系数表示口变虽x与其他的冈变呈蜀之间线性相关密切程度的指标,复相关系数使用字母R表示。
复和关系数的取值范禺在0〜1之间。
其值越接近1,表示其线件关系越强•向•其值越接近0.表示线性关系越差。
(2)R2判定系数与经调整的判定系数
与一兀冋归方程相同,在多兀冋归屮也使用判定系数亡来解释冋归模型屮口变址的变异在因变虽变异中所占比率。
但是,判定系数的值随着进入冋归方程的自变虽的个数(或样木容呈的大小n)的増加间增人。
因此,为J'
消除口变虽的个数以及样本址的人小对判定系数的影响,引进了经调到的判定系数(AdjustedRSquare)^
(Xi-X的平均数)(Yi-Y平均数)/根号下[£
(Xi-X平均数厂2*£
(Yi-Y平均数厂2]
i(x(--F)
rxv
R2就是相关系数的平方,
R在一元线性方程就直接是因变量自变量的相关系数,多元则是复相关系数
判定系数RA2
也叫拟合优度、可决系数。
表达式是:
RA2=ESS/TSS=1-RSS/TSS
该统计量越接近于1,模型的拟合优度越高。
问题:
在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大这就给人一个错觉:
要使得模型拟合得好,只要增加解释变量即可。
—一但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
这就有了调整的拟合优度:
RlA2=l-(RSS/(n-k-l))/(TSS/(n-l))
在样本容量一立的情况下,增加解释变量必左使得自由度减少,所以调整的思路是:
将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的彫响:
其n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
总是来说,调整的判泄系数比起判左系数,除去了因为变量个数增加对判左结果的影响。
R=R接近于1表明Y与XI,X2,Xk之间的线性关系程度密切:
R接近于0表明Y与XI,X2,Xk之间的线性关系程度不密切
相关系数就是线性相关度的大小,1为(100%)绝对正相关,0为0%,-1为(100%)绝对负相关
相关系数绝对值越靠近1,线性相关性质越好,根据数据描点画出来的函数-自变量图线越趋近于一条平直线,拟合的直线与描点所得图线也更相近。
如果英绝对值越靠近0,那么就说明线性相关性越差,根据数据点描出的图线和拟合曲线相差越远(当相关系数太小时,本来拟合就已经没有意义,如果强行拟合一条直线,再把数据点在同一坐标纸上画出来,可以发现大部分的点偏离这条直线很远,所以用这个直线来拟合是会岀现很大误差的或者说是根本错误的)。
分为一元线性回归和多元线性回归
线性回归方程中,回归系数的含义
一元:
Y^bX+ab表示X每变动(增加或减少)1个单位,Y平均变动(增加或减少)b各单位多元:
YA=b1Xl+b2X2+b3X3+a在其他变量不变的情况下,某变量变动1单位,引起y平均变动量
以b2为例:
b2表示在X1、X3(在其他变量不变的情况下)不变得情况下,X2每变动1单位,y平均变动b2单位就一个reg来说y=a+bx+e
a+bx的误差称为explainedsumofsquaree的误差是不能解释的是residualsumofsquare
总误差就是TSS
所以TSS=RSS+ESS
判泄系数也叫拟合优度、可决系数。
表达式是
该统订鱼越接近于1,模型的拟合优度越髙。
在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大
这就给人一个错觉:
—■旦是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。
这就有了调整的拟合优度
斤2=]_RSS©
_R_1)
TSS/(n-\)
在样本容量一左的情况下,增加解释变量必泄使得自由度减少,所以调整的思路是:
将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:
苴中:
n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
顺便补充一下:
记观二工(】;
-〃总离差平方和
ESS=X(£
-巧回I丿1平方和
RSS二工(丫厂彷剩余平方和
一般做回归的时候要求拟合优度(实际值与拟合值相关系数的平方)越髙越好,可以通过增加解释变量来实现,可是解释变量多了后很多解释变量的系数T检验不显著了,而且增加很多变量后模型的自由度就减少了,这些情况狂的存在往往使得模型预测不精确;
修正拟合优度就是将残差平方和跟总禽差平方和分別除以各自的自由度,这样就剔除了变量个数对其影响了。
首先有一个恒等式:
TSS=ESS+RSS
即总偏差平方和=回归平方和+残差平方和
通常情况,我们都是讨论解释变量对总效应的贡献,使用一个叫"
拟合优度"
(或者叫"
判定系数"
)的指标
其定义为:
回归平方和/总偏差平方和=ESS/TSS=仃SS-RSS)/TSS=(923-325)/923
如果说随机误差对总效应的贡献,那可以直接RSS/TSS
因为1•仃SS-RSS)/TSS就可以化为RSS/TSS
(3)零阶相关系数、部分相关与偏相关系数
•这里的零阶相关系数(ZeiuOder)计算所有口变量与因变量之间的简单相关关系。
•部分和j(;
(PartConelation)表示:
在排除了其他口变屋对x』勺影响后,当一个口变屋进入回归方程模型后,复相关系数的平方増加虽。
•偏相关系数(Part讪Conelation)表示:
在排除了其他变乞的影响后,口变縈人与因变氓yZ间的相关程度。
部分相关系数小于偏相关系数偏相关系数也可以用来作为筛选白变虽的指标,即通过比较偏相关系数的大小来判别哪些变虽对因变虽具有较大的影响力。
3.多元线性回归分析的检验
建立了多元I口I归方程后,需要进行战著性检验,以确认建立的数学模型是否很好的拟合了原始数据,即该冋归方程是否有效。
利用残羞分析,确定冋归方程是否违反了假设理论。
对各口变屋进行检验,其假设是总体的冋归方程口变呈系数或常数项为0,以便任I口I归方程中保留对冈变屋y值预测更有效的口变呈、以便确定数学模型足否有效。
(1)方差分析
与一尤回归方程的检验相同,笋兀回归方程也采用方斧分析方法对回归方程进行检验,检验的假设是总体的回归系数均为0或不都为非0。
它足对整个回归方程的显”件检验。
使用统计0F进行检验。
原理与一元回归的方程分析原理相同。
(2)偏回归系数与常数项的检验
检验的假设是:
各口变址I叫归系数为0,常数项为零。
它使用的统计址是t°
t=偏冋归系数丿'
偏回归系数的标准误。
(3)方差齐性检验
SPSS中pearson(皮尔逊相关系数)看r值还是P值,确定相关性
两个值都要看,r值表示在样本中变疑间的相关系数,表示相关性的大小:
p值是检验值,是检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 方程 中的 相关系数