残差自相关的修正.docx
- 文档编号:11079471
- 上传时间:2023-02-24
- 格式:DOCX
- 页数:17
- 大小:186.44KB
残差自相关的修正.docx
《残差自相关的修正.docx》由会员分享,可在线阅读,更多相关《残差自相关的修正.docx(17页珍藏版)》请在冰豆网上搜索。
残差自相关的修正
应用回归分析•上机作业二
学号:
200930980106姓名:
何斌年级专业:
10级统计1班指导老师:
丁仕虹
—个人收集整理~勿做商业用途思考与练习4.9
1.用普通最小二乘法建立回归方程,并画出残差散点图。
1.1首先录入数据,sas程序如下:
procimportout=aa/*使用import过程导入数据,并输出到数据集aa*/
datafile="d:
\xt4.09.xls"
dbms=excel2000replace;
getnames=yes;/*首行为变量名*/
run;
procprintdata=aanoobs;
run;
1.2建立回归方程,画残差散点图,sas程序如下:
procregdata=aa;
把回归的结果输出在文件out里,残差给变量名residual*/
modely=x;
outputout=outr=residual;/*
run;
procgplotdata=out;
plotresidual*x;/*做残差图,检验是否存在异方差*/
symbolv=stari=none;
run;
1.3得到结果如下:
TheEEGProcedureM0BEL1
ffuin'b*rofUbsirvatiartsRwadofObservetion:
ITsed
53
53
AnalyEiEVariance
Stubof
Meazi
Source
盯
Squares
Square
FValue
Fr>F
Molsl
1
302.63314
3D2.B3314
121.88
<0001
Error
SI
126.«&602
249757
匚orracted
Tom
5E
429.43915
hoot
HEE
1.57T20
吕一02記冷9、
TW
Dependent
Mean
□,41321
Adj
R-5q0.
&903
Coe£fVar
Farametert
StandArd
y&ria.ble
3bH
IF
Estimate
Error
tV*lne
Fr>|l|
Inttrcapt
Init
1
-0.63130
0.441&1
-l.SB
□.□655
X
X
1
o.oases
0.
00033390
1103
<.0001
图1.3.1方差分析以及参数估计
1.4
1.4.1由方差分析可知:
p值小于0.05,所以该回归方程显著有效。
1.4.2R-Square=0.7046,AdjR-Sq=0.6988,可见回归方程的拟合度较高。
1.4.3由参数估计可得,常数项的检验P值为0.0655大于0.05,故常数项不显著。
1.5除去常数项,重新拟合方程。
1.5.1sas程序如下:
procregdata=aa;modely=x/noint;run;
1.5.2得到结果如下:
TkeREGProcedureModel:
NIMEL1D电F色nd住ntVariable:
yy
Wiimhtrof0bs*rv«.tions.53
HumberofObg^ruUionE.53
WDTE
:
Ho
interceptinmodel.
R-Squareisxedefined.
Analysiscf
arioice
Sum□£
M皀:
an
Source
BF
£qjiwr&写
Sqn:
are
TValu^
>F
Model
1
011.267SS
911.£6758
349.25
<0M1
52
135.88OS2
2.&0925
Unc&rrsettdTotal
53
1046.94040
Roat1
USE
1.&1532
B-S(jiiare
0,8704
Dependent
Maui
3.413Z1
Adj用一兀
0.6679
4?
3254&
Farsmsta-r
Parajiieter
£tamlarii
Satiable
Lab&l
DF
Estimate
Error
tValut
Fr>|t|
X
X
1
□.00314
0.00016776
10.6S
<.0001
图1.5.1方差分析以及参数估计
R-Square=0.8704,AdjR-Sq=0.8679,可见回归方程的拟合度有较大幅度提高。
由参数估计可得,所有参数的检验P值均小于0.05,参数显著有效。
1.6得到残差散点图如下:
由图1.6.1残差散点图可以直观地看到,残差散点图上的点的分布是有一定规律的,即误差
随着x的增加而波动幅度增加,呈大喇叭的形状,因此可以认为误差项存在异方差。
2.2利用等级相关系数法判断,sas程序如下:
procregdata=aa;
modely=x/rnoint;/*r是残差,noint无常数项*/
outputout=outr=residual;/*把回归的结果输出在文件out里,残差给变量名residual*/
run;
/*下面利用残差的绝对值和X间的spearman的相关系数检验异方差*/
dataout1;
setout;/*调用数据集out*/
z=abs(residual);/*求残差的绝对值*/
run;
proccorrdata=out1outs=out2;
/*corr指做相关分析outs=out2表示将等级相关检验的结果输出到out2*/
varxz;
run;
2.2.1得到结果如下:
Sp&armaji相关汞歡,N=53
当HD:
>Pi-ob>11-|
競E
100000021Z71
□.212711.oonoo
Cl.
图2.2.1等级相关系数
个人收集整理勿做商业用途
222结果分析:
由2.2.1的输出结果可知,残差绝对值|ei|与Xi的等级相关系数rs0.21271,对应的P值
=0.1262,故认为残差绝对值|e1与自变量X显著相关,存在异方差。
个人收集整理勿做商业用途
3.用幂指数型的权函数建立加权最小二乘回归方程。
3.1sas程序如下:
title"wlsmethod";
dataw1;/*建立新的数据集w1,以便计算权重*/
setout1;
keepyx;
run;
dataw2;/*建立新的数据集w,以保留权重*/
setw1;
arrayrow{10}w1-w10;/*w1-w10为不同m时的权数值*/
arrayp{10}(-2,-1.5,-1,-0.5,0,0.5,1,1.5,2,2.5);
doi=1to10;
row(i)=1/x**p{i};
end;
run;
procprintdata=w2;
run;
procregdata=w2;
modely=x/r;
weightw1;
outputout=testr=residual;
run;
procgplotdata=test;
plotresidual*x;
symbolv=doti=nonecolor=red;
run;
3.2结果如下图所示:
Weight:
*1
Sour»
DF
SunoE
Square
FYilue
Fr>J
Medel
1
1291303&44
12131306644
226.4&
<□001
Errcr
51
5&52305
CerractedTotal
52
lETQSTSl^
图3.2.1方差分析
RootUSE
DependentMtan
CoeffVar
2377.45764
5.225T5
38187
R_Square
AdjR-Sq
08175
0.8139
?
ararnetwrE^timates
Standard
Vari
EF
Estifiiait
Xrror
tmut
Tr>|t|
1
*2.40038
0.42183
-3.86
0.0003
2t
X.
1
0.00460
0.00030415
1511
<.0001
图321拟合优度以及参数估计
3.3结果分析:
(1)由方差分析可知:
P值小于0.05,所以该回归方程显著有效。
(2)R-Square=0.8175,AdjR-Sq=0.8139,可见回归方程的拟合度较高。
(3)由参数估计可得,所有参数的检验P值均小于0.05,参数显著有效。
(4)加权最小二乘的回归方程为:
y-2.400380.0046x(3.3.4)
3.4.1残差散点图:
wIsrne七卜iocJ
10002WCGOCO<0-00
3.4.2残差散点图分析:
由3.4.1残差散点图可以直观地看到,残差图上的点仍是有规律的,即误差随着x的增加而
波动幅度增加,呈大喇叭的形状,因此可以认为误差项仍存在异方差。
4.作变换:
y=sqrt(y)。
4.1得到结果如下:
ThsRBGProcedure
riodel'HOTEL!
DependeiLtYari
8_ble;yy
Muinilb
ar
o£OLservat1due
ReaJS3
Numb
er
Ussd53
AnkLysizofViriwae
Svni&£
Messi
Source
DF
Squares
Squarq
FValue
Pr>F
1
20.25850
20.25650
94.03
C0001
Error
51
10.90213
0.21534
Currect^d
Tot£L
52
31.24069
RootIflSE
□4&401
E-Equue
□P
Depeiidlentffil
ean
1.68040
AdjR_Sq
0”&416
Coeff¥ar
27.61503
FEstimatss
Tar
Standard
¥比£%.blg
L^bel
DF
Eitq^
t口专
f八ri
Intercept
Intercejpt
1
0.S&223
0.曲S3
4.48
1 □00095285 0.00009S24 9.TO <.0001 图4.1.1方差分析以及参数估计 4.2结果分析: 2 由图4.1.1可知,回归方程通过了显著性检验,调整R为0.6520,回归方程的系数都通过 了显著性检验,方差稳定变换yy后,回归方程为: 1.用普通最小二乘法建立y关于x的回归方程。 1.1首先录入数据,sas程序如下: procimportout=aa2/*使用import过程导入数据,并输出到数据集aa2*/datafile="d: \xt_4.13.xls" dbms=excel2000replace; getnames=yes;/*首行为变量名*/ run; 1.2建立回归方程,sas程序如下: procregdata=aa2; modely=x/clbprspecDW〃*其中p是预测值,r是残差,clb是给出回归系数的区间估计,spec 可以给出怀特检验(检验异方差)的结果,DW给出一阶线性自相关检验*/ outputout=outr=residual;/*把回归的结果输出在文件out里,残差给变量名residual*/ run; 1.3得到结果如下: TheKEGProcedure IMo4a;MODELl DependentVariable: yy NumberofObservationsRead20 NumbirofObservationsUsed20 SumofMean Soiurccr Model Error Corrected DF 18 Tctil19 Squares 109.9496202OS38110.ISWO' Squart 109.949B2 0.01124 7Value 9f7T83B Tr>? <.QOOl RootVISE 0.10504 R-Squ^e 0.0932 DependentINean 24.5SDOO AdjR-Sq 0,9931 Coef£Var 0.43139 Fart電匸Ea Faramieter Standard Varidble Label DF Estimate Error tValueFr ■>HI 95梵Confideuce Liihits Intsrcept Ilitexcept 1 -1.3S145 0.26330 -5.13 <0001 -L.9M62 -0.79828 X 1 0.17565 0.00176 98.旳 <.HJ01 01T191 0.LT936 图1.3.1方差分析以及参数估计 1.4结果分析: (1)由方差分析可知: p值小于0.05,所以该回归方程显著有效。 (2)R-Square=0.9982,AdjR-Sq=0.9981,可见回归方程的拟合度较高。 (3) (141) 由参数估计可得,所有参数的检验P值均小于0.05,参数显著有效 (4)拟合的回归方程为: y1.351450.17565X 个人收集整理勿做商业用途 2.残差图以及DW佥验诊断序列的相关性 2.1残差图如下: 残差图分析: 该图存在一定的锯齿形,故可判断残差项存在相关。 DF Chi-5quarePt >ChiSq 2 S.70 0.2593 onD NumberofDtservationiLetOrderAutocorrelation 0.T71 0.&05 2.2DW佥验: 查DW分布表可得临界值dL和du分别为1.20和1.41,由于DW1=0.771 个人收集整理勿做商业用途 3.迭代法处理序列相关,建立回归方程。 3.1sas程序如下: 产迭代法处理序列相关*/ databb; setout; 「o=1-(1/2)*0.771;/*求自相关系数的估计值ro,DW值=0.771*/ y_t_1=y-ro*lag1(y); x_t_仁x-ro*lag1(x);/*lagn(n自定)函数可把一变量的各观测值移后n位;*/ procregdata=bb; modely_t_仁x_t_1/clbprspecDW; 「un; 3.2结果如下所示: AnalysisofVariancc Source DF £5if Sareh He辺 £書iar* FValue Pr N.6d«l 1 16.moo 16.89700 2314.08 <0001 Error 1? C.15467 0.00733 CorrectedTotal 18 1".02187 RootIISE 0.0656-4 E-Square 0.99ZT Dependent.Mwu g30049 AdjR-曲 0.BB22 Coeff畑 0,&T379 图3.2.1方差分析以及参数估计 Eurbin-'flfalson1 1.600 NuiiberofObzerv^tions L9 1stOrierAut? ccrr^l%tion 0.167 3.3结果分析: 由图3.2.1可知,迭代法所得的回归模型通过了显著性检验,调整R2为0.9922,回归方程 为: yt0.408010.1737X;(3.3.1) 其中,ytytpy「,xtxtpx“ 由图3.2.2可知,DW=1.60b查DW表,n=19,k=2,显著水平a=0.05,得dL=1.18,du=1.40。 由于1.40<1.60<4-1.40,所以迭代法得到的回归方程的误差项间无自相关。 图3.2.2DW检验 图421方差分析以及参数估计 1.828 Numberoftione OrderA.uIocarrellition 0.066 图422DW检验 4.3结果分析: 2由图421可见,一阶差分法处理数据后建立的回归模型通过了显著性检验,调整R为 0.9346,回归方程为: yt0.028270.16248Xt(4.3.1) 个人收集整理勿做商业用途 苴中ytytytixtxtxt1 其中, 由图422可知,DW=1.828查DW表,n=19,k=2,显著水平a=0.05,得dL=1.18,dU=1.40。 由于1.40<1.828<4-1.40,所以迭代法得到的回归方程的误差项间无自相关。 5.三种方法的优良性比较。 在回归模型不存在序列相关时,普通最小二乘法比迭代法和一阶差分法操作起来更简便,但是,当一个回归模型存在序列相关性时,普通最小二乘法所建立的回归方程就不适用了,这时需要使用迭代法或一阶差分法。 由于一阶差分法的应用条件是自相关系数P=1,当P接近1时,一阶差分法比迭代法好,当 原模型存在较高程度的一阶自相关的情况时,一般使用一阶差分法而不用迭代法,因为一阶差分法比迭代法简单而且迭代法需要用样本估计自相关系数P,对P的估计误差会影响迭代法的使用 效率,同时迭代法的算法时间复杂度比一阶差分的高,在效率上不如一阶差分好。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 修正