计量作业第2章第4章.docx
- 文档编号:11765782
- 上传时间:2023-04-01
- 格式:DOCX
- 页数:18
- 大小:74.36KB
计量作业第2章第4章.docx
《计量作业第2章第4章.docx》由会员分享,可在线阅读,更多相关《计量作业第2章第4章.docx(18页珍藏版)》请在冰豆网上搜索。
计量作业第2章第4章
第二章一元线性回归模型
1、最小二乘法对随机误差项u作了哪些假定?
说明这些假定条件的意义。
答:
假定条件:
(1)均值假设:
E(ui)=0,i=1,2,…;
(2)同方差假设:
Var(ui)=E[ui-E(ui)]2=E(ui2)=σu2,i=1,2,…;
(3)序列不相关假设:
Cov(ui,uj)=E[ui-E(ui)][uj-E(uj)]=E(uiuj)=0,i≠j,i,j=1,2,…;
(4)Cov(ui,Xi)=E[ui-E(ui)][Xi-E(Xi)]=E(uiXi)=0;
(5)ui服从正态分布,ui~N(0,σu2)。
意义:
有了这些假定条件,就可以用普通最小二乘法估计回归模型的参数。
2、阐述对样本回归模型拟合优度的检验及回归系数估计值显著性检验的步骤。
答:
样本回归模型拟合优度的检验:
可通过总离差平方和的分解、样本可决系数、样本相关系数来检验。
回归系数估计值显著性检验的步骤:
(1)提出原假设H0:
β1=0;
(2)备择假设H1:
β1≠0;
(3)计算t=β1/Sβ1;
(4)给出显著性水平α,查自由度v=n-2的t分布表,得临界值tα/2(n-2);
(5)作出判断。
如果|t| β1=0,表明X对Y无显著影响,一元线性回归模型无意义;如果|t|>tα/2(n-2),拒绝H0,接受H1: β1≠0,表明X对Y有显著影响。 4、试说明为什么∑ei2的自由度等于n-2。 答: 在模型中,自由度指样本中可以自由变动的独立不相关的变量个数。 当有约束条件时,自由度减少,其计算公式: 自由度=样本个数-受约束条件的个数,即df=n-k。 一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条件予以确定,由此减去2,也即其自由度为n-2。 5、试说明样本可决系数与样本相关系数的关系及区别,以及样本相关系数与β^1的关系。 答: 样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。 但样本相关系数与样本可决系数在概念上有明显的区别,r建立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r²建立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。 6、已知某市的货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变价)1985~1998年的样本观测值见下表(略)。 DependentVariable: Y Method: LeastSquares Date: 10/28/13Time: 10: 25 Sample: 19851998 Includedobservations: 14 Variable Coefficient Std.Error t-Statistic Prob. GDP 26.95415 4.120300 6.541792 0.0000 C 12596.27 1244.567 10.12101 0.0000 R-squared 0.781002 Meandependentvar 20168.57 AdjustedR-squared 0.762752 S.D.dependentvar 3512.487 S.E.ofregression 1710.865 Akaikeinfocriterion 17.85895 Sumsquaredresid 35124719 Schwarzcriterion 17.95024 Loglikelihood -123.0126 Hannan-Quinncriter. 17.85050 F-statistic 42.79505 Durbin-Watsonstat 0.859998 Prob(F-statistic) 0.000028 (1)一元线性回归方程Yt=12596.27+26.95415GDPt (2)结构分析β^1=26.95425是样本回归方程的斜率,它表示某市货物运输量的情况,说明货物运输量每增加1亿元,将26,95425用于国内生产总值;β^0=12596.27是样本回归方程的截距,它表示不受货物运输量影响的国内生产总值。 ∧ (3)统计检验r2=0.78说明总离差平方和的78%被样本回归直线解释,有22%没被解释,说明样本回归直线对样本点的拟合优度还是比较高的。 显著性水平α=0.05,查自由度v=14-2=12的t分布表,得临界值t0.025(12)=2.18 (4)预测区间1980~2000 obs GDP RESID Y YF YFSE 1980 1981 1982 1983 1984 1985 161.69 1294.51817047138 18249 16954.48182952862 1837.805042947807 1986 171.07 1317.688263830489 18525 17207.31173616951 .852********* 1987 184.07 842.2843420467398 18400 17557.71565795326 1815.329074565951 1988 194.75 -1152.585956772524 16693 17845.58595677253 1806.164743584577 1989 197.86 -2386.413356522331 15543 17929.41335652233 1803.689193053205 1990 208.55 -2288.553196819888 15929 18217.55319681989 1795.851377857323 1991 221.06 -246.7495861671741 18308 18554.74958616718 1788.013873793755 1992 246.92 -1729.78384903854 17522 19251.78384903854 1776.450315989464 1993 276.8 1582.826213815424 21640 20057.173******** 1770.995648870701 1994 316.38 2658.981042723055 23783 21124.01895727694 1776.926294021264 1995 363.52 1645.362514039523 24040 22394.63748596048 1803.310480128086 1996 415.51 337.0163683828214 24133 23795.98363161718 1855.694986909933 1997 465.78 -60.96864300710876 25090 25150.96864300711 1927.747214173007 1998 509.1 -1813.62232698188 24505 26318.62232698188 2004.982737266598 1999 2000 620 29307.83732127556 2255.639096466328 单个值预测区间Y2000∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64] 均值预测区间E(Y2000)∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64] 8、查中国统计年鉴,利用1978~2000的财政收入和GDP的统计资料,要求以手工和EViews软件。 (1)散点图 DependentVariable: Y Method: LeastSquares Date: 10/29/13Time: 16: 40 Sample: 19782000 Includedobservations: 23 Variable Coefficient Std.Error t-Statistic Prob. GDP 0.986097 0.001548 637.0383 0.0000 C 174.4171 50.39589 3.460939 0.0023 R-squared 0.999948 Meandependentvar 22634.30 AdjustedR-squared 0.999946 S.D.dependentvar 23455.82 S.E.ofregression 172.6972 Akaikeinfocriterion 13.22390 Sumsquaredresid 626310.6 Schwarzcriterion 13.32264 Loglikelihood -150.0748 Hannan-Quinncriter. 13.24873 F-statistic 405817.8 Durbin-Watsonstat 0.984085 Prob(F-statistic) 0.000000 一元线性回归方程Y=174.4174+0.98GDPt 经济意义国名收入每增加1亿元,将有0.98亿元用于国内生产总值。 (2)检验r²=99%,说明总离查平方和的99%被样本回归直线解释,仅有1%未被解释,所以说样本回归直线对样本点的拟合优度很高。 显著性水平α=0.05,查自由度v=23-2=21的t分布表,得临界值t0.025(21)=2.08。 (3)预测值及预测区间 obs Y YF YFSE GDP 1978 3645.2 3768.939527560003 178.8799078873616 3645.2 1979 4062.6 4180.536602486764 178.7740777289417 4062.6 1980 4545.600000000001 4656.821670023003 178.6544531237366 4545.600000000001 1981 4889.5 4998.011387140059 178.5706344690318 4891.600000000001 1982 4889.5 4998.011387140059 178.5706344690318 4891.600000000001 1983 5330.5 5423.808265322558 178.4682301138803 5323.399999999999 1984 5985.6 6054.220364030461 178.3211083266242 5962.7 1985 7243.8 7282.306126162203 178.0499504848901 7208.1 1986 9040.700000000001 .0717******* 177.6928063009931 9016 1987 12050.6 12065.37179921504 177.189********16 12058.6 1988 10274.4 10306.76560988973 177.4697052274058 10275.2 1989 12050.6 12065.37179921504 177.189********16 12058.6 1990 15036.8 .0838******* 176.8172394391318 15042.8 1991 17000.9 16930.48077996771 176.6385874540277 16992.3 1992 18718.3 18582.68705461982 176.5261264423878 18667.8 1993 35260 .0857******* 177.4791848854038 35333.9 1994 21826.2 21653.09867943883 176.4182393724463 21781.5 1995 26937.3 26723.61175867555 176.5282689819769 26923.5 1996 35260 .0857******* 177.4791848854038 35333.9 1997 48108.5 47702.24331311228 180.7470770711596 48197.9 1998 59810.5 60122.92955260078 185.9681357044579 60793.7 1999 88479.2 88604.77659126783 204.5612478858191 89677.1 2000 70142.5 70361.48074871261 191.6614042102092 71176.6 2001 104413.7922729122 218.176********98 105709 单个值的预测区间Y2000∈[104413.8-2.07×218.2,104413.8+2.07×218.2] 均值预测区间E(Y2000)∈[104413.8-2.07×218.2,104413.8+2.07×218.2] 第三章多元线性回归模型 2、试对二元线性回归模型Yi=β0+β1X1i+β2X2i+ui,i=1,2,3,……n作回归分析: (1)求出未知参数β0,β1,β2的最小二乘估计量β^0,β^1,β^2; (2)求出随机误差项u的方差σ2的无偏估计量; (3)对样本回归方差拟合优度检验; (4)对总体回归方程的显著性进行F检验; (5)对β1,β2的显著性进行t检验; (6)当X0=(1,X10,X20)时,写出E(Y0/X0)的置信度为95%的预测区间。 答: (1)由公式 可得出 。 其中 , , (2)随机误差项的方差 的无偏差估计量为 (3)求出样本可决系数 R-squared,修正样本可决系数为 =Adjusted-squared,比较 和 值大小关系,即可得出样本回归方差拟合优度。 (4)提出检验的原假设 对立假设为 : 至少有一个 不等于零( ),由题意得F的统计量为F-statistic。 对于给定的显著性水平 ;从附录4的表1中,查出分子自由度为 ,分母自由度为 的F分布上侧位数 。 由F-statistic与 的值大小关系,可得显著性关系。 (5)提出检验的原假设 ,求出t统计量 -statistic。 对于给定的显著性水平 =0.05,;从附录4的表1中,查出t分布的自由度为f的t分布双侧位数 。 比较 -statistic与 值的大小关系,可得检验结果的显著性关系。 (6)E(YO|XO)的预测区间: (Y0-tα/2(v)•S(Y0),Y0+tα/2(v)•S(Y0)); YO的预测区间: (Y0-tα/2(v)•S(e0),Y0+tα/2(v)•S(e0) 3、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示(略)。 DependentVariable: Y Method: LeastSquares Date: 10/29/13Time: 22: 18 Sample: 118 Includedobservations: 18 Variable Coefficient Std.Error t-Statistic Prob. X2 0.402289 0.116359 3.457319 0.0035 X1 104.3081 6.409709 16.27345 0.0000 C -0.962980 30.32507 -0.031755 0.9751 R-squared 0.979722 Meandependentvar 755.1556 AdjustedR-squared 0.977019 S.D.dependentvar 258.6819 S.E.ofregression 39.21512 Akaikeinfocriterion 10.32701 Sumsquaredresid 23067.39 Schwarzcriterion 10.47541 Loglikelihood -89.94312 Hannan-Quinncriter. 10.34748 F-statistic 362.3656 Durbin-Watsonstat 2.561545 Prob(F-statistic) 0.000000 回归方程Y^=-0.96+104.3X1+0.4X2 (2)检验设原假设H0: βi=0i=1,2 根据上表中的计算结果知: S(β^1)=6.409709S(β^2)=0.116359 将S(β^1)和S(β^2)的值代入检验统计量式中,得 T1=β^1÷S(β^1)=16.2735t2=β^2÷S(β^2)=3.4561 对于给定的显著水平α=0.05,自由度为v=15的双侧分位数t0.05/2=2.13。 因为 ¯ t1>t0.05/2t2>t0.05/2,所以否定H0: β1≠0,H0: β2≠0,即可以认为受教育年限和家庭收入对学生购买书籍以及课外读物有显著性影响。 (3)R2=RSS/TSS=0.979722R2=1-(1-R2)n-1/n-k-1=0.97702 (4)预测区间 obs Y YF YFSE X2 X1 1 450.5 485.1411747692648 42.173********408 171.2 4 2 507.7 486.3480417901021 42.10363828287697 174.2 4 3 613.9 602.7650101844977 41.60234303786757 204.3 5 4 563.4 504.2499025991888 41.39814289671567 218.7 4 5 501.5 504.5315049040509 41.39212417827067 219.4 4 6 781.5 825.9037819058965 42.97924483690921 240.4 7 7 541.7999999999999 526.2953401798169 41.41179733769013 273.5 4 8 611.1 639.17216531309 40.55748283418582 294.8 5 9 1222.1 1174.953542585611 47.47686324319662 330.2 10 10 793.2 863.1959728497693 40.68970052896574 333.1 7 11 660.8 667.8151426076286 41.63232216941219 366 5 12 792.7 766.0486478880758 40.41271901973422 350.9 6 13 580.9 560.2485323660397 43.30987322087763 357.9 4 14 612.7 664.9991195590084 41.45455915514781 359 5 15 890.8 878.8047863192651 40.55307988286174 371.9 7 16 1121 1112.926047930283 42.49588607436637 435.3 9 17 1094.2 1044.26078466035 43.63918011814712 523.9 8 18 1253 1285.140501588057 46.39915863939679 604.1 10 19 1235.216435826087 44.12507255732823 480 10 单个值的预测区间Y∈[1235.216-2.13×44.125,1235.216+2.13×44.125] 均值的预测区间E(Y)∈[1235.216-2.13×44.125,1235.216+2.13×44.125] 4、假设投资函数模型估计的回归方程为: It=5.0+0.4Yt+0.6It-1,R2=0.8,DW=2.05,n=24其中It和Yt分别为第t期投资和国民收入 (1)对总体参数ß1,ß2的显著性进行检验(α=0.05) (2)若总离差平方和TSS=25,试求随机误差项ut方差的估计量 (3)计算F统计量,并对模型总体的显著性进行检验(α=0.05) 答: (1)首先提出检验的原假设H0: ß1=0,i=1,2,。 由题意知t的统计量值为t1=4.0,t2=3.2。 对于给定的显著性水平α=0.05,;从附录4的表1中,查出t分布的自由度为v=21的双侧分数位t0.05/2(21)=1.72。 因为t1=4.0>t0.05/2(21)=1.72,所以否定H0,ß1显著不等于零即可以认为第t期投资对国民收入有显著影响;t2=3.2>t0.05/2(21)=1.72。 所以否定H0,ß2显著不等于零即可以认为第t期投资对第t-1期投资有显著影响。 (2)R2=RSS=R2×TSS=0.8×25=20.ut的方差估计量为:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 作业