修正决定系数公式.docx
- 文档编号:7573382
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:16
- 大小:29.13KB
修正决定系数公式.docx
《修正决定系数公式.docx》由会员分享,可在线阅读,更多相关《修正决定系数公式.docx(16页珍藏版)》请在冰豆网上搜索。
修正决定系数公式
修正决定系数公式
【篇一:
多元线性回归模型习题及答案】
多元线性回归模型
一、单项选择题
1.在由n?
30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为(d)
a.0.8603b.0.8389c.0.8655d.0.83272.下列样本模型中,哪一个模型通常是无效的(b)a.
ci(消费)=500+0.8ii(收入)
d
ipqb.i(商品需求)=10+0.8i(收入)+0.9i(价格)
s
pqic.(商品供给)=20+0.75i(价格)0.60.4
ylkiiid.(产出量)=0.65(劳动)(资本)
3.用一组有30个观测值的样本估计模型平上对a.
yt?
b0?
b1x1t?
b2x2t?
ut后,在0.05的显著性水
b1的显著性作t检验,则b1显著地不等于零的条件是其统计量t大于等于(c)
t0.05(30)b.t0.025(28)c.t0.025(27)d.f0.025(1,28)
lnyt?
lnb0?
b1lnxt?
ut中,b1的实际含义是(b)a.x关于y的弹性b.y关于x的弹性c.x关于y的边际倾向d.y关于x的边际倾向
4.模型
5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在(c)
a.异方差性b.序列相关c.多重共线性d.高拟合优度
6.线性回归模型yt?
b0?
b1x1t?
b2x2t?
......?
bkxkt?
ut中,检验h0:
bt?
0(i?
0,1,2,...k)
时,所用的统计量服从(c)a.t(n-k+1)b.t(n-k-2)c.t(n-k-1)d.t(n-k+2)7.调整的判定系数a.?
2
与多重判定系数之间有如下关系(d)
n?
1n?
1
r2b.2?
1?
r2
n?
k?
1n?
k?
1n?
1n?
12
(1?
r2)d.2?
1?
(1?
r2)c.?
1?
n?
k?
1n?
k?
1
8.关于经济计量模型进行预测出现误差的原因,正确的说法是(c)。
a.只有随机因素b.只有系统因素c.既有随机因素,又有系统因素d.a、b、c都不对
9.在多元线性回归模型中对样本容量的基本要求是(k为解释变量个数):
(c)an≥k+1bnk+1cn≥30或n≥3(k+1)dn≥3010、下列说法中正确的是:
(d)a如果模型的r很高,我们可以认为此模型的质量较好
b如果模型的r较低,我们可以认为此模型的质量较差
c如果某一参数不能通过显著性检验,我们应该剔除该解释变量
d如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量
22
0111.半对数模型中,参数?
1的含义是(c)。
a.x的绝对量变化,引起y的绝对量变化b.y关于x的边际变化
c.x的相对变化,引起y的期望值绝对量变化d.y关于x的弹性
0112.半对数模型中,参数?
1的含义是(a)。
a.x的绝对量发生一定变动时,引起因变量y的相对变化率b.y关于x的弹性
c.x的相对变化,引起y的期望值绝对量变化d.y关于x的边际变化
y?
?
?
?
lnx?
?
lny?
?
?
?
x?
?
0113.双对数模型中,参数?
1的含义是(d)。
a.x的相对变化,引起y的期望值绝对量变化b.y关于x的边际变化
c.x的绝对量发生一定变动时,引起因变量y的相对变化率d.y关于x的弹性二、多项选择题
1.将非线性回归模型转换为线性回归模型,常用的数学处理方法有(?
)
a.直接置换法b.对数变换法c.级数展开法d.广义最小二乘法e.加权最小二乘法
lny?
?
?
?
lnx?
?
2.在模型
lnyi?
ln?
0?
?
1lnxi?
?
i中(abcd)
a.y与x是非线性的b.y与?
1是非线性的c.lny与?
1是线性的d.lny与lnx是线性的e.y与lnx是线性的
011t3.对模型t
则有(bcd)
y?
b?
bx?
b2x2t?
ut进行总体显著性检验,如果检验结果总体线性关系显著,
b1?
b2?
0b.b1?
0,b2?
0c.b1?
0,b2?
0b?
0,b2?
0e.b1?
b2?
0d.1
a.
4.剩余变差是指(acde)
a.随机因素影响所引起的被解释变量的变差b.解释变量变动所引起的被解释变量的变差
c.被解释变量的变差中,回归方程不能做出解释的部分d.被解释变量的总变差与回归平方和之差e.被解释变量的实际值与回归值的离差平方和5.回归变差(或回归平方和)是指(bcd)a.被解释变量的实际值与平均值的离差平方和b.被解释变量的回归值与平均值的离差平方和c.被解释变量的总变差与剩余变差之差d.解释变量变动所引起的被解释变量的变差e.随机因素影响所引起的被解释变量的变差
3.设k为回归模型中的参数个数(包括截距项),则总体线性回归模型进行显著性检验时所用的f统计量可表示为()。
?
?
)2n?
k)?
(yi
a.
?
ei2k?
1)
?
?
)2k?
1)?
(yi
2?
e(n?
k)ib.
(1?
r2n?
k)r2k?
1)
22
(1?
r)n?
k)rk?
1)c.d.r2n?
k)2
(1?
r)k?
1)e.
7.在多元线性回归分析中,修正的可决系数与可决系数r之间()。
a.rb.≥rc.只能大于零d.可能为负值
三、名词解释
偏回归系数;回归变差、剩余变差;多重决定系数、调整后的决定系数、偏相关系数名词解释答案1.偏回归系数:
2.回归变差:
简称ess,表示由回归直线(即解释变量)所解释的部分,表示x对y的线性影响。
3.剩余变差:
简称rss,是未被回归直线解释的部分,是由解释变量以外的因素造成的影响。
4.多重决定系数:
在多元线性回归模型中,回归平方和与总离差平方和的比值,也就是在被解释变量的总变差中能由解释变量所解释的那部分变差的比重,我们称之为多重决定系数,
2
仍用r表示。
5.调整后的决定系数:
又称修正后的决定系数,记为,是为了克服多重决定系数会随着解释变量的增加而增大的缺陷提出来的,其公式为:
2
2
22
22
222
2
e/(n?
k?
1)。
?
1?
(y?
)/(n?
1)2tt
6.偏相关系数:
在y、x1、x2三个变量中,当x1既定时(即不受x1的影响),表示y与x2之间相关关系的指标,称为偏相关系数,记做ry2.1。
四、简答
011t22tt,请叙述模型的古典假定。
1.给定二元回归模型:
t
解答:
(1)随机误差项的期望为零,即e(ut)?
0。
(2)不同的随机误差项之间相互独立,
y?
b?
bx?
bx?
u
即cov(ut,us)?
e[(ut?
e(ut))(us?
e(us)]?
e(utus)?
0。
(3)随机误差项的方差与t无关,为一个常数,即var(ut)?
?
2。
即同方差假设。
(4)随机误差项与解释变量不相关,即(5)随机xjt为非随机变量,这个假设自动成立。
cov(xjt,ut)?
0?
?
(j?
1,2,...,k。
通常假定)误差项ut为服从正态分布的随机变量,即ut?
n(0,?
2)。
(6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。
2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度?
解答:
因为人们发现随着模型中解释变量的增多,多重决定系数r的值往往会变大,从而增加了模型的解释功能。
这样就使得人们认为要使模型拟合得好,就必须增加解释变量。
但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。
为此用修正的决定系数来估计模型对样本观测值的拟合优度。
3.修正的决定系数及其作用。
解答:
2
2
2
e/n?
k?
1,其作用有:
(1)用自由度调整后,可以消除拟合优度?
1?
(y?
)/n?
12
t
2
t
评价中解释变量多少对决定系数计算的影响;
(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。
4.常见的非线性回归模型有几种情况?
解答:
常见的非线性回归模型主要有:
(1)对数模型lnyt?
b0?
b1lnxt?
ut
(2)半对数模型yt?
b0?
b1lnxt?
ut或lnyt?
b0?
b1xt?
ut
111
?
u或?
b0?
b1?
uxyx
(4)多项式模型y?
b0?
b1x?
b2x2?
...?
bkxk?
u
(3)倒数模型y?
b0?
b1
(5)成长曲线模型包括逻辑成长曲线模型yt?
k
和gompertz成长曲线模型?
b1t
1?
b0e
yt?
ek?
b0b1
t
5.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。
①yt?
b0?
b1xt3?
ut②yt?
b0?
b1logxt?
ut③logyt?
b0?
b1logxt?
ut④yt?
b0/(b1xt)?
ut
解答:
①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。
6.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。
①yt?
b0?
b1logxt?
ut②yt?
b0?
b1(b2xt)?
ut③yt?
b0/(b1xt)?
ut④yt?
1?
b0(1?
xt1)?
ut
解答:
①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。
五、计算和分析题
1.根据某地1961—1999年共39年的总产出y、劳动投入l和资本投入k的年度数据,运用普通最小二乘法估计得出了下列回归方程:
(0.237)(0.083)(0.048)
,dw=0.858
式下括号中的数字为相应估计量的标准误。
(1)解释回归系数的经济含义;
(2)系数的符号符合你的预期吗?
为什么?
解答:
(1)这是一个对数化以后表现为线性关系的模型,lnl的系数为1.451意味着资本投入k保持不变时劳动—产出弹性为1.451;lnk的系数为0.384意味着劳动投入l保持不变时资本—产出弹性为0.384.
(2)系数符号符合预期,作为弹性,都是正值。
2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程:
b
?
?
8.133?
1.059yw?
0.452p?
0.121a
(8.92)
(0.17)
(0.66)
(1.09)
r2?
0.95f?
107.37
式下括号中的数字为相应参数估计量的标准误。
试对该模型进行评析,指出其中存在的问题。
2
解答:
该消费模型的判定系数r?
0.95,F统计量的值f?
107.37,均很高,表明模型的整体拟合程度很高。
计算各回归系数估计量的t统计量值得:
t0?
8.133?
8.92?
0.91,
t1?
1.059?
0.17?
6.10
t2?
0.452?
0.66?
0.69,t3?
0.121?
1.09?
0.11。
除t1外,其余t值均很小。
工资收入
W的系数t检验值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。
另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。
这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。
3.计算下面三个自由度调整后的决定系数。
这里,r为决定系数,n为样本数目,k为解释变量个数。
(1)r?
0.75?
?
?
?
?
?
?
n?
?
?
?
?
?
?
?
?
?
k?
2
(2)r?
0.35?
?
?
?
?
?
?
n?
?
?
?
?
?
?
?
?
?
k?
3(3)r?
0.95?
?
?
?
?
?
?
n?
?
?
?
?
?
?
?
?
?
?
k?
5解答:
(1)?
1?
(2)?
1?
2
2
22
2
2
n?
18?
1
(1?
r2)?
1?
?
(1?
0.75)?
0.65
n?
k?
18?
2?
1
9?
1
?
(1?
0.35)?
?
0.04
9?
3?
131?
12
?
(1?
0.95)?
0.94(3)?
1?
31?
5?
1
yt?
b0?
b1x1t?
b2x2t?
ut
4.设有模型,试在下列条件下:
①b1?
b2?
1②b1?
b2。
分别求出b1,b2的最小二乘估计量。
解答:
当b1?
b2?
1时,模型变为yt?
x2t?
b0?
b1(x1t?
x2t)?
ut,可作为一元回归模型来对待b1?
n(x1t?
x2t)(yt?
x2t)?
(x1t?
x2t)(yt?
x2t)
n(x1t?
x2t)2?
((x1t?
x2t))2
当b1?
b2时,模型变为yt?
b0?
b1(x1t?
x2t)?
ut,同样可作为一元回归模型来对待
b1?
n(x1t?
x2t)yt?
(x1t?
x2t)ytn(x1t?
x2t)2?
((x1t?
x2t))2
5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。
你通过整个学年收集数据,得到两个可能的解释性方程:
?
?
125.0?
15.0x1?
1.0x2?
1.5x3?
0.75方程a:
y
2
?
?
123.0?
14.0x1?
5.5x2?
3.7x4?
0.73方程b:
y
其中:
y——某天慢跑者的人数
x1——该天降雨的英寸数x2——该天日照的小时数
x3——该天的最高温度(按华氏温度)x4——第二天需交学期论文的班级数请回答下列问题:
(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
解答:
(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。
(2)出现不同符号的原因很可能是由于x2与x3高度相关而导致出现多重共线性的缘故。
从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。
而日照时间长度和第
2
【篇二:
计量经济期末重点汇总】
经济模型应用:
①结构分析②经济预测③政策评价④检验和发展经济理论
建立经济模型步骤:
5个步骤:
①根据经济理论建立计量经济模型;②样本数据的收集;③估计参数;④模型的检验;⑤计量经济模型的应用。
经济模型的检验:
①经济意义检验②统计准则检验③计量经济学准则检验④模型预测检验。
古典线性回归模型的基本假定:
①零均值假定。
即e(ut)=0。
②同方差假定。
var(ut)?
?
2③无自相关假定。
即cov(ut,us)?
e[(ut?
e(ut))(us?
e(us)]?
e(utus)?
0④解释变量与随机误差项不相关假定。
cov(xjt,ut)?
0?
?
(j?
1,2,...,k)⑤正态性假定,即假定误差项ut服从均值为0,方差为?
2的正态分布。
utn(0,?
2)(多元:
(6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。
)
在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度
在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。
为此用修正的决定系数来估计模型对样本观测值的拟合优度。
修正的可决系数进行多元回归的拟合优度检验的原因:
在多元回归分析中,引入解释变量是否对被解释变量有显著影响,都有使可决系数增大的倾向,用可决系数的分子和分母与其自由度相除,得到的修正可决系数可以有效的解决这一问题
修正的决定系数作用:
(1)用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;
(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。
总体回归模型与样本回归模型的区别与联系:
区别:
①描述的对象不同。
②建立模型的不同。
③模型性质不同(样本回归模型为随机模型)联系:
样本回归模型是总体回归模型的一个估计式,用来估计总体回归模型。
回归分析与相关分析的区别与联系:
联系:
①相关分析是回归分析的前提和基础;②回归分析是相关分析的深入和继续;③相关分析与回归分析的有关指标之间存在计算上的内在联系。
区别:
①回归分析强调因果关系,相关分析不关心因果关系,所研究的两个变量是对等的。
②对两个变量x与y而言,相关分析中:
rxy?
ryx;但在?
?
b?
?
x和x?
t?
a?
0?
a?
1?
yt却是两个完全不同的回归方程。
③回归分析对资料的要求是:
被解释回归分析中,y?
t?
b01t变量y是随机变量,解释变量x是非随机变量。
相关分析对资料的要求是两个变量都随机变量。
?
和b?
分别为观测值y和随机误一元线性回归模型的普通最小二乘估计量统计性质:
①线性,是指参数估计量bt01?
和b?
的均值(期望值)分别等于总体参数差项ut的线性函数或线性组合。
②无偏性,指参数估计量bb0和b1。
01?
?
③有效性(最小方差性或最优性),指在所有的线性无偏估计量中,最小二乘估计量b0和b1的方差最小。
?
和b?
是参数b和b的最佳线性无偏估计量,即blue,这一简述blue的含义:
在古典假定条件下,ols估计量b1001结论就是著名的高斯-马尔可夫定理。
从哪些症状中可以判断可能存在多重共线性:
(1)模型总体性检验f值和r2值都很高,但各回归系数估计量的方差很大,t值很低,系数不能通过显著性检验。
(2)回归系数值难以置信或符号错误。
(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。
多重共线性原因:
(1)样本数据的采集是被动的,只能在一个有限的范围内得到观察值,无法进行重复试验。
(2)经济变量的共同趋势(3)滞后变量的引入(4)模型的解释变量选择不当(5)利用截面数据建立模型完全多重共线性对ols估计量的影响:
(1)无法估计模型的参数,即不能独立分辨各个解释变量对因变量的影响。
(2)参数估计量的方差无穷大(或无法估计)
不完全多重共线性对ols估计量的影响:
(1)可以估计参数,但参数估计不稳定。
(2)参数估计值对样本数据的略有变化或样本容量的稍有增减变化敏感。
(3)各解释变量对被解释变量的影响难精确鉴别。
(4)t检验不容易拒绝原假设。
多重共线性的后果:
(1)完全共线性下参数估计量不存在
(2)一般共线性下普通最小二乘法参数估计量无偏,但方差较大。
(3)参数估计量经济含义不合理。
参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。
多重共线性的检验方法:
简单相关系数检验法、方差膨胀因子法、直观判断法、逐步回归法、特征值和病态指数
方差膨胀因子检验法:
所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系?
数估计量的方差对比而得出的比值系数。
?
)=1?
)1vif(?
若时,认为原模型不存在“多重共线性问题”;若vif(?
时,则认为原模型存在“多重共线性
?
)5vif(?
问题”;若时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。
直观判断法:
当增加或剔除一个解释变量或者改变一个观测值时,回归参数的估计值发生较大的变化;一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验;解释变量的相关矩阵中,自变量之间的相关系数较大----可能存在严重的多重共线性。
逐步回归法基本思想:
将变量逐个引入模型,进行f检验并对已选入的解释变量逐个进行t检验,经过对比,保留最优的变量,剔除引起多重共线性的变量。
多重共线性的解决办法:
(1)经验方法:
剔除变量法,增大样本容量,变换模型形式,利用非样本先验信息,横截面数据与时序数据并用,变量变换。
(2)逐步回归法:
通过逐步回归筛选并剔除引起严重多重共线性的变量。
异方差性原因:
(1)模型中遗漏了某些解释变量;
(2)模型函数形式的设定误差;(3)样本数据的测量误差;
(4)随机因素的影响。
异方差性的后果:
(1)参数估计量仍然具有无偏性,但非有效,在大样本情况下仍不具有一致性。
(2)变量的显著性检验失去意义。
(3)模型的预测失效。
异方差性的检验方法:
(1)图示检验法(x-y、e2—x相关图);
(2)戈德菲尔德—匡特检验;(3)怀特检验;(4)戈里瑟检验和帕克检验(残差回归检验法);(5)arch检验(自回归条件异方差检验)
戈德菲尔特—匡特检验基本原理:
将样本分为容量相等的两部分,然后分别对样本1和样本2进行回归,并计算两个子样本的残差平方和,如果随机误差项是同方差的,则这两个子样本的残差平方和应该大致相等;如果是异方差的,则两者差别较大,以此来判断是否存在异方差。
使用条件:
(1)样本容量要尽可能大,一般而言应vif(?
i)=1iiii
该在参数个数两倍以上;
(2)ut服从正态分布,且除了异方差条件外,其它假定均满足。
异方差的解决办法:
(1)广义最小二乘法(对模型做适当的线性变换使其满足古典假定)
(2)加权最小二乘法(3)模型的对数变换
加权最小二乘法的基本原理:
通过加权,新得到的模型的随机误差项的方差变成一个常量,不再随着某个变量22的变动而变动。
对较小的et给于充分的重视,即给于较大的权数;对较大的et给于充分的重视,即给于较小的权数。
序列相关性的原因:
经济系统的惯性、经济活动的滞后效应、数据处理造成的相关、蛛网现象、模型设定的偏误
序列相关性的后果:
(1)参数估计量仍然具有无偏性,但非有效,在大样本情况下仍不具有一致性。
(2)变量的显著性检验失去意义。
(3)模型的预测失效。
序列相关性的检验方法:
图示检验法(et—et-1、et—t相关图)、d.w.检验、偏自相关系数检验。
bg检验等。
dw检验的条件:
(1)回归模型必须含有截距项;
(2)解释变量必须是非随机的;(3)解释变量中不能包含被解释变量的滞后期;(4)不能用于联立方程模型中各方程组的自相关检验;(5)只适用于随机误差项存在一阶自回归形式的自相关检验;(6)dw检验存在两个不能确定是否存在自相关的范围,目前还没有比较好的解决办法。
dw检验的局限性:
(1)dw检验有运用的前提条件
(2)dw统计量的上、下界表一般要求n=15,(3)dw检验不适应随机误差项具有高阶序列相关的检验(4)dw检验有两个不能确定的区域,一旦dw值落入这两个区域,就无法判断。
序列相关性的处理:
广义差分法、c--o迭代法、一阶差分法、德宾两步法
滞后效应
产生的原因:
心理预期因素、技术因素、制度因素
分布滞后模型估计的困难:
自由度问题,多重共线性问题,滞后长度难以确定。
有限分布滞后模型的基本思想:
对滞后模型中系数施加某种约束,设法有目的的减少需要直接估计的模型参数的个数以缓解多重共线性,保证自由度。
无限分布滞后模型的基本思想:
通过适当的模型变换,使其转化为只需估计有限个参数的自回归模型。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 修正 决定 系数 公式