统计学一元线性回归分析练习题.docx
- 文档编号:26600684
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:5
- 大小:19.76KB
统计学一元线性回归分析练习题.docx
《统计学一元线性回归分析练习题.docx》由会员分享,可在线阅读,更多相关《统计学一元线性回归分析练习题.docx(5页珍藏版)》请在冰豆网上搜索。
统计学一元线性回归分析练习题
统计学一元线性回归分析练习题
一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法的学习与掌握。
同时,也介绍了极大似然估计法以及矩估计法。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:
第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为kids?
?
0?
?
1educ?
?
随机扰动项?
包含什么样的因素?
它们可能与教育水平相关吗?
上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?
请解释。
解答:
收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2.已知回归模型E?
?
?
?
N?
?
,式中E为某类公司一名新员工的起始薪金,N为所受教育水平。
随机扰动项?
的分布未知,其他所有假设都满足。
从直观及经济角度解释?
和?
。
?
满足线性性、无偏性及有效性吗?
简单陈述理由。
?
和?
OLS估计量?
对参数的假设检验还能进行吗?
简单陈述理由。
解答:
?
?
?
N为接受过N年教育的员工的总体平均起始薪金。
当N为零时,平均薪金为?
,因此?
表示没有接受过教育员工的平均起始薪金。
?
是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。
?
满足线性性、无偏性及有效性,因为这些性质的的成立无需?
和仍?
OLS估计量?
随机扰动项?
的正态分布假设。
如果?
t的分布未知,则所有的假设检验都是无效的。
因为t检验与F检验是建立在?
的正态分布假设之上的。
例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?
如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?
解答:
首先考察被解释变量度量单位变化的情形。
以E*表示以百元为度量单位的薪金,则E?
E*?
100?
?
?
?
N?
?
由此有如下新模型E*?
?
N?
或E*?
?
*?
?
*N?
?
*这里?
*?
?
/100,?
*?
?
/100。
所以新的回归系数将为原始模型回归系数的1/100。
再考虑解释变量度量单位变化的情形。
设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是E?
?
?
?
N?
?
?
?
?
?
?
?
或E?
?
?
N*?
?
可见,估计的截距项不变,而斜率项将为原回归系数的1/12。
例4、对没有截距项的一元回归模型Yi?
?
1Xi?
?
i称之为过原点回归。
试证明如果通过相应的样本回归模型可得到通常的的正规方程组?
e?
0?
eX?
0iii则可以得到?
1的两个不同的估计值:
~?
?
?
XY?
1?
,?
?
ii1?
?
X?
。
2i?
均为无偏估计量。
在基本假设E?
0下,?
1与?
1~~?
X通常不会经过均值点,但拟合线Y?
?
?
拟合线Y?
?
1X则相反。
1?
是?
的OLS估计量。
只有?
11解答:
由第一个正规方程~?
et?
0得或求解得~?
0~Y?
?
?
t1?
Xt?
1?
/~由第2个下规方程?
Xt?
X)?
0得/对于?
1?
/,求期望11~E?
E?
E[]n?
X1?
[E{1t)?
E]n?
?
1?
?
1这里用到了Xt的非随机性。
?
?
/,求期望?
)?
EEE?
E[Xt]tt2?
2?
XXtt112)?
?
XtE?
?
11?
t22?
XXtt?
?
?
必须等于。
但?
?
X通过点,?
?
?
?
要想拟合值Y111?
XYXt2tt,?
X上。
?
?
?
通常不等于。
这就意味着点不太可能位于直线Y1?
?
?
X经过点。
相反地,由于?
1?
,所以直线Y1OLS方法要求残差平方和最小MinRSS?
~~?
e2t?
X)?
?
?
0?
2?
?
0,,?
,,按如下步骤建立?
的一个估计量:
在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜?
,即?
的估计值。
率;最后对这些斜率取平均值,称之为?
?
的几何表示并推出代数表达式。
画出散点图,给出?
?
的期望值并对所做假设进行陈述。
这个估计值是有偏的还是无偏的?
解计算?
释理由。
证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。
解答:
散点图如下图所示。
首先计算每条直线的斜率并求平均斜率。
连接和的直线斜率为/。
由于共有n-1条这样的直线,因此1t?
nYt?
Y1?
?
?
]?
[n?
1t?
2Xt?
X1因为X非随机且E?
0,因此E[Yt?
Y1?
?
?
?
1]?
E[]?
?
?
E[t]?
?
Xt?
X1Xt?
X1Xt?
X1这意味着求和中的每一项都有期望值?
,所以平均值也会有同样的期望值,则表明是无偏的。
根据高斯-马尔可夫定理,只有?
的OLS估计量是最付佳线性无偏估计量,因此,?
的有效性不如?
的OLS估计量,所以较差。
这里得到的?
南昌航空大学经济管理学院学生实验报告实验课程名称:
统计学1未考虑异方差问题。
一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类。
A函数关系与相关关系B线性相关关系和非线性相关关系C正相关关系和负相关关系D简单相关关系和复杂相关关系、进行相关分析时的两个变量。
A都是随机变量B都不是随机变量C一个是随机变量,一个不是随机变量D随机的或非随机都可以?
3、参数?
的估计量?
具备有效性是指?
?
?
?
AVar=0BVar为最小C=0D为最小4、产量与单位产品成本之间的回归方程为?
i=356-1.5Xi,这说明A产量每增加一台,单位产品成本增加356元B产量每增加一台,单位产品成本减少1.5元C产量每增加一台,单位产品成本平均增加356元D产量每增加一台,单位产品成本平均减少1.5元?
?
?
表示估计值,则?
表示估计标准误差,Y5、对于Yi?
?
0?
?
1Xi?
ei,以?
。
AC?
)?
=0时,?
=0时,?
=0时,?
=0时,6、对于Yi=?
0?
?
1Xi+ei,以?
。
?
=0时,r=1B?
?
=0时,r=-1C?
?
=0时,r=0D?
?
=0时,r=1或r=-1A?
?
表示OLS估计回归值,则下列哪项成立。
A YC Y=Y D Y=?
=Y D Y?
=YC Yi,则样本回归直线通过点8、用OLS估计经典线性模型Yi=?
0?
?
1Xi+u?
)。
A B A B D ?
) C y?
?
?
?
x?
?
t01tt9、对回归模型进行统计检验时,通常假定?
t服从22?
?
iANBtCNDt?
=Y B Y?
=A Y?
表示回归估计值,y10、以y表示实际观测值,则普通最小二乘法估计参数的准则是使?
y2?
y?
y2?
y为最小11、下列各回归方程中,哪一个必定是错误的?
A.Yi=50+0.6XirXY=0.8B.Yi=-14+0.8XirXY=0.87C.Yi=15-1.2XirXY=0.8D.Yi=-18-5.3XirXY=-0.9612、已知某一直线回归方程的可决系数为0.81,则解释变量与被解释变量间的线性相关系数的绝对值为A.0.81B.0.90C.0.66D.0.3213、对于线性回归模型Yi=β0+β1Xi+μi,要使普通最小二乘估计量具备无偏性,则模型必须满足A.E=0B.Var=σ2C.Cov=0D.μi服从正态分布14、用一组有30个观测值的样本估计模型yt?
?
0?
?
1xt?
ut,在0.05的显著性水平下对?
1的显著性作t检验,则?
1显著地不等于零的条件是其统计量t大于At0.0Bt0.025Ct0.0Dt0.0215、某一特定的x水平上,总体y分布的离散度越大,即?
越大,则A预测区间越宽,精度越低B预测区间越宽,预测误差越小C预测区间越窄,精度越高D预测区间越窄,预测误差越大?
?
?
?
11)=E=?
2内涵指A.随机误差项的均值为零B.所有随机误差都有相同的方差C.两个随机误差互不相关D.误差项服从正态分布19、在古典假设成立的条件下用OLS方法估计线性回归模型参数,则参数估计量具有的统计性质。
A.有偏特性B.非线性特性C.最小方差特性D.非一致性特性0、关于可决系数R,以下说法中错误的是A.可决系数R的定义为被回归方程已经解释的变差与总变差之比2RB.?
?
0,1?
C.可决系数R反映了样本回归线对样本观测值拟合优劣程度的一种描述D.可决系数R的大小不受到回归模型中所包含的解释变量个数的影响二、多项选择题1、指出下列哪些现象是相关关系。
2222A家庭消费支出与收入B商品销售额与销售量、销售价格C物价水平与商品需求量D小麦高产与施肥量E学习成绩总分与各门课程分数2、一元线性回归模型Yi=?
0?
?
1Xi+ui的经典假设包括。
22E?
0cov?
0Cov?
0var?
?
u~NttsttttABCDEA 通过样本均值点 ?
表示OLS估计回归值,e表示残差,则回归直线满足。
B ?
Y=?
YiiA 通过样本均值点 ?
B ?
Y=?
Yii2?
)C ?
C ?
D ?
?
D =?
?
?
Xii4、表示OLS估计回归值,u表示随机误差项,e表示残差。
如果Y与X为线性相关关系,Ecov=0B Y=?
则下列哪些是正确的。
i1i i,ei)=0Ecov=?
0?
?
1Xi?
?
?
?
X?
e?
DY?
A Y=?
?
?
X?
i=0OLS1估计回归值,ii5、Y表示u表示随机误差项。
如果Y与X为线性相关关系,则下列哪些?
?
?
?
XB Yi=?
0?
?
1Xi+uiEE=?
01i是正确的。
?
?
?
?
X?
uC Yi=?
01iiA Yi=?
0?
?
1Xi?
?
?
?
X?
u?
=?
DYB Yi=?
0?
?
1Xi+uii01ii?
?
?
?
X?
=?
?
?
?
?
X?
uEYC Yi=?
i01i01ii?
?
?
?
XY?
=?
?
?
?
?
=DYu?
i01i?
i0?
?
1Xi估计出来的Yi值。
i6、由回归直线?
?
?
?
X?
=?
EYi01iB是一组平均值A是一组估计值C与实际值Y的离差之和等于零D可能等于实际值Y7、判定系数R2可表示为。
AR2=RSSESSRSSESSESSR2=R2=1-R2=1-R2=TSSBTSSCTSSDTSSEESS+RSSe8、线性回归模型的变通最小二乘估计的残差i满足。
A?
ei=0B?
eiYi=0C?
?
=0eiYiD?
eiXi=0Ecov=0三、判断题⒈随机误差项μi与残差项ei是一回事。
⒉对一元线性回归模型,假定误差项μi服从正态分布。
⒊线性回归模型意味着因变量和自变量线性相关。
⒋在线性回归模型中,解释变量是原因,被解释变量是结果。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 一元 线性 回归 分析 练习题