6回归模型的假设检验附Word文档格式.docx
- 文档编号:13994034
- 上传时间:2022-10-16
- 格式:DOCX
- 页数:12
- 大小:225.23KB
6回归模型的假设检验附Word文档格式.docx
《6回归模型的假设检验附Word文档格式.docx》由会员分享,可在线阅读,更多相关《6回归模型的假设检验附Word文档格式.docx(12页珍藏版)》请在冰豆网上搜索。
一元回归时,在的正态性假定下,OLS估计量本身就是正态分布的,其均值和方差已随之列出。
以为例
--
(2)的方差
这是一个标准化正态变量。
因此,如果知道真实的总体方差已知,就可以利用正态分布对作概率性表达。
当已知时,以为均值,为方差的正态变量有一个重要性质,就是之间的面积约占68%,95%,99%。
但是很少能知道,在现实中用无偏估计量来确定。
用代替,
(2)可以改写为
(3)
这样定义的t变量遵循自由度为n-2的t分布。
用t分布来建立的置信区间
(4)
t是(3)给出的值,而由显著水平为a/2和自由度为n-2的t分布给出的临界值。
(3)带入(4),得
(5)
重新整理
(6)
(6)给出的是的一个100的置信区间,在整理
(7)
假设通过回归分析求得,并且自由度=8。
若求,也就是取95%的置信系数,查找t分布表=2.306。
可证实的95%的置信区间为:
(8)
再整理
对这个置信区间的解释是:
给定置信系数为95%,从长远看,在类似于(0.4268,0.5194)的每100个区间中,将有95个包含着真实的值。
但不能说95%的概率包含着真实的,因为这区间已经是固定的,不是随机的。
要么落入其中要么落在其外,因此概率是不是1就是0。
3,假设检验
假设检验就是,某一给定的观测或发现是否与某声称的假设相符?
(1),置信区间的方法
利用上面的消费函数。
,某人称
原假设
备择(替代)假设--双侧假设
所观测的是否与相符?
为了回答此问题,引用(8)的置信区间。
从长远看,在类似于(0.4268,0.5194)的每100个区间中,将有95个包含着真实的值。
决策法则:
构造一个的100(1-a)%的置信区间。
如果在假设的下落如此区间,就不要拒绝。
如果他落在在此区间之外就要拒绝。
遵照此规则,,显然落在上面的置信区间之外,因此能以95%的置信度拒绝MPC的真值是0.3的假设。
即使原假设是正确的,我们得到一个大到0.509的MPC值,最多也只有5%的机会,这是一个小概率。
在统计学中,当我们拒绝原假设时,我们说统计上显著的。
反之不显著。
(2),显著性检验法
显著性检验法是利用样本结果,来证实一个原假设的真伪的一种检验程序。
根据手中算出的统计量的值决定是否接受原假设。
(9)
其中是在下的的值。
遵循自由度为n-2的t分布。
如果原假设下的真值被设定,则容易的算出t值。
因此这个t变量就可作为一个统计量。
置信区间为
(10)
(10)再整理得
(11)
此式给出在给定时,以概率1-a的落入其中的区间。
(11)中的置信区间叫做接受域,而置信区间以外的区域叫做拒绝域。
比较(6)和(11)就能看清假设检验的置信区间法和显著性检验之间的密切关系。
在置信区间程序中,我们试图建立一个某种概率包含有真实但未知的的一个范围或区间,而在显著性检验步骤中,我们假设为某值,然后来看所计算的是否位于该假设值周围的某个致信范围之内。
再回到消费函数。
,并且自由度=8。
若令,
由(11)
下图所示,因预测的落在临界域中,故拒绝真实的原假设。
在原假设下的95%置信区间
在现实中,不需要估计(11),按(10)计算t值,然后看他是落在两个t临界值之间还是之外,用例子算
t值清楚地落在图的临界域内,拒绝。
如果一个统计量的值落在临界域内这个统计量是统计上是显著的,这时我们拒绝原假设。
一、t值
t值是用来检验根据OLS估计出来的回归系数是否显著的统计量。
回归系数在统计学上如果被判断不为零,就是显著的。
如果回归系数是不显著的(回归系数=0),则意味着解释变量对被解释变量没有任何影响,该变量在模型中没有存在的必要。
(一),一元回归模型
模型:
设有OLS估计出的分别为。
步骤1:
估计残差方差(残差的无偏方差)
的正平方根,称做回归方程的标准误差。
步骤2:
估计的方差
方差表示的是相应的离散程度。
步骤3:
计算回归系数的标准误差
现在假设为真正的回归系数,他们与估计的回归系数之间的误差,即,超过的概率在5%一下,超过的可能性非常小。
步骤4:
计算t值
步骤5:
对估计出来的回归系数进行显著性检验(t检验)
t检验有双侧检验与单侧检验两种,说明双侧检验。
首先,建立原假设与备择假设。
原假设
备择(替代)假设
计量经济分析中通常希望通过放弃原假设,支持备择假设来进行假设检验。
假设检验在原假设被拒绝时有意义,而且为拒绝原假设而进行假设检验。
由步骤4计算出来的t值服从自由度n-2,因此,可以根据t分布表进行显著性检验。
计算出来的t值的绝对值大于t分布表中找到的t值,则放弃原假设,估计的回归系数显著。
这时,显著性水平一般采用5%,其次采取1%。
显著性水平即拒绝原假设的情况下,仍认为接受原假设的概率,分析者出现错误判断的概率。
放弃表示的是,如果原假设为正确地话,在5%,1%的概率下所发生的稀奇的事发生,说明原假设不能信赖。
样本数如果达到一定程度(),即自由度28以上,t值只要大于2.0,计量经济学家就习惯于将回归系数判定为显著。
但是样本数很少,即使判定之在2.0以上,也不要使用这一规则。
*在单侧检验中,符号条件既定时备择假设为。
(二),多元回归
求估计值
估计残差方差
估计回归系数的方差
标准误差
,,
显著性检验
例题1:
根据一元回归模型的结果,回答以下问题。
括号中的数值是t值。
(7.751)(20.166)
1,按5%的显著性水平,对回归系数进行显著性检验。
2,求和的95%的置信区间。
解答:
(1),T检验的自由度为。
根据t分布表,双侧检验中显著性水平为5%,自由度为10的判定值为2.228。
因此,
原假设被放弃,估计的回归系数在5%水平上显著。
(2),设的估计值为,标准误差为,的95%的置信区间为:
(t分布表双侧检验中5%显著性水平上自由度n-2的判定值)
因此,的95%的置信区间为
14.1072.2281.863=(9.956,18.258)
的95%的置信区间为
1.2242.2280.061=(1.088,1.360)
这就是说,分析者对于处于9.956~18.258之间,处于1.088~1.360之间的事,具有95%的把握。
例题2:
1,对进出口函数的回归系数进行OLS估计,这里。
2,计算决定系数
3,计算残差方差和回归方差的标准误差。
4,计算回归系数的标准误差
5,计算t值,并在1%的水平下,对回归系数进行显著性检验。
1,
因此,新加坡的进出口函数为
边际进口倾向为2.81513,即每一单位GDP的增加,相应的有2.8单位进口额的增加。
由此可见,先加坡经济的特征之一是贸易依存度极高。
2,决定系数
估计出的进出口函数的拟合度非常良好。
3,求残差方差
4,计算回归系数的方差和标准误差
5,求t值
T检验的自由度为
为双侧检验,另一方面由于存在这一符号条件,为单侧检验。
放弃原假设()估计出来的回归系数在1%水平上显著。
二,F值
T检验用于单个回归系数的显著性,而F值是在多元回归中对多个回归系数进行综合检验(F检验)时采用的。
F检验也称为决定系数或重相关系数R的显著性检验。
建立原假设和备择假设
原假设:
常数项以外的所有的回归系数为零
备择假设:
不成立
原假设被放弃,可以判断解释变量的全部或部分对被解释变量有影响。
但是,哪一个解释变量是有效的还无法判定。
计算F值
计算出来的F值,服从自由度(分子,分母)=的F分布。
计算出的F值大于判定值,放弃原假设,结果为显著。
在F分布表中,横向为分子,纵向为分母。
例题:
有10个家庭的月均储蓄Y,月收入X1,家庭人数X2的数据,用多元回归模型进行OLS估计得出。
求F值,并对估计出的回归系数的显著性进行综合检验,显著性水平设为1%。
根据分布表,1%显著性水平F自由度(分子,分母)=的F检验的判定值F0=9.55,估计出来的F值大于临界值,因此放弃原假设,可见解释变量全部或部分对Y有影响。
三,结构变化的F检验
结构变化的F检验,也成为Chowtest,用于调查,检验经济分析中一个极其重要的问题,即“是否存在结构变化”。
在利用时间序列所做的回归分析中,找出估算期间内发生结构变化的时点(分界点),以此时点为标准,将期间分为前期和后期。
对前期,后期,全部期间进行回归分析,求各自的残差平方和。
根据结构变化的F检验公式,计算F值。
前期的残差平方和前期的样本数
后期的残差平房和后期的样本数
全部期间的残差平方和解释变量的数
(1),的情形。
结构变化的F检验为
(2),的情形(以及
步骤4:
利用F分布表,对步骤3计算出的F值进行检验。
在检验时,分别就上述
(1)的情形中,自由度(分子,分母)=,
(2)的情形中,自由度进行F检验。
如果计算出的F值大于F分布表中的判定值,放弃“前期的回归系数与后期的回归系数完全相等”的假设,说明出现了结构性变化。
相反,如果计算出的F值小于F分布表中的判定值,不放弃“前期的回归系数与后期的回归系数完全相等”的假设,说明没有发生结构性变化。
四,预测
利用估算出来的回归模型,说明预测置信区间的计算方法。
预测置信区间,指的是被解释变量Y的预测值,在某个概率(例如95%)下取值的上限与下限范围。
回归分析一元回归模型
在这个步骤中,将s(回归方程式的标准误差),n,计算出来。
代入步骤1的回归模型中,计算(预测值)。
这一工作称为点预测。
决定预测的信赖度A%。
通常设信赖度95%或99%。
根据t分布表,查找自由度为n-2,显著性水平(双侧)为(100—A)%的t值。
将上述个步骤中计算出来的数值代入预测置信区间的计算公式。
离越远,置信区间的幅度越大(预测的准确性也就越低)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 模型 假设检验