计量经济学重点笔记第三讲样本Word文件下载.docx
- 文档编号:14307155
- 上传时间:2022-10-21
- 格式:DOCX
- 页数:22
- 大小:360.16KB
计量经济学重点笔记第三讲样本Word文件下载.docx
《计量经济学重点笔记第三讲样本Word文件下载.docx》由会员分享,可在线阅读,更多相关《计量经济学重点笔记第三讲样本Word文件下载.docx(22页珍藏版)》请在冰豆网上搜索。
施加更多的假设而得到更强结论,这非常自然!
)。
笔记:
1、假设误差项服从正态分布的合理性在于,误差项是由很多因素构成的,当这些因素是独立同分布时,依照中心极限定理,那么这些因素之和应该近似服从正态分布。
当然,这并不意味着用正态分布来近似误差项的分布总是恰当的,例如,各因素或许并不同分布。
另外,如果y是价格这样的变量,那么假设误差项服从正态分布是不合理的,因为价格不可能是负数,不过我们能够进行变量变换,例如对价格取自然对数或者考察价格的变化率,那么经过变量变换之后,或许再假设误差项服从正态分布就变得合理了。
2、如果能够对误差项是否服从正态分布进行检验,那最好不过了。
一种常见的检验方法是Jarqe-Bera检验,这能够参见相关的教科书。
问题是,尽管我们能观察到解释变量、被解释变量的取值,然而,由于对参数的真实取值无法确定,因此误差是观测不到的,我们或许不得不利用残差来代替误差以进行相关的检验。
当然,一个前提是残差确实是对误差的良好近似,这进而要求,我们对参数的估计是合理的。
3、根据公式:
考虑x非随机这种简单情况,显然,当样本容量很大时,只要误差项是独立同分布的(并不需要要假定误差项服从正态分布),那么根据中心极限定理,应该近似服从正态分布。
当然,为了保证误差项的独立性,抽样的随机性十分关键。
二、利用标准正态分布作假设检验
假定是真实模型,当然我们并不知道各参数的真实值是多少。
如果某一经济经济理论预言,而现在你手中正掌握一样本,一个问题是,你所掌握的样本支持这个预言吗?
由于抽样误差的存在,恰好等于的概率很小。
然而,即使,我们也不能说理论被证实,因为计量经济学方法本质上是属于归纳法,而且由于其结论是基于某一样本而得到的,因此它还是属于不完全归纳,故,计量经济学不能证实经济学理论。
当然,计量经济学也不能推翻经济学理论。
经济学理论是逻辑推导,其正确与否需要从逻辑入手。
总而言之,我们能够说的是”样本是否支持某个理论的预言”或者”样本与某个理论的预言是否一致”。
在经典线性模型假定下,或者,其中,。
练习:
确定的分布。
现在,假设经济理论的预言是正确的,那么针对特定的样本你将得到标准正态分布图横坐标上的一个点:
。
现在来考察标准正态分布。
在该分布上,存在对称的两点:
与,其中:
如果把概率为5%的事件称为小概率事件,那么,当的取值大于或者小于时,我们认为小概率事件发生了!
小概率事件一般是不容易发生的,现在居然发生了,因此,我们应该怀疑上述经济理论所作出的预言。
举一个生活中的例子。
我预先认为某一个同学十分优秀。
优秀学生某一次考试考砸了非常正常,然而连续十次考试考砸了就应该是小概率事件了。
如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了,我是不是应该对我的先验判断产生怀疑?
当然,如果我就此认为那一个同学并不优秀,我也会犯错误,此即”第一类错误”,即”弃真”的错误。
但犯这个错误的概率是很小的。
如果优秀学生连续十次考试考砸了其概率是5%,那么我犯”第一类错误”的概率就是5%。
问题是,为什么我们取正态分布两端的区间作为小概率区间呢?
为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间?
从直觉上看,当这个假设为真时,即使估计值与完全相等不太可能,但估计值应该接近于。
然而我们也要注意到,正确估计还存在精确性问题,这经过统计量的标准差体现出来。
也就是说,在原假设为真时,即使估计值与有一定的差异,然而如果较大,那么在与间存在一定的可能是正常的。
不过总的来看,当原假设为真时,z统计量值是应该接近于0的,这要么是因为中的分子确实接近于0,要么是因为尽管与有一定的差异,但主要是由较大所引起的。
当z统计量值与0具有较大差异时,那么这个假设的真实性是值得怀疑的!
假设检验的正式步骤是:
(1)建立原假设与备择假设:
原假设与备择假设互斥;
假设体系应该是完备的,即原假设与备择假设两者之一必为真,但两者不能同时为真。
(2)确定小概率标准a。
经常我们把1%、5%或者10%作为小概率标准。
对a更加正式的称呼是”显著水平”。
(3)考察统计量值是否落在拒绝域:
之内。
如果落在上述区间之内,那么在a显著水平上,我们拒绝原假设,接受备择假设;
反之,我们不拒绝原假设,拒绝备择假设。
1、为什么当统计量值落在拒绝域之外时我们说”不拒绝原假设”而不是说”接受原假设”?
其解释是:
我们能够作出很多的原假设,例如或者而我们所计算出来的一些统计量值恰好都落在之外,难道我们既接受也接受?
显然更恰当的表示方式是,即不拒绝也不拒绝。
2、”接受原假设”没有留有余地,而”不拒绝原假设”表明我们的结论是留有余地的,即,在另外的原假设下也可能不拒绝。
”接受备择假设”留有余地吗?
应该注意到,备择假设是,因此,即使说”接受备择假设”,这也是留有余地的。
3、设定1%、5%或者10%为显著水平显得有点随意,为何不设2%、6%、7%等为显著水平呢?
是否能够依据一个更一般的标准来进行假设检验?
答案是肯定的,我们能够依据一个更一般的标准来进行假设检验!
既然我们已经计算出统计量值,如果z为正,那么根据正态分布表,我们就能够确定的值(如果z值为负,那么我们能够确定的值),我们一般把这个概率值称为伴随概率,简写为P或者Prob.这个概率值很有用处!
例如,假定P值是0.062,那么,显然,以任何小于6.2%的概率为小概率标准,我们并不拒绝原假设;
以任何大于6.2%的概率为小概率标准,我们拒绝原假设。
4、一个总结:
在进行双尾检验时,当P小于给定的显著水平时,那么在给定的显著水平下应该拒绝原假设;
反之,则不拒绝原假设。
上述检验都属于双尾检验,即是拒绝域。
如果假设体系是:
那么在显著水平a下,拒绝域应该是,我们进行的是单侧(尾)检验。
为了理解上述单侧检验,我们回答如下几个问题:
问题一:
为什么拒绝域是?
答案:
当原假设为真时,那么应该在0左右不远处;
当备择假设为真时,在真实参数左右不远处。
因此,只要真实参数远大于,则远大于0是非常可能的,而在这种情况下Z远小于0则不太可能的。
因此,我们把拒绝域设定为。
当Z值落在该区间内时,我们拒绝原假设,接受被择假设。
问题二:
为什么不是拒绝域?
当Z值落在该区间内时如果我们拒绝了原假设,则我们更应该拒绝被择假设。
因为当备择假设为真时,Z值落在该区间内的概率更小。
基于假设体系的完备性,故我们不把设定为拒绝域。
问题三:
设置这样的假设体系有何依据?
这依赖于先验的理论与判断。
例如,假定是某正常商品的消费收入弹性,那么不可能为负,则我们能够经过建立如下的假设体系:
并基于样原来判断是否为真。
问题四:
单侧检验与双侧检验相比有何特点?
从假设体系的形式来看,单侧检验与双侧检验明显不同。
但最关键的不同在于,给定显著水平a(犯”第一类错误”的概率),上述单侧检验的拒绝域与双侧检验右端拒绝域相比更宽,因此更容易拒绝原假设,从而犯”第二类错误”(取误)的概率更低。
1、一个检验如果犯”第二类错误”(取误)的概率更低,则称该检验具有更高的检验势。
在检验中提高检验的势一般来说是相当重要的。
如果检验势较低则很容易”取误”,而科学精神要求我们不要轻易相信某一个确定性的判断!
2、从本质上看,单侧检验之因此比双侧检验具有更高的检验势,其原因在于,在建立单侧检验时我们预先接受了有关理论的指导,从而掌握了更多的信息,故在检验时我们能够做到更精细,不会轻易”上当”(取误)。
3、事物往往都具有两面性。
尽管单侧检验比双侧检验具有更高的检验势,但要注意,它依赖于先验理论指导的正确性。
如果先验理论指导是错误的,那么我们的”挑剔”很可能是”过度”的,即我们”弃真”的概率非常大。
尽管名义上的”弃真”概率是a,但实际上的”弃真”概率超过了a,这被称为显著水平扭曲。
4、如果显著水平不扭曲,则给定显著水平,一个检验的检验势越高越好。
不幸的是,在显著水平不扭曲的情况下,一个检验的”弃真”概率与”取误”概率其走向一般相反:
如果设定较低的显著水平以降低”弃真”的概率,则拒绝域变窄,故”取误”概率增加,反之则相反。
问题是我们如何取舍?
本质上这涉及到比较”弃真”与”取误”所造成后果的严重性。
假设现在要检验一种新药是否有效果,如果有效果则推广使用。
现在的原假设是没有效果,备择假设是有效果。
考虑到假药的危害,则”弃真”所带来的后果非常严重,而”取误”所造成后果相对不严重。
因此我们应该保守一点,设定更低的显著水平,以降低”弃真”的概率。
思考题:
在假设体系:
下,计量软件包计算出为正的统计量值z,而且P值为0.120(注:
计量软件包默认的P值是双尾的概率,当z为正时,它计算的是)。
问:
在假设体系
下,以10%为显著水平,我们是否拒绝原假设?
三、t检验
虽然在经典线性模型假定下:
然而,在之中,经常是未知的,需要我们估计。
在第二讲时,我们已知道,在高斯马尔可夫假定下,是正确一个无偏估计。
我们记,(注:
thestandarderror,se;
thestandarddeviation,sd)。
能够证明,服从t(N-2)分布。
证明:
在经典线性模型假定下有:
化简可得:
1、关于随机变量概率分布的知识点见本讲附录1。
2、在经典线性模型假定下可证明
具体可参见一些较为高级的教科书。
另外,根据附录1的知识点,一个服从卡方分布的随机变量其期望值等于自由度,故。
实际上在第二讲我们已经表明,这验证了该知识点。
3、,如果残差是对误差的良好近似,则也服从卡方分布还是比较好理解的。
由于残差自由度是N-k-1,因此所服从的卡方分布其自由度为N-k-1。
接下来,检验步骤和应该注意的细节就和第二小节没有差异了,除了所利用的是t分布而不是标准正态分布。
随着自由度趋于无穷大,t分布渐进于与标准正态分布,见附录1知识点4。
事实上,当自由度趋于无穷大时,在概率上收敛于(前者是对后者的一致估计),因此,随着自由度趋于无穷大,渐进服从于标准正态分布。
前面我们讨论的是简单线性回归模型。
事实上相关结论与检验完全能够被推广到多元线性回归模型:
在该模型下,
思考题:
一样本其容量为30,建立回归模型:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 重点 笔记 第三 样本
![提示](https://static.bdocx.com/images/bang_tan.gif)