空间统计及计量方法学习笔记.docx
- 文档编号:24820683
- 上传时间:2023-06-01
- 格式:DOCX
- 页数:20
- 大小:104.98KB
空间统计及计量方法学习笔记.docx
《空间统计及计量方法学习笔记.docx》由会员分享,可在线阅读,更多相关《空间统计及计量方法学习笔记.docx(20页珍藏版)》请在冰豆网上搜索。
空间统计及计量方法学习笔记
空间统计及计量方法学习笔记
1.背景及文献综述2
2.空间效应5
2.1.空间相关性:
5
22空间异质性6
3.空间自相关性分析6
3.1.空间权重矩阵7
32空间自相关性检验8
4.空间计量经济模型的建立14
4.1.空间横截面数据模型14
4.1.1.空间自回归模型(SLM15
4.1.2.空间误差模型(SEM16
4.1.3.变系数地理加权回归模型(GWR18
4.2.空间面板数据模型19
4.2.1.空间回归面板计量模型19
4.2.2.空间误差面板计量模型20
5.学习总结21
1.背景及文献综述
空间计量经济学是在基于对空间效应恰当设定的基础上,对于空间经济计量模型进行一系列的设定、估计、检验与预测的计量经济学方法。
空间计量经济学由美国经济学家Paelinek和Klaassen首次提出,他们认为空间计量经济学的研究领域主要包括:
-计量模型中的空间相关性问题
-空间关系的非对称性问题
-空间距离解释因子问题
-事前事后联系的差异问题
-空间建模问题
空间计量经济学着重处理计量经济学模型中由于变量的空间特性而导致的一些特殊问题,例如当模型设定中存在空间相关性问题,就会违反经典的Markov-Gausse变量之间相互独立的假设,从而导致传统的计量经济学估计方法与检验方法失效。
这就要求发展新的空间计量经济模型设定、估计与检验方法,以使计量经济模型可以有效地处理空间效应问题。
近年来空间统计分析技术已经在广泛的领域内得到应用,国外学者已将空间
统计分析方法和理念广泛运用到经济学研究。
例如Chakrabarti1(2003)运用空间
统计和空间计量的工具对FDI的空间分布进行了理论分析,为我国学者之后研究对外贸易的空间集聚效应提供了参考;Ping2等(2004)利用全局和局部的自相
关统计方法对棉花产量的空间相关性及其模式变化进行了研究;Gallo和Ertur
(2005)对1980-1995年期间对138个欧洲地区人均GDP勺时空动态变化进行了
研究,认为存在全局和局部空间自相关,地区分布具有空间异质性和不均等性;Cabrer-Borras4等(2007)分析了西班牙地区的创新空间模式、地区的相互依赖性
及其演进,发现当地能力、空间创新溢出都与当地的创新有关。
与国外学者相比,国内学者将空间统计及计量的方法应用到经济研究还为数不多。
胡健(2012)5就空间计量经济学理论体系进行了总结,重点对空间计量经济模型的设立包括空间横截面数据模型、空间面板数据模型以及空间离散数据模型进行讨论,并给出对模型参数估计方法如,最大似然估计法,两阶段最小二乘法和矩估计法等进行分析,并提出使用Moran'sI及LM/RS对模型进行检验,
最后展望了该理论研究未来的发展趋势。
但文章中对于空间面板数据模型介绍简略,并且也没有给出相应的参数估计及模型检验方法。
李刚(2009)6使用空间统计分析方法,对2007年美国次贷危机和1997年东南亚金融危机的空间集聚性和传染路径进行了实证分析,主要采用空间回归面板
模型及Moranl'指数检验发现,客观的地缘关系是金融危机传染路径,政治经济条件过去不是金融危机的传染路径,而目前在金融危机中所担任的角色也越来越明显;贸易关系和资本项目也是金融危机传染的重要路径。
但对于在传染路径不
只一个时,究竟哪一条传染路径是最重要的以及各种传染路径之间的关系还有待研究。
杜小娟(2010)7、白晶(2010)8利用空间统计的知识,通过Moran'指数及LISA的检验,分析了地区区域经济间的相关性,但都没有建立空间计量模型进行影响因素间的分析
张锦宗(2009)9利用基于时间序列的历史数据采用改进了的BP网络,以地市行政区域为研究单元,对山东省未来人口进行预测,然后通过Moran'指数进行全局及局部自相关检验,对未来人口空间分布模式进行预测分析。
文骁飞(2011)10提出将空间统计分析技术与GIS应用于区域经济分析,可以揭示区域经济发展的空间自相关和空间集聚特征,但仅应用了Moran全局及局
部检验,没有引入空间计量模型的建立。
吴拥政(2009)11在传统同一空间尺度实证研究的基础上,使用空间面板数
据模型,在空间与时间整合的维度上揭示金融发展与经济增长的关系,探索经济
金融活动的空间自相关性与空间集群性。
结果表明:
中部六省的金融发展与经济
增长的空间依赖关系是统计显著的,并为深入进行整合时空特征的区域金融与经济增长关系的统计与计量建模分析提供了有利的证据支持。
魏浩(2011)12利用空间统计分析和空间计量分析方法,对我国部分省区市
对外贸易的空间集聚效应及其影响因素进行了实证分析。
首先运用空间统计分析
Moran'sI指数对中国1978-2007年间各省份对外贸易的空间相关性进行分析,形象地揭示出改革开放以来我国各省份对外贸易的地区分布情况,然后分别运用
SAR和SEM5种空间计量分析方法研究了影响我国各地区对外贸易发展的因素及其空间影响效应。
1314
张红历(2010)、任家强(2010)通过使用Moran'sI指数对所选数据所进行的全局及局域自相关检验,分别对对1998-2007年间西部12省市64个主要地级市和2008年辽宁省44个县城的经济增长水平的差异,空间分布特征及其演变进行了分析,通过研究各样本经济增长的空间相关性和空间异质性特征有了深入认识,揭示地区政策实施后区域经济空间联系的结构和演变。
田成诗(2012)15采用Moran散点图和LISA散点图对我国省域商品房价格进行了分析,得出我国省域商品房价格具有空间溢出效应,存在显著的空间自相关,表现出空间集聚特征
2.空间效应
空间计量经济学与传统计量经济学的最大区别就是引入了空间效应,
Anselin将空间效应区分为空间相关性和空间异质性
2.1.空间相关性:
空间相关性是指空间中各变量之间存在相互影响。
空间相关性可能会由多种
因素引起,例如,空间样本的简单线性化、空间样本的简单归并、空间外部性以及空间溢出效应等。
空间相关性可以用数学公式表示为:
yi=f(yj),(j=1,2,...,n,j=i)
空间相关性主要表现在两个方面:
-空间实质相关性:
由于空间外部性、邻近效应等因素造成的计量模型中解释
变量的空间相关性。
处理及方法:
需要在模型的设定方法上做相应改进。
可以用空间自回归模型
分析
-空间扰动相关性:
由于忽视了一定的空间影响,例如存在空间影响的区域没
有被考虑在模型中,造成的模型残差存在空间相关性。
处理及方法:
在不考虑空间结构的情况下,可以运用传统的处理异方差性、
样本截面相关性等问题的方法进行解决;当需要考虑空间结构时,就要对相
应的空间相关性进行特殊处理。
对于空间结构进行处理存在的困难是,如何
正确判定空间结构的存在形式,并且正确的设定模型。
可以用空间误差模型
分析
22空间异质性
空间异质性主要是指空间中各变量由于所处的区位位置不同而存在的差异性。
在区域分析中,中心-外围效应等因素的存在导致了空间异质性的产生。
空间差异性可以用模型表示为:
yj=Xi+i
空间差异性主要反映在参数-i之上,当存在空间差异性时,参数1i在个空间单元上有所变异,而若J对所有空间单元都相等时,则个空间体之间便不存在空间差异性。
在空间计量经济模型中,空间异质性主要反映在模型结构性的差异上,它可以用传统计量经济学的基本方法进行处理,例如面板数据模型的变系数方法、随机系数方法以及系数扩展方法等,也可以直接通过面板数据模型的方差协方差矩阵来处理空间异质性的问题。
在处理空间异质性时,主要存在的问题是空间计量经济模型结构性差异可能由于空间相关性引起,也可能是由于空间异质性引起,而现有的技术对于区分这两种空间效应仍然显得十分不足。
3.空间自相关性分析
根据空间统计和空间计量经济学原理方法,进行空间分析的思路是:
首先采
用空间统计分析指数检验变量间是否存在空间自相关性,如果存在,则需要在空间计量经济学理论方法支持下,将空间影响纳入其中,建立空间计量经济模型,进行空间计量估计和检验。
所以进行空间分析的主要任务是对变量间空间自相关存在性的检验,如何确
定空间自相关性的存在的标准步骤是:
空间权重矩阵的构建
空间自相关程度的测度
空间自相关的检验
3.1.空间权重矩阵
空间权重矩阵W=(Vj)nxn主要用于表达空间的相互依赖性,它是外生信息。
W中对角线上的元素被设定为0,而W()表示区域i和区域j空间上的紧
密程度,为了减少或者消除区域间的外生影响,权重矩阵在进行其他运算前通常被标准化,矩阵W勺行和为1,标准化意味着每一个矩阵元素仅仅表示邻接空间的加权平均数。
空间权重矩阵W由多种选择的方法,一般可将现实的地理空间关联或者经济联系考虑到模型中来。
最主要的方式有以下两种:
邻近指标和距离指标。
具体方法解释如下:
(1)基于邻近概念的空间权重矩阵
这种方法采用邻接标准,其目的是定义空间对象的邻接关系。
一般相邻标准的W为
基于邻近概念的空间权重矩阵又有一阶邻近矩阵和高阶邻近矩阵之分
⑵基于距离概念的空间权重矩阵
这种方法采用距离标准,一般基于距离标准的W为
这种方法实质上是假定空间相互作用的强度与区域距离之间关系密切,这种方法简单方便,实践中经常使用。
这种方法的关键是要预先设定一个门槛距离,若在门槛距离之内,则认为区域之间存在关联,若超过门槛距离,则区域间的没有相互作用。
(3)基于经济社会现象的空间权重矩阵
在基于距离概念的空间权重矩阵中,除了使用真实的地理距离计算外,还包括经济和社会因素的更为复杂的权重矩阵设定方法。
经济距离矩阵的设定需满足有意义、有限性和非负性三大条件。
经济距离矩阵可以依据区域间交通网密度、贸易流动量、通讯量等设定。
32空间自相关性检验
将空间效应考虑进来以后,在建立计量模型进行分析研究之前,我们必须先
进行空间相关性的检验,为后面分析采用空间经济计量方法做好准备。
在计算和检验区域经济空间相关存在性时,空间统计学较常使用到两个类似
于相关系数的统计量:
Moran(1950)提出的空间相关指数Moran'l和Geary(1954)
所定义的Gearyco尽管任一统计指标都能基本上获得空间自相关的特征,而且在许多分析中两者大致上可以相互替代,但与Gearyc相比,Moran'l不易受偏
离正态分布的影响,因此在大多数应用中,Moran'l更为常用。
Moran'l在功用
上大致可以分为两大类:
全域空间自相关Moran'l和局域空间自相关Moran'l
(1)全域空间自相关Moran'l指数
全域空间自相关是从区域空间的整体上刻画区域经济活动分布的集群状况,
Cliff和Ord(1981)给出的全局空间自相关度量指标为:
式中:
•,Y空间第i单元的属性值,wf(i,j=1,2,…,n)是空间
权重矩阵W的元素,空间权重矩阵可以基于以上所说的三种标准进行构建。
Moran'l系数反映出孔内的区域单元的属性值的相关程度。
与相关系数一样,
Moran'l系数的取值区间为-1,1。
符号代表着相似程度的方向性,而绝对值大小意味着关联的强弱性。
通常认为两个空间单元的距离越近,他们之间的关联性越强,表现为属性值的正相关或负相关。
正相关和负相关可通过空间相关系数Moran'l散点图的方式坐标图在四大象限呈现。
Moran散点图的四个象限分别对应区域单元与其邻居之间四种类型的局部空间联系形式,第一、三象限代表正的空间联系,第二、四象限代表负的空间联系。
其中第一象限代表了高观测值的区域单元为同是高值的区域所包围的空间联系形式(高-高);第二象限代表了低观测值的区域单元为高值的区域所包围的空间联系形式(低-高);第三象限代表了低观测值的区域单元为同是低值的区域所包围的空间联系形式(低-低);第四象限代表了高观测值的区域单元为低值的区域所包围的空间联系形式(高-低)。
与局部Moran指数相比,其重要的优势在于能
够进一步具体区分区域单元和其邻居之间属于高值和高值、高值和低值、低值和
低值、低值和高值之中的哪种空间联系形式。
并且对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。
对于Moran'l指数的计算结果,可以分析采用渐进正态分布和随机分布两种
假设进行检验,以评价区域间是否存在空间自相关关系。
检验的标准化形式为:
Moran/IE/
根据地理空间数据的分布情况,可以计算出在正态假设条件下,全域空间自
相关Moran'l指数的期望值En(I)、方差Var(I)分别为:
在随机假设条件下,Moran'l的期望值Er(I)、VarR(l)分别为:
分别为空间权重矩阵中i行和j列之
和
聃n
用m=j》工【(叫+⑷J
t=i;=i
(2)局域空间自相关Moran'l指数
全域空间自相关指数呈现的只是区域空间整体上经济活动分布的集群状况,
而对存在于全域地理范围内不同区域的空间关联模式却无能为力,因此全域空间
自相关Moran'l指数在有些条件难以反映局部区域的情况,有时甚至“颠倒”区
域空间关联的正确模式,因此我们还需要新的指标去揭示局部区域之间空间关联模式的证据,此时通常采用局域空间关联指标来分析空间关联的局域特性。
局域空间自相关Moran'l指数作为空间探索技术的重要组成部分,其功能如下:
其一为每个观测单元周围的局部空间集聚状况作显著性评估;其二可以揭示出对全局联系影响大的样本单元以及不同的空间联系形式。
根据Anselin(1995)的定义,一般而言,局域空间自相关指标需要满足两个条件:
每个区域空间观测单元的空间关联局域指标描述了围绕该区域单元显著的相似值空间单元之间空间集群程度;所有空间单元的空间关联局域指标之和与对应的全域空间关联指标成比例。
在满足了以上两个条件前提下,区域局域空间自相关Moran'l指数的计算公式可以定义为:
Z(d)二
其中符号含义与全局Moran'l指数相同,因局部Moran'l指数由全局指数各
分量的n倍定义,取值可以超出一1与1间的范围。
该指标形成的正态分布统计量表明相邻单元值的彼此关联情况,可以揭示空间聚集的重要关联点。
故局域空间自相关Moran'l指数是区域空间单元与其相邻近观测单元观测值加权平均的乘积。
正的Moran'l值表示该区域单元周围相似值的空间集群,负的Moran'l
值表示非相似值之间的空间集群。
对于局域空间自相关Moran'l指数的计算结果,我们同样可以采用标准化形式对局部空间相关性进行检验:
…Moren/IEL
(3)LISA
若Moran散点图没有给出显著性水平的指标,因此需要计算LISA,来进一步探究这些空间分析的结果
LISA可以揭示某一区域单元的属性值与其空间邻近区域单元属性值之间的
相似性或相关性,识别空间集聚和空间孤立,探测空间异质等,LISA包括局部
Moran'指数和局部Geary指数
4.空间计量经济模型的建立
目前虽然理论上都可以通过空间计量经济学的建模方法对空间效应进行理
论分析,但一方面从计量经济学处理的难易程度考虑,不是所有的模型都适合将
空间效应直接引入;另一方面,由于在部分模型中,其原有的设定形式已经反映了经济变量的空间结构,所以不需要再进行特别的建模处理。
目前主流的空间计量经济模型包括空间横截面数据模型、空间面板数据模型和离散数据的空间计量模型,其他的模型姓社,诸如空间动态模型、空间非线性模型等,其模型估计方法和检验方法正在发展过程中。
4.1.空间横截面数据模型
在空间横截面数据模型中,空间相关性可以通过两种方法处理,一是在回归模型中引入空间滞后相关变量;二是在回归模型中加入残差结构特殊形式。
空间相关性被处理成空间滞后变量形式就会形成空间滞后模型,适于测度空间互动关系的存在性及强度;空间相关性被处理成回归误差项就称为空间误差模型,适于处理空间自回归的偏差影响
4.1.1.空间自回归模型(SLM
空间自回归模型主要是探讨各变量在区域内是否存在扩散现象。
它以空间自
回归依赖变量外加外生变量的形式构成,其模型表达式为:
y=W■X-■■-
式中:
y为因变量;X为nk的外生解释变量矩阵;「为空间自回归系数,反映了样本观测值中的空间依赖作用,即相邻区域的观测值W对本地区观测值y的影响方向和程度,W为空间权重矩阵,参数1反映了自变量X对因变量y的影响。
这种建模方法表明当经济变量存在空间相关性时,仅仅考虑其自身的解释变
量X不足以很好的估计和预测该变量的变化趋势。
例如一个区域的技术创新能力
不仅受自身技术投入水平的影响,还会受到邻近区域溢出水平的影响,因此测度该区域技术创新能力时,必须加入表示空间滞后的变量wyo
空间自回归变量W是一内生变量,空间自回归项W与干扰项;相关,甚至当;是零均值误差也如此,这可以从方程的简化式中看出:
y=1(1I%*忑[十|(1|■('IV}ITCH)(
鉴于空间自回归模型中W的内生性,因此模型估计若采用最小二乘法(OLS,系数估计值必将有偏或者无效。
所以一般常用Anseiin(1988)提议的极大似然估计法来估计空间自回归模型的参数。
其过程如下:
(1)对模型y=X:
o■;o作OLS古计,求出I;
(2)对模型W=X丄作OLS古计,求出山r「;
(3)分别计算上述两个OLS古计的残差eo=y-〔Ji和eL=
w)
(4)由e。
和eL值,通过对数极大似然函数Lc得到参数的估计值
(5)空间自回归模型的最大对数似然函数为:
InL=I/V/2ln(2町IN/2lnar2+ln\lI"(IrW\I)(YIWYIX'(!
r)'(FI(WYIXQ
4.12空间误差模型(SEM
当误差项遵循一个空间自回归过程,即每个位置上的随机误差为所有其他位置上的随机误差的函数,我们可以利用空间误差模型探讨邻近地区关于因变量的误差冲击对本地区观察值的影响程度。
Cliff(1971)认为误差项之间的空间自
回归可能意味着:
自变量和因变量之间存在着非线性关系;回归模型中遗漏了一个或多个回归自变量;回归模型应该由于一个自回归结构。
空间误差模型的表达式如下:
式中:
符号表示自回归参数,W是空间权重矩阵,假定…为标准正态分布的
随机误差向量。
这个模型结合了一个标准回归模型和一个误差项中的空间自回
归模型,同时假设误差项…满足条件乜工「疋、心叭宀-厅“,即方差固定
且误差项是不相关的。
由于误差项的均值为0,不管的数值如何,因变量y的均值不受空间误差相关的影响。
由上述公式可得:
,因此:
即:
可以看出,空间误差模型就转化为含有外生空间滞后变量「〔的空间滞后模型,一般把•…成为空间之后权重矩阵。
对于空间误差模型,Anselin(1988)16同样建议采用极大似然估计空间误差模型(SEM)的参数,其估计过程如下:
卩
(1)对模型y作OLS估计,得到的无偏估计量I;
(2)计算OLS估计的残差为11'1I;
卩
(3)由e值,通过对数极大似然函数Lc得到参数的估计值,;
(4)空间误差模型的最大对数似然函数为:
InL=LV/2ln(2jr)INf2lrurT2+ln[II"('W]I1/(2^2)(YIX"(')#(J1IJTQ(JI
由l值和空间误差模型的最大对数似然函数计算其余参数的估计值,
在具体运用空间模型的过程中,究竟选择空间误差模型还是选择空间回归模型,要在测试、诊断的过程中,逐步确定。
AnselinheFlorax(1995)提出了如下
的判别准则:
首先,运用OLS方法对模型进行回归,并进行相应拉格朗日检验。
如果空间回归模型和空间误差模型都不显著,则保持OLS结果;如果空间回归模
型和空间误差模型都显著,则继续运行稳健性检验了如果RobustLM-Error显
著,则运行空间误差模型;如果RobustLM-Lag显著,则运行空间回归模型。
4.13变系数地理加权回归模型(GWR
常系数空间回归模型可能忽略了一个问题,即:
各种数据在不同空间上表现的复杂性、和变异性。
如果数据在空间上表现平稳,则OLS全局分析方法完全适用,而若数据在空间上表现出了不平稳特性,则可能需要采用局部分析技术来应对。
在经济社会现实中,空间数据的复杂特点使得经济地理解释变量对被解释变量的影响在不同区域之间多数是不稳态性,此时,利用常系数空间回归模型估计
得到的参数可能是有偏的、无效的,因此,在分析此类问题时,假定不同区域之间的经济行为在空间上存在异质性可能更加符合现实。
局域空间计量经济学中的地理加权回归空间变系数回归模型中(GWR是解决此类问题的一种有效途径,变系数地理加权回归模型的核心思想是“离经济体近的观察数据比那些离经济体远的观察数据对经济体的参数估计有更多的影响”。
GW模型是从全域回归模型扩展而来,在全域回归模型中,我们通常假定有i=1,2,...,m和j=1,2,...,n的系列解释变量观测值■:
>及系列被解释变量■丨,经典的全域线性回归模型如下式:
丹="o十》龙訥i=1.2,
J=1
上述模型中,「是整个回归模型的随机误差项,满足球星扰动假设,回归系数一被假定是一个常数。
模型参数的估计一般采用普通最小二乘法(OLS。
42空间面板数据模型
以上空间横截面数据模型使用的数据集主要面向截面数据,模型中仅考虑了
空间单元之间的相关性,而未顾及具有时空演变特征的时间尺度之间的相关性。
当观测量既具有空间特性,又具有时间特性,截面数据模型就无法处理这类数据,必须引入面板数据模型。
根据以上空间经济计量分析工具,结合面板数据计量经济学的理论方法,我们可以构建一个综合考虑变量时空二维特征和信息的空间面板数据计量经济模型,这里主要介绍基于固定效应模型的空间回归面板计量模型和空间误差面板计量模型。
4.2.1.空间回归面板计量模型
首先考虑一个带固定效应的空间自回归模型:
恥=(呵2*阳(+诚(止t=1,2,…,T
在上式中:
-「为;1上.■.r,表示第t个时间点的N个横截面数据的被解释变量
-:
为縁牴曲帕一」独QT,表示第t个时间点的N个横截面数据的解释变量
-■-为;、1.,]:
-,表示回归方程中的个体效应
-为,表示服从正态分布的随机误差项
-W/为空间权重矩阵
-为解释变量;的回归系数
-为反映空间影响程度的参数,它代表邻近地区间因变量y之间的影响程
度
422.空间误差面板计量模型
另外一个带固定效应的空间误差模型:
t1,2,...,T
「为1':
■■.r,表示第t个时间点的N个横截面数据的被解释
变量
,表示第t个时间点的N个横截面数据的解释变
-为;>--,表示回归方程中的个体效应
-和*为随机误差项,其中:
巴妙①吒碎…;妙,为是服从正态分布的随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 统计 计量 方法 学习 笔记