完整版ArcGisChapter04.docx
- 文档编号:25744095
- 上传时间:2023-06-12
- 格式:DOCX
- 页数:20
- 大小:115.45KB
完整版ArcGisChapter04.docx
《完整版ArcGisChapter04.docx》由会员分享,可在线阅读,更多相关《完整版ArcGisChapter04.docx(20页珍藏版)》请在冰豆网上搜索。
完整版ArcGisChapter04
第二部分基本数量方法及其应用
55
第四章基于GIS的服务区分析及其在商业地理和区域规划中的应用
“仅仅提供优质的商品和服务是不够的,成功的商家还需要考虑三个因素,那就是:
区位、区位、再区位”(Taneja,1999:
136)。
商店选址时,例行的服务区分析十分重要。
服务区是指“顾客分布的主要区域,在其范围内该店的商品销售量或服务营业额超过其竞争对手”(GhoshandMcLafferty,1987:
62)。
对于一家新店,研究服务区可以在现存竞争对手(包括那些属于同一连锁店的商家)背后发掘商机,从而有利于确定最佳选址。
对于现有商店,通过服务区分析可以考察市场潜力,评价经营业绩。
此外,服务区分析还有助于企业开展下述活动:
确定广告覆盖的重点地区,揭示顾客较少的薄弱地段,提出企业扩张计划等等(BermanandEvans,2001:
293-294)。
划分服务区的方法有类比法、邻域法、重力法等几种。
类比法是一种非地理方法,常用的是回归分析法。
邻域法和重力法都是地理方法,可以借助GIS技术来实现。
类比法和邻域法比较简单,将在第4.1节中介绍。
重力法是本章的重点,将在第4.2节详细阐述。
因为本书重在GIS应用,所以第4.3和第4.4节将举例说明如何通过GIS来实现两种地理方法(邻域法和重力法)。
案例4A从一个新的视角来演示传统的商业地理问题,例子并不是典型的零售店服务区的界定,而是分析芝加哥两支专业棒球队的球迷分布。
案例4B演示了服务区分析方法在区域规划中的应用,实例是划分中国东北大城市的腹地范围(影响区)。
腹地划分是区域规划中常见的一个重要任务。
第4.5节是本章小结。
56
4.1服务区分析的基本方法
4.1.1类比法及回归模型
类比法最早由阿波巴姆(Applebaum,1966,1968)提出,是第一个基于经验数据系统预测零售服务的模型。
该模型基于现有商店营运情况来预测类似商店的销量。
阿波巴姆的类比法最初并不包括回归分析,它通过一定样本的问卷调查来获取类比商店的顾客信息:
地理分布、人口结构特征、消费习惯等。
据此,可以确定不同距离范围内的市场容量(例如顾客数量及分布、人均消费额等)。
分析的结果可以用于预测在类似环境新增商店的市场潜力。
虽然类比法可以用于划分一个商店不同距离的市场容量,但其主要目的是预测销售情况而不是从地理上划分服务区。
类比法操作简单,但有一些重大缺陷。
类比商店的选择依赖于主观判断(Applebaum,1966:
134),也没有考虑很多影响商店经营状况的环境和场地特征。
通过引入回归模型可以完善原始的类比法。
回归模型考虑到影响商店效益的各种变量(RogersandGreen,1978),其表达式为
这里,Y是商店的销量或利润,xi是各种影响因素(变量),bi是回归系数,i=0,1,2,…n。
选择什么样的变量(影响因素),根据各种商店的具体情况确定。
例如,奥尔森和罗德(OlsenandLord,1979)分析银行的零售业时采用了反映服务区特征(购买力、家庭收入、自有住房情况)、场地吸引力(雇员水平、银行储蓄所面积)、竞争性(竞争银行数、同类银行服务区的重叠)等几类变量。
即使是对同一种零售商店,回归模型也可以根据一定的办法改进,即将商店分成不同的类型分别进行拟合以得到不同的回归模型。
例如,戴维斯(Davies,1973)根据服装店是否位于街角将其分为两类,他发现影响这两种服装店销量的变量存在明显差异。
对于街角服装店,前五位影响因素分别是商店面积、商店可达性、分支商店数、城市增长速度、到最近停车场的距离;对于街道中央的服装店,前五位影响因素分别是城市总零售消费额、商店可达性、销售区面积、商店面积、分支商店数。
4.1.2邻域法
57
邻域法是一种界定服务区的简单地理方法,它假设消费者遵循就近购物原则(GhoshandMcLafferty,1987:
65),这也是经典中心地理论的一个假设(Christaller,1966;Lösch,1954)。
邻域法认为消费者购物时只考虑通行距离(或通行时间),从而某个商店服务区内的消费者到该商店的距离比到其他商店的距离都要近。
定义了近邻区域之后,通过分析服务区的人口特征并考察他们的购物习惯即可预测销量。
邻域法的GIS应用可以从两个角度来实现。
第一种是顾客导向的方法。
首先从一个居民点出发,搜索所有商店中最近的商店。
然后,将这个搜索过程应用到所有的居民点。
最后,所有共享同一家最近商店的居民点组成该商店的近邻区域。
这可以用ArcGIS工具箱里面的near工具来实现,near工具可以通过AnalysisTools>Proximity>Near来调用。
第二种是商店导向的方法。
首先基于各商店构造泰森多边形,围绕每家商店的多边形即为其近邻区。
其次,将泰森多边形与包含消费者信息的图层(例如人口普查小区图层)叠加,即可得到每个近邻区的人口统计量。
泰森多边形的覆盖区域以构造多边形的商店位置为基础,其范围由最左下角和最右上角的两点决定其范围,可能不完全覆盖所有的居民点。
在ArcGIS中,泰森多边形是从一个包含商店位置的点图层(数据格式现限为ArcInfocoverage)产生的,通过调用CoverageTools>Analysis>Proximity>Thiessen菜单来实现。
图4.1a-4.1c演示了基于五个点的泰森多边形是怎样形成的。
图4.1a显示了五个点的分布;图4.1b中,临近的两点连成一线,线的中点处再画一垂直线;最后图4.1c显示这些垂直线形成泰森多边形。
邻域法中的欧式距离可以用路网距离或旅行时间来代替。
案例4A和4B都是基于顾客导向法实现的:
首先,根据所有消费者和商店两两之间的距离或时间构造距离或时间矩阵(参见第二章);然后,找出离每个消费者距离最近(或时间最短)的商店;最后,将所得结果添加到消费者图层以便绘图或进行更多的分析。
4.2划分服务区的引力模型
4.2.1赖利定律
邻域法定义服务区时只考虑了距离(或时间)。
但是,消费者有可能越过最近的商店而去光顾那些价格低廉、质量优越、品种齐全或形象悦目的商店。
由于购物行为的多样性,提供不同商品和服务的商店集聚区往往能够比孤立商店吸引更远的顾客。
基于引力模型的方法考虑两个因素:
距离商店的远近、商店吸引力的大小。
赖利(Reilly,1931)零售引力定律最初用于划分两个城市的吸引范围,实际上也可以用来划分相邻两家商店的服务区。
58
考察相距d12的商店1和商店2(图4.2)。
假设商店1和2的吸引力分别为S1和S2(例如以商店的销售区面积算),我们需要确定这两家商店服务区之间的断裂点。
设断裂点到商店1和商店2的距离分别为d1x和d2x,即有
(4.1)
59
根据引力模型的概念,商店对某一点的零售引力(简称“势能”)与它本身的吸引力成正比,与距离成反比。
位于断裂点的消费者去哪家商店购物都是一样的,也就是说在断裂点,商店1和商店2的引力相等,即有
(4.2)
根据式(4.1),我们有
。
代入式(4.2)解得
(4.3)
类似地,
(4.4)
式(4.3)和(4.4)定义了两家商店服务区之间的界限,此即为赖利定律。
4.2.2哈夫模型
赖利定律只适用于划分两家商店之间的服务区。
哈夫(Huff,1963)模型是更一般的引力模型,可以用于划分多家商店的服务区,“它(哈夫模型)简单易懂、使用方便,解决问题的适用性更广”(Huff,2003:
34)。
自创立以来,哈夫模型得到了持续而广泛的应用。
哈夫模型的基础与多目标选择的逻辑斯蒂(logistic)模型类似。
在所有备选商店中,消费者选择其中某一家商店的概率与每种选择的效用成正比,也就是
(4.5)
这里Pij为消费者i选择商店j的概率,Uj和Uk分别是选择商店j和k的效用,k是所有可能的选择(k=1,2,...,n)。
在实际应用时,商店的效用是用引力模型来定义的。
与式(4.2)相似,某地的势能大小与商店的吸引力(例如以面积衡量的规模)呈正相关,而与商店和消费者间的距离呈负相关。
也就是
60
(4.6)
这里S为商店规模,d为距离,β>0是距离摩擦系数,其他参数或变量与式(4.5)中的定义相同。
可见,式(4.6)是式(4.2)的一般形式,而式(4.2)为式(4.6)中β等于2的特殊情况。
通常称为势能,表示商店j对位于i的消费者的需求影响。
用中心引力来度量效用纯粹是为了计算上的方便。
事实上,从效用最大化可以推导出引力模型(也称为空间相互作用模型)(NiedercornandBechdolt,1969;Colwell,1982),这也是引力模型的经济基础(参见附录4)。
威尔逊(Wilson,1967,1975)也借助熵最大化法为引力模型提供了一个理论基础,他的工作也带来了新的发现,即一系列引力模型:
起点约束模型、终点约束模型、起点-终点约束模型或称双向约束模型(Wilson,1974;FotheringhamandO’Kelly,1989)。
从式(4.6)可知,消费者到各商店购物的概率是不同的,商店的服务区由最大概率的消费者构成。
实际应用时,对于i地点的消费者,式(4.6)的分母对所有的商店j都是相同的,从而分子大的概率就大。
分子
通常称为商店j在距离dij的“势能”。
这意味着,只要找到一个商店最大势能的集合即可确定商店的服务区,这很容易用ArcGIS来实现。
当然,如果我们想得到商店购物概率的连续分布曲面,需要基于式(4.6)算出具体的概率。
事实上,哈夫模型的一个主要贡献就是,零售服务区是一个连续的渐变范围,不同商店的零售服务区相互重叠,与中心地理论互不重叠的规则几何服务区不同。
实际应用哈夫模型时,要利用商店与消费者之间的距离矩阵,用式(4.6)计算消费者到每个商店的购物概率。
这些都可以借助ArcGIS来实现。
计算结果不是简单的边界,而是一个连续的概率曲面。
如果我们还是想要划定每个商店自己占优势的服务区,那就是由那些到该店购物概率最大的居民点所组成。
4.2.3赖利定律与哈夫模型的关系
赖利定律可以看作是哈夫模型的特殊形式。
在式(4.6)中,假设只有两家商店(k=2),断裂点处的概率Pij=0.5,即有
假设β=2,上式即为式(4.2),从而可以得到赖利定律。
对于任意的β,赖利模型的一般式可以表作
61
(4.7)
(4.8)
根据式(4.7)和(4.8)可知,如果商店1的规模比商店2增加得快(即
上升),则d1x增加而d2x下降,表明断裂点向商店2移动,从而商店1的服务区扩大。
这在实际生活中是显而易见的。
如果考虑距离摩擦系数的影响,我们同样可以得到有趣的结果。
当β降低时,断裂点的移动依赖于商店的规模:
如果
,即
,
降低,从而d1x增加,d2x减少,表明规模大的商店扩大服务区;
如果
,即
,
增加,从而d1x减少,d2x增加,表明规模小的商店收缩服务区。
历史上由于交通技术和路网的改善,β值递减,距离对人们出行的磨擦力减少。
由上面的推论可以看出,递减的β使大商店优势更为明显。
这一点可以帮助我们理解今日的零售业竟争的时代,大型超级市场取代邻里小店是不可避免的.。
4.2.4哈夫模型的推广
原始哈夫模型的商店规模指数为1,对哈夫模型式(4.6)的一个简单改进可以表作
(4.9)
这里指数α表征了商店的规模弹性(例如,由于规模经济效益,大型购物中心的吸引力比若干商店吸引力的简单相加大得多)。
改进的模型依然只用规模来表征商店的吸引力。
有研究者(Nakanishi和Cooper1974)提出一个更一般形式的即所谓竟争互动的乘数模型(MCI)。
除了规模与距离因素之外,这个模型考虑了诸如商店形象、地理可达性等其他因素。
MCI模型定义的消费者i在商店j购物的概率Pij为
(4.10)
这里,Alj是商店j的第l个属性(l=1,2,…,L),Ni是消费者i可能前往购物的商店集,其他变量或参数与式(4.6)和式(4.9)中的定义相同。
62
如果有个人购物行为的数据,我们可以用多项选择的模型(MNL)来刻画购物行为(例见Weisbrodetal.,1984),模型可表作
(4.11)
跟式(4.10)用幂函数方程表征商店吸引力,这里用指数函数来表征。
上述模型可以用多项选择的logit模型来估算。
4.2.5引力模型中β值的计算
引力模型中的距离摩擦系数β是个重要参数,使用哈夫模型时首先要计算β值。
由于β值随时而变、因地而异,最好是根据实际的研究区而定。
与式(4.6)所示的原始哈夫模型相对的是地区间联系的早期引力模型,表作
(4.12)
这里Tij是区域i(即居住地)和j(商店)之间的联系强度(比如人流量),Oi为出发地规模(这里为居住地人口规模),Di为目的地规模(商店规模),a为比例系数(常量),dij和β的定义与式(4.6)相同。
式(4.12)两边取对数,得到
(4.13)
这意味着,如果原始模型中的商店规模没有指数参数的话,β可以通过式(4.13)这样的简单二元回归模型得到,例如,可见金凤君等人(Jinetal.,2004)的一个研究。
类似的,改进的哈夫模型(式(4.9))对应于下面的引力模型
(4.14)
这里α1和α2分别为出发地吸引力Oi、目的地吸引力Dj的弹性指数,式(4.14)经过对数变换即为
63
(4.15)
应用式(4.9)所示改进的哈夫模型时,式(4.15)即为计算β值的多变量回归模型。
4.3案例4A:
确定芝加哥小熊队和白袜队的球迷范围
在芝加哥众所周知的两大职业棒球队中,不管各自的赢球记录如何,小熊队总是比白袜队吸引更多的球迷。
许多因素,诸如球队历史、棒球馆周边环境、球队管理的公共形象、赢球记录等等都会对球迷的多少产生影响。
在本例中,我们试图从地理角度来考察这一现象。
作为服务区分析的示例,我们只考察棒球馆周边人口这个变量。
首先,我们假设球迷选择最近邻的球队,邻域法就可用来考察球队在球迷中的影响。
作为方法的演示,我们用赢球率来衡量球队的吸引力,用引力模型法来计量球迷支持每个队的概率。
显然,这有些过于简化。
尽管小熊队的记录一直不理想,但它却拥有“可爱的失败者”这一绰号,是体育界最受欢迎的专业球队之一。
当然,赢球记录仍然很重要,在小熊队2003年冲进季后赛之后,2004年该队球赛的门票就特别抢手了。
更具有讽刺意味的是,白袜队在芝加哥尽管不受青睐,2005年战绩显赫,并最终赢得世界职业棒球大赛的冠军。
为简单起见,本例中采用欧式距离(例4B中用网络距离),距离摩擦系数假设为2,即β=2。
本例所用数据如下:
1.研究区内包含普查小区信息的多边形图层数据(见所附光盘e00数据文件chitrt)
2.两支球队所在的库克县公路与街道shp数据(见tgr17031lka文件)
3.两支球队地址及赢球记录的数据(见excel逗号分割数值文件cubsoxaddr.csv)
数据收集与处理是这样的。
研究区为伊利诺伊州芝加哥结合大都市统计区(CMSA)的10个县(括号内为县编码):
库克(031)、都佩吉(043)、德卡布(037)、格兰地(063)、凯恩(089)、坎卡基(091)、肯德尔(093)、莱克(097)、麦克亨利(111)和威尔(197),如图4.3所示。
空间数据从ESRI网站下载,按照与第1.2节类似的方法进行处理(参见案例1A),并将各县的普查小区数据和2000年人口普查数据联系在一起。
最后,通过调用ArcToolbox里面的DataManagement>General>Append菜单,将各县融合在一起形成chitrt文件。
本例中只使用了人口数据,变量名popu。
读者也可以用其他一些统计数据如收入、年龄、性别等做更深入的研究。
64
两支球队所在库克县的Shp文件(包含公路和街道数据),也是从ESRI网站下载的,本图层用于对球队进行地理编码。
两支球队的地址以及他们2003年的赢球率(小熊队为0.549,白袜队为0.512)来自互联网,这些都包含在cubsoxaddr.csv文件中,共有球队名称、街道地址、邮编、赢球率四列数据。
65
下面是案例操作的简单说明。
如有必要,读者可以参阅前面的案例以查看详细的相关步骤。
本例介绍一个新的GIS功能:
地理编码或地址匹配,即将一系列地址转化为地图上的点。
4.3.1第一部分:
用邻域法确定球迷范围
1.球队地理编码:
启动ArcCatalog,依次用鼠标左键双击AddressLocators>CreateNewAddressLocator,在弹出的对话框里选择USStreetswithZone(File),然后将Name一栏后面的“thenewaddresslocator”改为mlb(即我们创建addresslocator的名字);单击Primarytable,Referencedata右边的按钮,找到Chicago文件夹里面的文件tgr17031lka并添加(add);其他选项默认值即可。
上述功能也可以调用ArcToolBox实现:
GeocodingTools>CreateAddressLocator。
我们选用ArcCatalog,因为它提供了更多选项。
用ArcMap进行地址匹配:
选择Tools>Geocoding>GeocodeAddress。
选择mlb作为addresslocator,选择cubsoxaddr.csv为地址表,将结果存为名叫cubsox_geo的shape文件。
用coverage文件chitrt设置shape文件的投影为cubsox_prj(即StatePlaneIllinoisEast)。
2.查找最近的球队:
创建点图层chitrtpt,即普查小区多边形(图层chitrt)的重心(具体办法参见第1.4节第一部分第1步)。
也可以直接用光盘里面的shape文件chitrtcent(人口重心)。
第五章第5.4节介绍了获取这一shape文件的方法。
用ArcToolbox里面的空间连接(spatialjoin)或近邻工具(AnalysisTools>Proximity>Near)来得到距离每个普查小区重心最近的球队,并将结果与多边形图层chitrt连接,图4.3是基于近邻法得到的两支球队的球迷范围图示。
如果想让每支球队的球迷范围显示为独立的多边形(当然,这并不是本例的目的),我们可以调用ArcToolbox>DataManagementTools>Generalization>Dissolve菜单,将球迷分布的普查区按自己喜欢的球队进行分组合并。
3.
66
汇总结果:
打开图层chitrt的属性表,将人口数(popu)按球队汇总(例如按NEAR_FID汇总)。
在属性表中,选择Options>SelectByAttributes来得到下述几类普查小区:
2英里(=3,218米)以内,5英里(=8,045米),10英里(=16,090米)以及20英里(=32,180米),并汇总每支球队近邻的所有人口数。
汇总结果参见表4.1。
可见,小熊队明显占优势,尤其是在近距离范围内。
如果考虑到居民收入的话,小熊队的优势更加明显。
4.[可选操作]用泰森多边形定义近邻区域:
用ArcToolbox将shape文件cubsox_prj转化为点图层cubsox_pt:
调用ConversionTools>ToCoverage>FeatureClassToCoverage。
然后,基于cubsox_pt生成泰森多边形图层thiess:
调用CoverageTools>Analysis>Proximity>Thiessen来生成泰森多边形图层thiess。
用空间连接(或其他叠加工具)来得到那些重心在泰森多边形thiess里面的普查小区,然后按每支球队汇总人口数。
所得结果与上面第二步的结果进行比较。
泰森多边形的范围是由点图层的范围来定义的,因此可能不会覆盖整个研究区(参见脚注1)。
4.3.2第二部分:
用哈夫模型确定球迷范围,绘制概率面
1.计算球队与普查小区之间的距离矩阵:
用ArcToolbox计算普查小区与球队之间的欧式距离:
调用AnalysisTools>Proximity>PointDistance(例如,用chitrtpt作为InputFeature,cubsox_prj作为NearFeature;也可以参看第2.3节第一部分第二步)。
将距离文件命名为dist.dbf。
距离文件包含1,902(普查小区数)×2(球队数)=3,804条记录。
2.计算势能:
将属性表cubsox_prj连接到距离表dist.dbf,从而将赢球记录添加到距离文件。
在dist.dbf中添加名为potent的变量(field),按照公式potent=1000000*winrat/(distance/1000)^2来计算势能。
需要注意的是,势能值是无量纲,这里乘1,000,000是为了避免数值太小。
按照式(4.6)计算得到的结果保存在列potent中。
3.计算概率:
在表dist.dbf中,按普查小区(即按INPUT_FID)对potent求和以得到式(4.6)中的分母,将结果保存为sum_potent.dbf文件,并将它与表dist.dbf连接。
添加一列prob,按照公式prob=potent/sum_potent计算prob,所得即为每个普查小区内的居民选择某个球队的概率。
4.绘制概率面:
提取观看小熊队比赛的概率(例如,根据NEAR_FID=0的条件从dist.dbf选取记录),将结果保存为Cubs_Prob.dbf,并将它连接到普查小区的点图层chitrtpt。
利用案例3B介绍的面模型技术来绘制小熊队的概率面,见图4.4。
其中的小插图为两支球队附近的放大图,显示沿着0.5的概率线,从一支球队的服务区到另一支球队的服务区的变化过程。
本例只包括2支球队。
读者可以基于白袜队进行分析,得到的图形与图4.4正好相反,因为观看白袜队比赛的概率=1-观看小熊队的概率。
5.
67
68
用哈夫模型定义球迷范围:
上述第4步将Cubs_Prob.dbf连接到chitrtpt之后,属性表chitrtpt有了一个名叫prob的变量,为居民观看小熊队比赛的概率。
在chitrtpt中添加新的一列cubsfan,按照公式cubsfan=prob*popu计算,并将结果汇总得到4,338,884,此即为根据哈夫模型得到的小熊队的球迷数。
余下的人口为白袜队的球迷,即8,376,601(研究区内的总人口)-4,338,884=4,037,717。
4.3.3讨论
用邻域法可以得到的球队影响区有确定的边界。
在影响区内,所有人被假设支持两支球队中的一支。
哈夫模型计算了居民支持每支球队的概率。
在每个普查小区内,一部分人支持这一支球队,余下的支持另一支球队。
哈夫模型更切合实际,因为住在同一个地区的人(甚至同一家人的不同成员)可能支持不同的球队。
测量球队的影响力通常是一件非常复杂的事情(本例用了许多假设条件来简化问题)。
哈夫模型也可以用于划定有明确边界的影响区,只要我们将支持球队概率最大的普查小区划为该球队的影响区即可。
在本例中,概率大于0.5(prob>.50)的普查小区属于小熊队,余下的普查小区属于白袜队。
4.4案例4B:
确定中国东
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 ArcGisChapter04