基于spss应用的产业结构与物流需求量相关性分析Word文档下载推荐.docx
- 文档编号:19900954
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:20
- 大小:733.57KB
基于spss应用的产业结构与物流需求量相关性分析Word文档下载推荐.docx
《基于spss应用的产业结构与物流需求量相关性分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《基于spss应用的产业结构与物流需求量相关性分析Word文档下载推荐.docx(20页珍藏版)》请在冰豆网上搜索。
《城市统计年鉴》包含了287个重要城市的数据,一方面,较大的数据量一般可以保证较强的样本独立性,增加分析结果的可信度;
另一方面,也可能削弱样本的代表性,这在分析经济数据中体现的较为明显。
比如,有一些内陆城市是靠单一资源发展,或单纯政策性扶持而发展,不符合现代城市的定义。
一般来说,经济结构比较成熟的城市发展历史比较悠久,人口较多,经济总量规模较大。
虽然,按照人口与经济总量作为筛选标准,可能会在分析中漏掉若干具有代表性的现代城市,但是这样能够保证在较好的整体一致性前提下,避免逐个分析,可称之为一种有效率的“次优选择”。
样本确定之后,进行各个变量的独立性分析。
1、“数据”—“选择个案”勾选if,在窗口中输入:
总值>
=5000000&
市辖区人口>
=100
2、“分析”—“描述统计”—P-P图(部分具体操作见附录三)
经筛选,符合标准的样本为91个,符合样本个数大于6倍变量个数的一般要求,且各个变量基本服从独立分布。
各变量的P-P图如下。
三、按产业结构的样本分组(聚类分析)
产业结构表现的首要特征是三大产业在地区生产总值中的比重,根据经验,产业结构可以分成三类,分别以三大产业为侧重。
因而,选择第一产业比重、第二产业比重、第三产业比重作为聚类分析的变量。
为保证结果的可靠性,分别进行k值聚类法和系统聚类法分析。
此题中三个变量的量纲一致,所以,在系统聚类分析中,不需要考虑标准化的问题。
从聚类的结果来看,系统聚类分类过于极端,,有一个样本属于第一类,一个样本属于第三类,其他均属于第二类。
而k值聚类法的分类中各组样本个数较为均匀(如下表)。
系统聚类优于k值聚类的一个重要特征是可以进行标准化处理,而此三个变量量纲完全一致,系统分析没有了这种优越性。
因此,可以选择k值聚类法的结果作为分组依据。
K值聚类结果:
由输出结果观察,显著性水平明显小于0.05,聚类结果通过。
k值聚类的1类为侧重于第三产业,2类侧重于第二产业,3类侧重于第一产业,分别在赋值中标的为:
1=现代化,2=工业化,3=农业化
相关操作:
“分析”—“分类”—系统聚类法/k值聚类法
四、相关性的初步分析(单因素方差分析,因子分析)
分析前提:
在市场经济体制下,可以放宽条件,假设市场出清,那么,一个地区的物流需求可以看做物流量的实际发生额。
物流总量=货运总量+客运总量
物流总量=物流需求量
货运总量与客运总量的量纲不同,不能进行简单的加总,先分别讨论。
按照常规的分析,一个城市的第三产业比重越大,服务业越发达,服务业的重要组成部分--物流需求量应该比较大,这在独立样本T检验中得到了初步验证。
“分析”—“比较均值”—“单因素方差分析”,因变量输入“货运总量”和“客运总量”,因子输入“产业结构分组”。
结果为:
从“描述”里可以看出各组均值明显不等,且AN0VA表明各组变量显著不相等。
初步通过分析。
进一步,为了分析的整体性,货运总量与客运总量可以采用因子得分的形式合并,货运总量与客运总量存在一定的相关性(0.512,在0.1的水平上显著相关),因此可以进行因子分析。
利用因子分析计算因子得分,构造新变量s。
因子得分只表明了样品的相对位置,虽然没有其他实际意义,在这里可以作为物流总量的抽象值代表,分析变量之间的相关性。
因子分析的结果如下。
KMO的值为0.5,基本符合要求。
五、相关性的进一步探讨(简单相关、偏相关与回归方程分析)
经济是一个联系的整体,影响物流需求量的还有其他因素。
例如,经济实力,人口规模,政策导向,开放程度,消费者收入水平。
或许这些变量的作用对于物流需求量的影响更为明显。
因而,进一步引入地区生产总值、地区总人口、固定资产投资总额,城市固定资产投资比,地区平均收入等变量进一步探讨。
从简单的双相关分析中可以发现,s与第一产业比重比较明显负相关,与第三产业比较明显正相关,为了简化数据,新设变量:
“三一产业比”=第三产业比重/第一产业比重
由因子得分s与三一产业比的相关性分析看出,这两个变量不显著相关。
于是,放弃这个变量,仍然采用第三产业,第一产业单独分析。
把讨论的全部变量代入回归分析,采用entry方法,可得
运用entry的方法,在0.05的显著性水平下,只有两个变量符合要求,即城市固定资产比(0.035)和市辖区人口(0.01)。
另一方面,这些变量的方差膨胀因子(VIF)只有固定资产投资比一项大于且接近10,说明变量之间的共线性并不明显。
自变量具有较强的分析价值。
回归方程的改进:
由于方程的显著性不够明显,考虑选择新的回归方法,剔除一些变量,优化方程。
Forward方法的部分结果为(stepwise方法的结果与之相同):
Backward方法的部分结果为:
ANOVA
以上的输入结果表明,在forward方法中的保留变量为固定资产投资和市辖区人口,DW值(1.489)偏离2较远,变量之间存在一定的自相关。
在backward方法中的保留变量为第一产业比重、城市固定资产比、市辖区人口和市辖区平均工资。
DW值(1.514)较forward方法合理。
此外,标准化预测值与标准化残差的散点图和标准化残差P-P图表明,残差的方差齐性基本成立,且符合正态分布。
两种分析方法中被保留的变量同时含有固定资产投资类和市辖区人口两类变量,说明相关政府投资的经济政策和人口总量是影响物流量的重要因素。
而产业结构的影响相对较弱。
为了证明这一点,进行以市辖区人口和固定资产投资作为控制变量,s和第一产业、第三产业的偏相关分析。
结果如下。
这表明,除去人口因素和政策投资因素,产业结构与物流总量的相关性较弱,且均是负相关。
六、结论
产业结构可能会影响具体的物流方式,比如,工业产值比重较高的城市,具有较发达的工业物流;
侧重于服务业和出口贸易的城市,具有较高水平的商业物流。
但从物流总量来看,经济结构的影响较弱。
影响物流需求量的主要因素还是人口总量、收入水平和政府相关政策。
附录一:
应用的91个样本城市名称
北京市
天津市
石家庄
唐山市
邯郸市
保定市
太原市
呼和浩
包头市
赤峰市
沈阳市
大连市
鞍山市
抚顺市
长样市
吉林市
哈尔滨
齐齐哈
大庆市
上海市
南京市
无锡市
徐州市
常州市
苏州市
准安市
盐城市
扬州市
镇江市
宿迁市
杭州市
宁波市
温州市
湖州市
台州市
合肥市
芜湖市
福州市
烟台市
潍坊市
济宁市
泰安市
日照市
临沂市
聊城市
菏泽市
郑州市
洛阳市
安阳市
新乡市
南阳市
商丘市
信阳市
武汉市
宜昌市
襄樊市
荆州市
长沙市
衡阳市
常德市
永州市
广州市
深圳市
汕头市
佛山市
江门市
湛江市
茂名市
惠州市
东莞市
中山市
南宁市
柳州市
重庆市
成都市
绵阳市
南充市
贵阳市
昆明市
西安市
兰州市
乌再木
附录二:
货运总量与主要变量的回归方程
在分析的过程中发现,货运总量与各个变量的回归模型D-W值达到了1.9以上,特别是backward方法的优化分析。
因此,可以据此得出比较合适的回归方程,具体如下:
因变量:
货运总量
自变量:
总值、固定资产投资、市辖区人口、城市固定资产投资比、第一产业比重、第三产业比重、外商直接投资、市辖区平均工资等。
运用Forward方法的回归分析的输出结果为:
保留变量:
固定资产投资、市辖区人口和总值。
运用Backward方法进行回归分析的输出结果为:
保留变量为:
市辖区人口、城市固定资产投资比、总值和第一产业比重。
以上两种分析方法中,DW值均接近于2,残差之间的独立性均较强,特别是backward方法,DW值达到了1.991,说明残差的独立性非常显著。
且backward方法的方程系数的显著性也很强,在0.05的显著性水平下,只有第一产业比重不符合标准。
在0.1的显著性水平下,全部变量都符合要求。
因此,选择backward的方法作为优化的回归分析来构造方程。
此外,从回归标准化预测值和回归标准化残差的散点图中可以看出,除个别点外,其他点基本上在纵轴零点对应的直线上下均匀分布,因此,残差的方差齐行是成立的。
由P-P正态概率图可以看出,各点基本成一条直线,残差的正态性诊断通过。
各个变量的方差膨胀因子(VIF)均在2-3之间,远小于10,共线性较弱,即自变量之间的线性关系不显著,模型稳定。
设第一产业比重为x1,总值为x2,城市固定资产投资比为x3,市辖区人口为x4,货运总量为y,可得到如下方程。
非标准化回归方程:
y=10739.542-275.377x1-98.720x3+25.244x4
标准化回归方程:
y=-0.183x1+0.38x2-0.2x3+0.509x4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 spss 应用 产业结构 物流 需求量 相关性 分析