应用回归分析实训 精简版.docx
- 文档编号:30670036
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:16
- 大小:103.24KB
应用回归分析实训 精简版.docx
《应用回归分析实训 精简版.docx》由会员分享,可在线阅读,更多相关《应用回归分析实训 精简版.docx(16页珍藏版)》请在冰豆网上搜索。
应用回归分析实训精简版
应用回归分析实训(SPSS)课程号:
STAN32110P
结课报告写作要求
1.学生报告采用打印版,请按照附件要求格式提交报告。
2.题目自拟。
选题得当,分析过程正确清晰,结论明确。
3.分析所采用的方法必须是课堂讲授过的某一方面或多个方面。
所有软件操作必须使用spss。
4.论文内容方面有雷同者则此课程不及格。
北京房价影响因素的多元线性回归分析
关键词:
多元线性;回归分析;相关性
一、研究目的和意义
我国房地产市场从20世纪90年代开始建立到如今已经颇具规模,对我国的经济增长产生了很大的影响,甚至成为了国民经济的支柱型产业。
但是近年来,房价的飞速发展又不得不引起我们的重视,在促进经济增长的同时,带来的一系列结构性问题将对房地产行业的健康发展甚至国民经济的可持续发展带来影响。
因此研究商品房价格的影响因素,有助于科学的把握房地产市场的发展规律,对整个国民经济都具有很大的意义。
二、研究内容和方法
本文主要以北京为中国房地产市场的代表城市进行分析,通过对1999年至2007年的相关经济数据整理建立起多元线性回归模型。
从理论上来讲,房价的波动主要受宏观经济影响,包括地区生产总值,城镇人均可支配收入,建设成本,城市人口密度,货币政策,土地价格以及房地产开发投资额等指标。
这里主要选取商品房平均售价作为因变量,城镇人均可支配收入,城市人口密度,以及房地产开发投资额作为自变量来进行分析,通过多元回归方法来了解商品房价格的影响因素
(一)多元回归模型的建立
设定三个自变量指标分别为:
城镇人均可支配收入
,城市人口密度
,房地产开发投资额
,商品房平均售价y作为因变量,并建立如下的多元线性回归模型:
其中
,
,
,
分别为未知参数,
为剩余残差,与三个自变量无关。
服从N(0,
).
(二)回归模型的检验
1、模型拟合度检验
见下表分析结果:
模型汇总b
模型
R
R方
调整R方
标准估计的误差
1
.989a
.977
.964
428.228
a.预测变量:
(常量),城市人口密度(人每平方公里),房地产开发投资额(亿元),城镇人均可支配收入(元)。
b.因变量:
商品房平均售价(元每平方米)
表:
模型拟合度检验
由上表可以看出,其R值和R^2值都很接近于1,所以其模型拟合度较好。
2、自相关性检验
模型汇总b
模型
更改统计量
R方更改
F更改
df1
df2
Sig.F更改
Durbin-Watson
1
.962
177.988
1
7
.000
2.134
b.因变量:
商品房平均售价(元每平方米)
上表中给出了杜宾沃森检验值,DW=2.134接近于2,表明无自相关性,即每个观测值之间不相关。
3、方差分析显著性F检验
见方差分析表:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.979E7
3
1.326E7
72.325
.000a
残差
916895.968
5
183379.194
总计
4.071E7
8
a.预测变量:
(常量),城市人口密度(人每平方公里),房地产开发投资额(亿元),城镇人均可支配收入(元)。
b.因变量:
商品房平均售价(元每平方米)
方差分析表
由上表可以看到F值为72.325,SIG值为0.000,显然小于0.05,说明因变量分别与自变量存在真实的线性关系,显著性检验通过。
4、变量显著性t检验
见相关系数表:
系数a
模型
非标准化系数
标准系数
B
标准误差
试用版
t
Sig.
1
(常量)
-2418.455
794.097
-3.046
.029
城镇人均可支配收入(元)
.796
.165
1.528
4.837
.005
房地产开发投资额(亿元)
-2.336
1.399
-.338
-1.669
.156
城市人口密度(人每平方公里)
-1.141
1.028
-.242
-1.110
.318
a.因变量:
商品房平均售价(元每平方米)
Coefficients表
由表知,只有城镇人均可支配收入的SIG值小于0.05,但是其VIF值却大于10,另外发现城市人口密度以及房地产开发投资额和商品房均价呈负相关,显然在经济实际上不合理。
综合判断,自变量间存在多重共线性。
通过相关性检验观察变量间的的相关系数均很接近于1(见下表),说明确实存在较强的共线性。
相关性
商品房平均售价(元每平方米)
城镇人均可支配收入(元)
房地产开发投资额(亿元)
城市人口密度(人每平方公里)
Pearson相关性
商品房平均售价(元每平方米)
1
0.981
0.889
0.915
城镇人均可支配收入(元)
0.981
1
0.941
0.949
房地产开发投资额(亿元)
0.889
0.941
1
0.871
城市人口密度(人每平方公里)
0.915
0.949
0.871
1
Sig.(单侧)
商品房平均售价(元每平方米)
.
0
0.001
0
城镇人均可支配收入(元)
0
.
0
0
房地产开发投资额(亿元)
0.001
0
.
0.001
城市人口密度(人每平方公里)
0
0
0.001
.
N
商品房平均售价(元每平方米)
9
9
9
9
城镇人均可支配收入(元)
9
9
9
9
房地产开发投资额(亿元)
9
9
9
9
城市人口密度(人每平方公里)
9
9
9
9
表:
变量间的相关系数
(三)多重共线性问题的解决以及回归模型修正
多重共线性的解决一般可以从数据处理和统计方法这两方面入手。
数据处理方面可以通过增加样本量来解决,但是由于房地产市场从90年代末才逐步发展,相关统计数据有限。
所以我们通过采用逐步回归(stepwise)统计方法来对回归进行修正。
通过逐步回归后发现,只有城镇人均可支配收入与商品房销售均价表现了良好的正相关性,并且通过了相关的检验。
分别如下表所示:
综合SIG值,F值,VIF值都符合检验通过的标准。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
3.979E7
3
1.326E7
72.325
.000a
残差
916895.968
5
183379.194
总计
4.071E7
8
a.预测变量:
(常量),城市人口密度(人每平方公里),房地产开发投资额(亿元),城镇人均可支配收入(元)。
b.因变量:
商品房平均售价(元每平方米)
表:
方差分析
系数a
模型
非标准化系数
标准系数
t
Sig.
相关性
共线性统计量
B
标准误差
试用版
零阶
偏
部分
容差
VIF
1
(常量)
-2546.304
629.654
-4.044
.005
城镇人均可支配收入(元)
.511
.038
.981
13.341
.000
.981
.981
.981
1.000
1.000
a.因变量:
商品房平均售价(元每平方米)
表:
t检验
但是从经济意义上来看,房价与房地产开发投资额应该会呈一定的正相关关系,只是由于样本数据太少,或者相关政策的不稳定性导致其检验不显著。
而城市人口密度的不显著反而可以理解。
因为北京随着其的经济发展,确实会吸引很多外来人口工作,但是房屋的需求量不只是需求欲望决定的,还和购买力有关,显然人口密度和购买力不能构成正比关系。
同理,通过继续分别以(城镇人均人口可支配收入,房地产投资额)以及(城镇人均人口可支配收入,城市人口密度)为自变量做分析查看其T检验结果如下:
系数a
模型
非标准化系数
标准系数
B
标准误差
试用版
t
Sig.
1
(常量)
-2946.401
647.930
-4.547
.004
城镇人均可支配收入(元)
.654
.105
1.255
6.222
.001
房地产开发投资额(亿元)
-2.017
1.396
-.291
-1.445
.199
a.因变量:
商品房平均售价(元每平方米)
系数a
模型
相关性
共线性统计量
零阶
偏
部分
容差
VIF
1
城镇人均可支配收入(元)
.981
.930
.426
.115
8.698
房地产开发投资额(亿元)
.889
-.508
-.099
.115
8.698
a.因变量:
商品房平均售价(元每平方米)
表:
城镇人均人口可支配收入,房地产投资额
系数a
模型
非标准化系数
标准系数
B
标准误差
试用版
t
Sig.
1
(常量)
-2137.971
884.145
-2.418
.052
城镇人均可支配收入(元)
.594
.127
1.140
4.686
.003
城市人口密度(人每平方公里)
-.788
1.146
-.167
-.687
.518
a.因变量:
商品房平均售价(元每平方米)
系数a
模型
相关性
共线性统计量
零阶
偏
部分
容差
VIF
1
城镇人均可支配收入(元)
.981
.886
.358
.099
10.118
城市人口密度(人每平方公里)
.915
-.270
-.053
.099
10.118
a.因变量:
商品房平均售价(元每平方米)
表:
城镇人均人口可支配收入,城市人口密度
这时,我们发现当以(城镇人均人口可支配收入,房地产投资额)为自变量时,各参数(SIG,VIF<10,R值)也能勉强通过显著性检验。
再观察其P-P图如下
数据点围绕基准线还存在一定的规律性,可以认为残差满足线性模型的前提要求。
由残差图可见随着标准化预测值的变化,残差点在0线周围随机分布,但是残差的等方差性不完全满足,方差似乎有增大的趋势。
三、结论
综合以上分析,得出商品房平均售价和城镇人均可支配收入表现了良好的正相关关系,但其他两个指标分析遇到了困难,考虑到房价与房地产开发投资额应该会呈一定的正相关关系,只是由于样本数据太少,或者相关政策的不稳定性导致其检验不显著。
然后通过剔除城市人口密度,重新建立回归分析得出多元线性回归模型:
系数a
模型
非标准化系数
标准系数
B
标准误差
试用版
t
Sig.
1
(常量)
-2946.401
647.930
-4.547
.004
房地产开发投资额(亿元)
-2.017
1.396
-.291
-1.445
.199
城镇人均可支配收入(元)
.654
.105
1.255
6.222
.001
a.因变量:
商品房平均售价(元每平方米)
系数a
模型
相关性
共线性统计量
零阶
偏
部分
容差
VIF
1
房地产开发投资额(亿元)
.889
-.508
-.099
.115
8.698
城镇人均可支配收入(元)
.981
.930
.426
.115
8.698
a.因变量:
商品房平均售价(元每平方米)
所以最终的多元线性回归模型为:
y=-2946.401+0.654
-2.017
。
参考文献
附录:
北京从1999年~2007年的相关经济数据如下表一所示:
年份
商品房平均售价(元每平方米)
城镇人均可支配收入(元)
城市人口密度(人每平方公里)
房地产开发投资额(亿元)
1999.00
3422.00
10931.64
1672.00
514.83
2000.00
3565.00
11718.01
1757.00
566.17
2001.00
3866.00
12883.46
1950.00
630.73
2002.00
4134.00
13249.80
1959.00
748.89
2003.00
5118.00
14867.49
1971.00
901.24
2004.00
5855.00
16682.82
1970.00
1175.46
2005.00
6842.00
18645.03
2718.20
1246.86
2006.00
7196.00
20667.91
2774.20
1275.59
2007.00
10320.00
23623.35
2931.00
1307.53
课程论文评分表
各项
满分
评分标准
学生
得分
评分标准一
20
格式符合要求
评分标准二
20
选题得当,数据出处明确
评分标准三
30
软件操作规范,结果分析清晰
评分标准四
15
论据充分、论证严谨
评分标准五
15
分析过程无抄袭
总分
评阅人签字
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用回归分析实训 精简版 应用 回归 分析 精简