基于偏最小二乘法分析我国房价的主要影响因素.docx
- 文档编号:12216630
- 上传时间:2023-04-17
- 格式:DOCX
- 页数:15
- 大小:45.23KB
基于偏最小二乘法分析我国房价的主要影响因素.docx
《基于偏最小二乘法分析我国房价的主要影响因素.docx》由会员分享,可在线阅读,更多相关《基于偏最小二乘法分析我国房价的主要影响因素.docx(15页珍藏版)》请在冰豆网上搜索。
基于偏最小二乘法分析我国房价的主要影响因素
大三学年论文
基于偏最小二乘法分析我国房价的主要影响因素
姓名:
郭祥
学院:
商学院
班级:
统计111
学号:
119114271
指导教师:
余明江
基于偏最小二乘法分析我国房价的主要影响因素
摘要
在房价日益增长的今天,使得越来越多的人关注中国的这一现状。
中国房地产的基础起步晚,再加上房价本身就与众多外部内部的因素息息相关,使得房价的趋势所向和变化的幅度很难预测在一个准确的范围之内。
偏最小二乘法(partialleastsquares,PLS)是最小二乘法(leastsquares,LS)的一种拓展的方式它利用系统中的数据进行分解和筛选,提取对因变量解释新最强的综合变量,剔除多重相关信息和无解释意义的信息,从而克服了变量多重共线性在系统建模中的不良作用。
本文通过对影响房价变动的主要因素进行定量分析,并且在众多数据的基础之上构造出房价与这些重要因素之间的预测建模。
在文章的最后得出结论,对房价产生主要影响的因素包括了:
城镇居民平均可支配收入,五年以上住房公积金贷款利率,全国房地产开发投资额,土地交易价格指数,建筑材料购进价格指数。
前三个因素都是和居民息息相关的,后三种因素则是开发商开发房产的成本的总体现。
关键词:
商品房平均销售价格城镇居民平均可支配收入偏最小二乘回归
摘要
Abstract
在房价日益增长的今天,使得越来越多的人关注中国的这一现状。
中国房地产的基础起步晚,再加上房价本身就与众多外部内部的因素息息相关,是的放假的趋势所向和变化的幅度很难预测在一个准确的范围之内。
偏最小二乘法(partialleastsquares,PLS)是最小二乘法(leastsquares,LS)的一种拓展的方式它利用系统中的数据进行分解和筛选,提取对因变量解释新最强的综合变量,剔除多重相关信息和无解释意义的信息,从而克服了变量多重共线性在系统建模中的不良作用。
本文通过对影响房价变动的主要因素进行定量分析,并且在众多数据的基础之上构造出房价与这些重要因素之间的预测建模。
在文章的最后得出结论,对房价产生主要影响的因素包括了:
居民可支配收入,五年以上住房公积金贷款利率,全国房地产开发投资额,土地交易价格指数,建筑材料购进价格指数。
前三个因素都是和居民息息相关的,后三种因素则是开发商开发房产的成本的总体现。
Withthehousepricesrisingrapidly,moreandmorepeoplepayattentiontothissituationinChina.ConsideringshortdevelopmentofChineserealestatemarketandthepriceitselfwithmanyexternalandinternalfactorsarecloselyrelated,使得房价的趋势所向和变化的幅度很难预测在一个准确的范围之内。
Thetrendofpricestochangesinamplitudeanddifficulttopredictinanaccuraterange.Partialleastsquares(partialleastsquares,PLS)istheleastsquares(leastsquares,LS)anextensionofthewaythesystemdataaredecomposedandscreening,extractionofthedependentvariabletoexplainthenewvariablesthestrongest,eliminatingthemultiplerelatedinformationandnointerpretationofthesignificanceofinformation,therebyovercomingthemultiplevariableslinearadverseeffectsinsystemmodeling.Thispapermakesaquantitativeanalysisonthemainfactorsaffectingthepricechanges,andthepredictionmodelbetweenproducepricesandtheseimportantfactorsonthebasisofnumerousdata.Theconclusionofthisarticleisthemainaffectfactorsonthepriceincludes:
thedisposableincomeofresidents,morethanfiveyearsofhousingaccumulationfundloaninterestrates,thenationalrealestatedevelopmentinvestment,landtransactionspriceindex,buildingmaterialspurchasingpriceindex.Thefirstthreefactorsarecloselyrelatedandresidents,thelatterthreefactorsisthecostofrealestatedevelopers.
Keywords:
theaveragepriceofcommercialhousingsalestheaveragedisposableincomeofurbanresidentsPLS
目录
一引言…………………………………………………………………………….5
二现状…………………………………………………………………………….5
三影响我国房价的主要因素…………………………………………………….6
四偏最小二乘法的基本原理与方法…………………………………………….7
五建模的具体过程……………………………………………………………….7
5.1数据的选择与处理………………………………………………….….…..7
5.2模型的建立…………………………………………………….…………..8
5.3模型的分析………………………………………………………….……..9
六结论…………………………………………………………………………….11
七意见与建议…………………………………………………………………….12
参考文献…………………………………………………………………………..14
一,引言
中国的房地产业今年来的供求严重失衡问题越来越明显,各种房价的集体飞速上升,反映出房地产经济的不协调。
中国房地产在短时间内发展迅速,同时也会带来很严重的问题,因此进一步了解影响房地产的各种因素并加以调控,对于我国房地产业的发展也是有很大的帮助的。
但是在分析房价变动的时候,有很多的变量,当牵扯到自变量较多时,我们很难找到一组自变量,他们之间相互没有联系;或者说当所取的样本点数量小于自变量的个数时,都会引起多重共线性。
这个时候,如果在多源回归分析中,如果采用普通的最小二乘方法,变量之间的多重共线性就会严重影响参数估计,扩大模型误差,并破坏模型的稳健性。
当个变量集合内部存在较高程度的相关性时,用偏最小二乘回归建模,比对因变量做多元回归更加有效,其结论更加可靠,整体性更强。
二,现状
根据国家统计局发布的2003-2012年度的数据,我们做出图1和图2。
从图1中我们可以看到近十年来全国房屋平均销售价格在不断的上升,而且除了2008年一年,别的所有年份的增长速度都非常的迅速,再加上2003年的基数比较大,所以在2012年的时候,房价已经非常之高了。
图2是近十年来城镇居民平均可支配收入的变化,在这个图像中,我们可以观察到人均收入的增加也是很可观的,但是这些数据包括了很多的其他因素,包括一直存在的“二八法则”,能够真实反正广大人民群众的平均收入的数据要远远低于这个数据,再加上近十年来物价水平的提高的程度,可以得到结论,近十年来城镇人均可支配收入的增长速度肯定要低于近十年来全国房屋平均售价。
所以说广大人民买房的压力越来远大。
所以,判断和分析影响房价的原因就变的很有必要了。
图1
图2
三,影响我国房价的主要因素
影响房屋价格的因素众多,但是从经济学的角度来看,价格的变动是从供给与需求之间的关系来确定的,需求是指居民对房屋的购买需要,而供给只是房地产开发商为了自身利益的最大化,投入相应的资金来开发房地产。
因此从影响居民需求的因素还有影响房地产开发商的因素综合考虑。
影响因素在一起可以归纳包括:
1,城镇居民平均可支配收入。
城镇居民可支配收入是反映居民生活水平的一个重要指标,指城镇居民户用于最终消费支出和其他非义务性支出及储蓄的总和,即居民家庭可以用来自由支配的收入。
可支配收入具体构成是:
家庭总收入扣除交纳的个人所得税、个人交纳的社会保障费及调查户的记账补贴后的收入。
家庭总收入包括所有家庭成员在调查期得到的工薪收入、经营净收入、财产性收入、转移性收入的总和,不包括出售财物和借贷收入。
这项指标的数据直接影响居民消费水平的高低,可支配收入的增加会使得居民的储蓄增加,这样会大大增加居民买房的热情和能力。
2,五年以上住房公积金贷款利率。
贷款利率是根据贷款的信用情况等综合评价的,根据信用情况、抵押物、国家政策(是否首套房)等来确定贷款利率水平,如果各方面评价良好,不同银行执行的房贷利率有所差别。
一般来说,刚刚参加工作的人很少能够在短时间内储存够买一套房子的钱,所以住房公积金贷款就会变得很常见,如果住房公积金到款利率低,则说明在未来还款的时候,个人可以偿还最少数额的利息。
因此,低的住房公积金贷款利率也会增加居民的购房热情。
3,全国房地产开发投资额。
全国房地产开发投资额是指境内所有的房地产开发商在一年内投资于建设房产的所有资金的总和。
这个数据的高低可以影响到一年内国内新增住房面积的量。
并且因为供给量的提升,会在房地产开发商之间产生竞争,从而引起价格的相对降低。
这样对于有购房预期的居民来说,可以大大增加购房的选择区间,并且相对来说,可以使得全国房价的平均数降低。
4,土地交易价格指数。
土地交易价格指数是指房地产开发商或其他建设单位在进行商品房开发之前,为取得土地的使用权而实际支付的价格的变动趋势和程度的相对数。
不包括土地的后继开发费用、税费、各种手续费和拆迁费等。
它包括居民住宅用地、工业用地、商业旅游和娱乐用地及用于建造办公、教育、医疗科研、服务用房等其他综合用地四部分。
土地交易价格指数的计算,是以上一年各类用地的成家额占全市土地总成交额的比重作为权数,采用加权算术平均法计算出来的。
这个数据会影响房地产开发商用于开发房产的成本,并且可以对最终的房价产生一定的影响,如果这个数据较低,这会使得全国平均房价的降低。
5,建筑材料购进价格指数。
建筑材料购进价格指数是指房地产开发商或者其他建设单位进行商品房开发时,购进的所有建筑材料时所支付的建个的变动趋势和程度的相对数。
不包括后续的使用材料所支付的金额、税费等。
建筑材料购进价格指数的计算是以上一年各类材料的购进所支付的金额的总和占所有购进所支付的金额的比重作为权数,采用加权算术平均法计算出来的。
这个数据也会影响房地产开发商以及其他建设单位的用于开发房产的成本,并且可以对最终的房价产生一定的影响,这个数据的降低会使得全国平均房价的降低。
四,偏最小二乘法的基本原理与方法
偏最小二乘法是在普通最小二乘法的基础上进行拓展。
另外在偏最小二乘的方法中为了让数据满足需要,在建模的过程中还集中了主成分分析、典型相关分析以及多元线性回归的分析方法。
并且可以避免了运用普通最小二乘法的缺陷。
设有q个因变量{y1,y2,…,yq},p个自变量{x1,x2,…,xp}。
为研究自变量与因变量之间的关系,在一起观测n个样本点。
于是可以得到包括了p个自变量n个样本点的数据表X={x1,x2,…,xp}n*p和包含了q个因变量n个样本点的数据表Y={y1,y2,…,yq}n*q。
偏最小二乘回归分别在X与Y提取出成分t1与u1,显然这两个成分分别是对应的变量组的下行组合。
在提取这两个成分时,t1与u1必须满足下面两个条件:
(1)t1与u1应尽可能多的写到他们各自数据表中的变异信息;
(2)t1与u1的相关程度能够达到最大。
之所以提出上面的要求,原因在于t1与u1应该尽可能好的代表数据表X与Y,同时自变量的成分t1对因变量的u1有很高的解释能力。
在第一个成分t1和u1被提取后,偏最小二乘回归分别实施X对t1的回归以及Y对u1的回归。
如果回归方程的精度已经达到满意的程度,则算法终止;否则,将利用X被t1解释后的残余信息以及Y和u1解释后的残余信息进行第二轮的成分提取。
如此反复,知道能够达到一个比较满意的精度位置。
若最终对X共提取了m个成分t1,t2,…,tm,偏最小二乘回归将通过利用yk(k=1,2,…,q)对t1,t2,…,tm的回归,然后表达成yk关于原变量x1,x2,…,xp的回归方程。
五,建模的具体过程
5.1数据的选择与处理
全国房屋平均销售价格及其影响因素
年份
全国房屋平均销售
价格(元/平方米)
城镇居民平均
可支配收入(元)
全国房地
产开发投资额(亿元)
五年以上住房
公积金贷款利率
土地交易价格指数
建筑材料购进指数
y
x1
x2
x3
x4
x5
2003
2359
8472.2
10153.80
5.76
100
100
2004
2778
9421.6
13158.25
5.94
59.08
136.83
2005
3168
10493.0
15909.25
6.12
66.87
168.40
2006
3367
11759.5
19422.92
6.62
67.87
191.45
2007
3864
13785.8
25288.84
7.42
93.54
241.48
2008
3800
15780.8
31203.19
7.61
98.83
322.06
2009
4681
17174.7
36241.81
5.94
105.34
322.06
2010
5032
19109.4
48259.40
6.18
167.86
395.82
2011
5357
21809.8
61796.89
6.85
181.92
578.74
2012
5791
24564.7
71803.79
6.67
151.56
722.97
图3
注:
(1)上述数据均来源于国家统计局数据库。
(2)五年以上住房公积金贷款利率为加权平均数计算出的结果。
(3)全国土地交易价格指数和建筑材料购进价格指数均已2003年为100的基期。
5.2模型的建立
为了对于房价的影响因素做好准确的分析,首先要确定研究的影响因素并且编号序列,分别为:
城镇居民平均可支配收入(x1),全国房地产开发投资额(x2),五年以上住房公积金贷款利率(x3),土地交易价格指数(x4),建筑材料购进价格指数(x5),全国房屋平均销售价格(y)。
并且以2003—2012年的各项指标的数据来说明与分析的研究样本,其具体数据参见图3。
在绝大多数情况下,偏最小二乘回归并不需要选用全部的成分t1,t2,…,tA进行回归建模,而是可以采用截尾的方式选择前m个成分,仅用这m各成分就可以得到一个预测性能较好的模型。
事实上,如果后续的成分已经不能为解释Y提供更有意义的信息时,采用过多的成分只会破坏对统计趋势规律的认识,引导出错误的预测结论。
因而在偏最小二乘法回归方程中,究竟取多少个成分为宜,可通过考察增加一个新的成分后,能否对模型的预测功能有明显的改进来考虑。
在很多实际应用中都是用如下方法选取成分数。
在所有n组数据中除去第i个样本点,用这部分样本点并使用h个成分拟合一个回归方程,然后把被排除的样本点i带入前面拟合的回归方程,得到yi在样本点i上拟合值
hj(-i)。
对于每一个i=1,2,…,n,重复上述做法,定义yi的预测误差平方和为SPRESS,hj有:
SPRESS,hj=
定义Y的预测误差平方和为SPRESS,h,有
SPRESS,hj=
显然,如果回归方程的稳健型不好,误差很大,它对样本点的变动就会十分敏感,这种扰动误差的作用,就会加大SPRESS,h的值。
此外,在采用所有的样本点,拟合含h个成分的回归方程。
这时,记第i个样本点的预测值为
则可以定义yi的误差平方和为Sss,hj,有
Sss,h=
定义Y的误差平方和为Sss,h,有
Sss,h=
5.3模型的分析
通过SAS软件进行PLS分析,其分析的结果如图4所示。
从图4的分析结果可知:
预测误差PRESS在PLS成分选择1个时会达到最小。
此外,当取得一个PLS回归成分时,自变量的解释比率达到77.20%,同时对因变量组的解释比率高达92.53%。
SAS系统2004年06月10日星期二上午12时08分02秒2
ThePLSProcedure
PercentVariationAccountedfor
byPartialLeastSquaresFactors
Numberof
ExtractedModelEffectsDependentVariables
FactorsCurrentTotalCurrentTotal
177.204077.204092.529692.5296
ParameterEstimatesforCenteredandScaledData
y
Intercept0.0000000000
x10.2555188912
x20.2514984492
x30.0729419838
x40.2159341939
x50.2441143297
ParameterEstimates
y
Intercept813.5822445
x10.0541182
x20.0136696
x3131.5055698
x45.7179176
x51.3990122
图4
并且得到我国房地产与各个影响因素之间的回归模型:
y=813.5822445+0.0541182x1+0.0136696x2+131.5055698x3+5.7179176x4+1.3998130122x5
可以看出,上述影响因素的符号均为正值,说明这些因素对于房价的影响均为正相关的作用。
就是说这些因素中的任何一个因素的上都会引起房价的上升,而且在这些因素中。
五年以上住房公积金贷款利率对房价的影响较弱。
再根据函数还有属于得到根据函数得到的数据和真实数据的情况如图5所示。
根据图中的折现的走势和偏离程度可以得到该函数的准确度。
从图像可知,根据偏最小二乘法并且根据SAS得到的函数可以很大程度的表示出房产的实际走向。
尤其可以判断出各个影响因素的真实作用并且可以判断出数据的真实有效性。
图5
六结论
本文通过国家统计局的数据,并且通过偏最小二乘法的方法,借用SAS软件来进行PLS分析,并且做出根据得出的函数来计算的预测值与真实值进行对比。
文章中的影响因素都是通过经济学中的基本原理来分析出来的,但是在实际的处理过程中,因为受到方法和数据的制约,也会有一些不完善的地方。
综合考虑这些并且得到了如下的一些结论:
(1)通过上出的分析可以看出,房地产开发商的心态是作为影响房价的主要因素,当他们开发的总成本降低时,相应的房价则会出现比较明显的变化。
所以,如果可以让开发商在开发的最初阶段就能够得到相应的利益,对于其后期的销售价格都会有很大的影响。
这样便可以适当的缓解社会上普遍存在的关系房屋的各种问题。
(2)在其余的影响因素中,五年以上住房公积金贷款利率的影响因素则较弱。
同时,居民自身的可支配收入,还有全国房地产开发投资额都会具有较强的影响作用。
前者是因为居民自身储蓄的增加,会大大的增加居民的消费热情。
后者从经济学的供求理论来分析,是因为供给的增加,导致各个房地产开发商的竞争增加,所以会对房价产生相应的影响。
所以,居民收入的增加,对于社会上普遍存在的住房难题也是一大解决方法。
(3)偏最小二乘法本身存在的问题。
无论采用什么方法建立回归模型,明显的多重共线性都需要尽量预先排除。
在提取PLS成分的过程中考虑自变量和因变量相关性意义不大,有可能很多步提取的PLS成分都只包括很少的自变量离差信息特别是自变量内部有严重的多重共线性时,因此,只有自变量的离差信息利用率较高时且综合回归拟合误差率较低时,应用PLS方法才会有意义。
(4)房屋的价格日益攀升,虽然居民的收入也在不断的上升,但是两者增长的幅度显然不是在同一个水平线上,因此尽管居民的收入得到了提升,但是购房对局普通的居民来说仍然是一个很大的困扰,在不影响现代社会经济平衡的前提下,为了让居民可以买得起房子,就应该通过其余的影响因素来适当的进行调整,配合一些宏观经济调控的方法和决策来缓解社会上存在的这一问题。
七意见和建议
可以直接对房价进行调整的只有政府,政府可以通过出台新的政策来控制房地产开发商或者房屋销售商或者进行宏观的调控来使得房价进行有效的调节并且可以通过调整现金流的流向来限制房地产业产业的膨胀,其主要的措施有如下几点:
1,政府需要加大调控力度
在2003年国务院出台了《国23文件》把保障性住房改成了具有保障性质的商品房。
落脚点在商品房上面,而事实上这些年在中国政府出资的保证性住房占全部共给的房子不到5%,房地产开发商垄断了住房市场。
2008年的楼市调控,不但楼价未下跌,反而是全国地王大量出现,开发商捂盘惜售。
如今的楼市调控,被广泛称为“史上最严厉的楼市调控”,从金融、土地、税收多方面入手,在制度改革和执行力度力上较以前有了很大改善,也在一定程度上缓解了居高不下的房价问题。
从1月10日国务院出台国十一条:
“严格二套房贷款管理,首付不得低于40%,加大房地产贷款窗口指导。
”到3月9日,温家宝总理在政府工作报告中强调,要坚决遏制部分城市房价过快上涨势头,满足人民群众的基本住房需求。
”到4月15日,国务院出台具体措施:
“要求对贷款购买第二套住房的家庭,贷款首付款不得低于50%,贷款利率不得低于基准利率的1.1倍.对购买首套住房且套型建筑面积在90平方米以上的家庭,贷款首付款比例不得低于30%.”接着,4月17日,国务院又发出《关于坚决遏制部分城市房价过快上涨的通知》,提出十条举措,被称为房地产“新国十条”。
为了防止房价“回暖”,9月29日,中国人民银行、中国银行业监督管理委员会、财政部、国家税务总局、住房和城乡建设部、国土资源部、监察部又相继出台了进一步强化房地产调控的政策措施,加码房地产调控。
在这组政策“组合拳”中,其中最主要的内容是:
面向全国范围,新政策“一刀切”地规定,贷款购买首套自住房商品房,不论面积大小,首付款比例调整到30%及以上;各商业银行暂停发放居民家庭购买的三套房及
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 最小二乘法 分析 我国 房价 主要 影响 因素