SPS回归分析.docx
- 文档编号:9189255
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:41
- 大小:117.78KB
SPS回归分析.docx
《SPS回归分析.docx》由会员分享,可在线阅读,更多相关《SPS回归分析.docx(41页珍藏版)》请在冰豆网上搜索。
SPS回归分析
摘要
近几年,随着金融市场的不断发展和完善,金融业也出现欣欣向荣的景象,尤其是在2014年提出的“新常态”的经济环境下,金融业的发展又面临着新的机遇。
新常态的典型特征就是经济增速放缓,GDP已经处于中高速,其实是一个中速的区间,我们从2012年3月份GDP跌破8%以后到现在为止2014年已经两年半的时间在8%以下运行,这就成为一种新常态。
本文从金融业上市公司的研究现状、研究目的及意义入手,基于金融业上市公司的财务指标及股票的经济指标,选取并筛选主要的分析指标,运用实证分析来评价各个上市公司以及银行、证券、保险行业的发展情况,最后总结出发展前景好的行业与有投资价值的上市公司,为投资者的理性投资提供相应的理论依据。
因此,分析金融业经济环境现状,是否具有投资可行性,以及各股的发展潜力,对于理性投资者有着重要意义。
本文在写作前查阅了大量有关金融业上市公司的资料,大量、全面的引用了证券之星所公开的2014年第三季度金融业上市公司的相关数据,对金融业上市公司股票进行描述,然后通过选取10个指标以回归分析、因子分析和K均值聚类为主体方法,利用SPSS软件,对金融业上市公司现状进行打分、排名、分类以及评价,并且给出相应的是否具有可投资性的相关政策建议,为我国投资者能更理性的决定投资方案提供理论依据。
关键字:
金融业财务指标回归分析因子分析K均值聚类分析
Abstract
Inrecentyears,withthecontinuousdevelopmentandimprovementoffinancialmarkets,thefinancialsectoralsoappearsthrivingscene,especiallymadein2014underthe"newnormal"economicenvironment,thedevelopmentofthefinancialindustryisfacedwithnewopportunities.Atypicalfeatureisthenewnormaleconomicslowdown,GDPhasbeeninthehigh-speed,infact,isamediumspeedrange,fromMarch2012afterGDPfellbelow8%in2014uptonowhasbeentwoandahalfhoursin8%lesstorun,whichhasbecomeanewnorm.
Thispaperstudiesthefinancialindustryfromthecurrentsituationoflistedcompanies,thepurposeandsignificanceofthestart,basedontheeconomicindicatorsofthefinancialsectorandfinancialindicatorslistedcompanystocks,selectedandscreenedforthemainanalysisindicators,usingempiricalanalysistoevaluatevariouslistedcompaniesaswellasbanks,securities,thedevelopmentoftheinsuranceindustry,andconcludedthatthedevelopmentprospectsoftheindustryandhavegoodinvestmentvalueoflistedcompanies,providethetheoreticalbasisforrationalinvestmentinvestors.
Therefore,analysisoftheeconomicstateofthefinancialindustryenvironment,whethertheinvestmentfeasibility,anddevelopmentpotentialofeachstock,hasanimportantsignificanceforrationalinvestors.Checkoutthisarticlebeforewritingalotaboutfinancialinformationoflistedcompanies,alarge,comprehensivedatacitedinthethirdquarter2014financialsecuritieslistedcompaniesdisclosedStar,sharesoflistedcompaniesinthefinancialsectoraredescribed,andthenByselecting10indicatorsregressionanalysis,factoranalysisandK-meansclusteringasthemainmethodusingSPSSsoftware,thestatusoflistedcompaniesinthefinancialsectorscoring,ranking,classificationandevaluation,andwhethertogivetheappropriateinvestmentofrelevantpolicyrecommendations,provideatheoreticalbasisforourinvestorstomorerationaldecisionsinvestmentprograms.
Keywords:
FinancialIndustryFinancialIndicatorsRegressionanalysis
FactoranalysisK-meansclusteringanalysis
第1章绪论
1.1研究背景
金融业,是指经营货币信用业务的行业,它包括银行业、保险业、信托业、证券业和租赁业。
金融业具有指标性、垄断性、高风险性、效益依赖性和高负债经营性的特点。
在中国,指标性是指金融的指标数据从各个角度反映了国民经济的整体和个体状况,金融业是国民经济发展的晴雨表。
垄断性一方面是指金融业是政府严格控制的行业,未经中央银行审批,任何单位和个人都不允许随意开设金融机构;另一方面是指具体金融业务的相对垄断性,信贷业务主要集中在四大商业银行,证券业务主要集中在国泰、华夏、南方等全国性证券公司,保险业务主要集中在人保、平保和太保。
高风险性是指金融业是巨额资金的集散中心,涉及国民经济各部门。
单位和个人,其任何经营决策的失误都可能导致“多米诺骨牌效应”。
效益依赖性是指金融效益取决于国民经济总体效益,受政策影响很大。
高负债经营性是相对于一般工商企业而言,其自有资金比率较低。
在现代金融业中,各类银行占有主导地位。
从1979年起,中国开始对金融业进行体制改革。
中国人民银行摆脱了具体的工商信贷业务,开始行使中央银行的职能;国家专业银行逐一成立;保险公司重新成立并大力发展国内外业务;股份制综合性银行和地区性银行开始建立;信托投资机构大量发展;租赁公司、财务公司、城市信用合作社、合作银行、证券公司、证券交易所、资信评估公司、中外合资银行、外资银行等都得到一定程度的发展,形成一个以专业银行为主体,中央银行为核心,各种银行和非银行金融机构并存的现代金融体系。
1.2研究现状
2014年,我国提出“新常态”这一概念,所谓新常态即中国的政治、经济进入新的发展阶段。
中国经济呈现出新常态,从高速增长转为中高速增长,经济结构优化升级,从要素驱动、投资驱动转向创新驱动。
当前新常态的态势对中国金融业所处的经营环境有重要影响。
在新常态下,经济增速放缓,然而过去长期以来都是在一种高速增长的态势之下开展金融业务,当速度减缓不仅使原来的客户群发生重大变化,而且对资产质量也会产生一些影响;产业增速下降,驱动力转换,产业结构开始转向服务业为主,然而金融机构长期以来习惯于为制造业服务,但是现在产业结构、经济结构发生重大变化,对金融业也会产生很大的影响;从一个很长的时间段来看,中国的货币政策是宽松的,现在相对宽松的货币政策已经进入稳健的新常态。
2014年10月份M2已经降到12.6%,最近连续几个月低于15%的增速在运行,这个态势也是非常清晰的。
随着利率的市场化、汇率市场化,定价机制在逐步推进,对金融机构特别银行来说利差存在着缩小的趋势。
新的竞争者加入带来市场竞争格局的变化,互联网金融以及新的各种形态的类似金融机构,比如小贷公司、融资租赁公司、典当行、资本管理公司等等,还有商业保理公司,这些新进入者的加入,无形之中增加了银行的竞争者。
总之,我国金融业在新的机遇和挑战面前还有更大的发挥空间,而且越来越多的学者致力于研究金融市场的发展,他们从不同角度更深层次的剖析中国经济环境以及股票市场的完善,使金融业更稳健的前行。
1.3研究目的及意义
金融业对于很多人来说都是黄金行业,是挣钱最多、最快的行业,那么如何客观、准确地评价金融业上市公司的好坏以及投资可行性,分析各股的发展水平差异以及造成差异的主要原因,以至于为投资者能更理性的决定投资策略提供相应理论依据,进而促进我国股票市场资源的合理配置具有重要的理论和实践意义。
通过对选取的金融业上市公司财务指标的分析来了解上市公司的投资价值以及各指标对股票行情的影响,并判断出公司的发展前景及盈利能力。
除此之外,对银行、证券、保险不同行业的分析还会判断出各行业之间的差距。
综合对行业和个股的分析来选择不同的投资策略,做到尽可能小的分散投资风险。
1.4研究思路及方法
基于金融业41家上市公司的财务指标来分析影响上市公司发展的财务因素,本文选取的财务指标有股票价格、每股收益、资产负债率、每股净资产、总资产周转率等等。
(1)首先利用多重线性逐步回归的方法,以股票的每股收益为因变量,其余指标为自变量,探讨对股票每股收益具有显著影响的指标因素,并说明其之间的影响关系。
(2)然后利用因子分析方法选取并筛选影响股票行情的主要财务分析指标,根据因子得分对各个股票进行排名。
(3)采取K均值聚类分析的方法,对所归纳的因子得分进行分类,再结合因子分析和聚类分析的结果,对影响股票行情的因素进行分析评价。
第2章应用方法简介
2.1回归分析
Spss的多重线性回归分析也称多元线性回归分析,是最为常用的一种回归分析方法。
多重线性回归分析涉及多个自变量,它用来处理一个因变量与多个自变量之间的线性关系,建立变量之间的线性模型并根据模型作评价和预测。
2.1.1多元线性回归分析原理
设随机变量
与一般变量
的线性回归模型为
其中,
是
个未知参数,
称为回归常数,
称为回归系数。
称为被解释变量(因变量),
是
个可以精确测量并控制的一般变量,称为解释变量(自变量)。
建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:
(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;
(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;
(3)自变量之间应具有一定的互斥性,即自变量之间的相关程度不应高于自变量与因变量之间的相关程度;
(4)自变量应具有完整的统计数据,其预测值容易确定。
[12]
为了方便地进行模型的参数估计,对回归方程进行如下基本假定:
(1)解释变量
是确定的变量,不是随机变量,且要求
。
这里的
,表明设计矩阵
中的自变量列之间不相关,样本量的个数应大于解释变量的个数,
是一个满秩矩阵;
(2)随机误差项具有零均值和等方差;
(3)正态分布的假定条件为:
。
2.2因子分析
因子分析是多元统计分析的一个重要分支。
它是将具有一定相关关系的多个变量综合为数量较少的几个因子,研究少数几个内在的独立因子是如何影响一组具有错综复杂关系的实测指标,不仅可以减少分析指标,还可以尽可能地减少原指标所包含信息的损失,从而对所收集的资料进行全面的分析,达到浓缩数据的目的。
它对原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据,然后通过旋转使得因子变量更加具有可解释性,命名清晰性高。
2.2.1因子分析的基本原理
假定:
有
个样本,每个样本有
个变量,构成一个
阶的数据矩阵:
当
较大时,在
维空间中考察问题比较麻烦。
这就需要进行降维处理,即用较少几个综合指标代替原来的指标,而且使这些综合指标既能尽可能多地反映原来指标所反映的信息,同时他们之间又是彼此独立的。
线性组合:
记
为原变量指标,
(
)为新变量指标(主因子),则其线性组合为:
其中,
是原变量在各个主因子上的载荷,
与
是无关。
无论是哪种因子分析方法,其相应的因子解都不是唯一的,主因子解仅仅是无数因子解中的一个。
是
的一切线性组合中方差最大的,
是
不相关的
的所有相性组合中方差最大的。
则有,新变量指标
分别称为原变量指标的第一、第二、…主因子。
为因子变量或公共因子,可以理解为在高维空间中相互垂直的
个坐标轴。
因子分析的实质就是确定原来变量
(
)在各主因子
(
)上的载荷
。
[9]
2.2.2因子分析的步骤
第一步,确定待分析的原有若干变量是否适合进行因子分析。
因子分析是众多的原始变量中重构少数几个具有代表意义的因子变量的过程。
其潜在的要求是原有变量之间要具有比较强的相关性。
因此,因子分析需要进行相关分析,计算原始变量之间的相关系数矩阵。
相关系数矩阵为:
其中
。
如果相关系数矩阵在进行统计检验时,大部分相关系数均小于0.3且未通过检验,则这些原始变量就不太适合进行因子分析。
[10]
在因子分析中还有几种判定是否适合利用因子分析的检验方法,本文将会应用到的有两种:
一是Bartlett检验。
该检验以变量的相关系数矩阵作为出发点,它的零假设
为相关系数矩阵是一个单位阵,即相关系数矩阵对角线上的所有元素都为1,而所有非对角线上的元素都为0,也即原变量两两不相关。
Bartlett检验的统计量是根据相关系数矩阵的行列式得到的。
如果该值较大,且其对应的相伴概率值小于指定的显著水平,那么就应拒绝零假设
,认为相关系数不可能是单位阵,也即原始变量存在相关性。
二是KMO检验。
KMO值介于0-1之间,越接近1,表明所有变量之间简单相关系数平方和远大于偏相关系数平方和,越适合因子分析。
第二步,构造因子变量。
因子分析中很多确定因子变量的方法,如基于主成分模型的主成分分析和基于因子分析模型的主轴因子分析、极大似然法、最小二乘方法等。
本文正是应用主成分分析法。
该方法通过坐标变换,将原有变量做线性变化,转换为另外一组不相关的变量
(主因子)。
求相关系数矩阵的特征根
(
)和相应的标准正交的特征向量
;根据相关系数矩阵的特征根,即公共因子
的方差贡献(等于因子载荷矩阵
中第
列各元素的平方和),计算公共因子
的方差贡献率与累计贡献率。
其中方差贡献率=
(
),累计贡献率=
(
)。
主成分分析是一个在多维坐标轴中,将原始变量组成的坐标系进行平移变换,使得新的坐标原点和数据群点的中心重合。
新坐标第一轴与数据变化最大方向对应。
通过计算特征根(方差贡献)和方差贡献率与累计方差贡献率等指标来判断选取公共因子的数量和公共因子(主因子)所能代表的原始变量信息。
公共因子个数的确定准则:
1、根据特征值得大小来确定,一般取大于1的特征值对应的一个或多个公共因子;当原变量间的相关性偏大时,可改变特征值得选取,将其选取为0.5。
2、根据因子的累计方差贡献率来确定,一般取累计贡献率在80%以上的特征值所对应的第一、第二、…、第
(
)个主因子。
第三步,因子变量的命名解释。
因子变量的命名解释是因子分析的另一个核心问题。
经过主成分分析得到的公共因子
是对原有变量的综合。
在实际的应用分析中,主要通过对载荷矩阵进行分析,得到因子变量和原有变量之间的关系,从而对新的因子变量进行命名。
利用因子旋转方法能使因子变量更具有可解释性。
计算主因子载荷,构建载荷矩阵
(
(
))。
载荷矩阵
中某一行表示原有变量
与公共因子/因子变量的相关关系。
载荷矩阵
中某一列表示某一个公共因子/因子变量能够解释的原有变量
的信息量。
有时因子载荷矩阵的解释性不太好,通常需要进行因子旋转,使原有因子变量更具有可解释性。
因子旋转的主要方法有正交旋转和斜交旋转。
正交旋转保持了坐标轴的正交性,因此使用最多。
正交旋转的方法很多,其中以方差最大化法最为常用。
方差最大化正交旋转的基本思想是:
使公共因子的相对负荷的方差值和最大,且保持原公共因子的正交性和公共方差总和不变。
可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。
因子进行斜交旋转之后,各因子负荷发生了变化,出现了两极分化。
各因子间不再相互独立,而是彼此相关;各因子对各变量的贡献的总和也发生了改变。
无论是正交旋转还是斜交旋转,因子旋转的目的就是使因子负荷两极分化,要么接近于0,要么接近于1。
从而使原有因子变量更具有可解释性。
第四步,计算因子变量得分。
因子变量确定后,对于每一个样本数据,我们希望得到它们在不同因子上的具体数据值,即因子得分。
估计因子得分的方法主要有:
回归法、Bartlett法等。
计算因子得分应首先将因子变量表示为原始变量的线性组合。
即:
回归法:
得分是由贝叶斯思想导出的,得到的因子得分是有偏的,但计算结果误差较小。
贝叶斯判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断。
Bartlett法:
Bartlett因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。
因子得分可用于模型诊断,也可用作进一步分析如聚类分析、回归分析等的原始资料。
2.3K中心聚类分析原理
聚类分析是研究事物分类的基本方法之一,通常我们所研究的指标或数据之间存在不同程度的相似性,聚类分析是采用定量数学方法,根据样品或指标的数值特征,对样本进行分类,从而辨别各样本之间的亲疏关系。
K中心聚类又称作K均值聚类,由研究者事先制定类别数K,然后不断调整分类中心,直至收敛,初始类中心的选择可以由研究者指定,也可以由程序自动给出。
K中心聚类分析属于非层次聚类法的一种。
执行过程如下:
首先进行初始化,选择(或人为指定)某些记录作为凝聚点;
接着按就近原则将其余记录向凝聚点凝集,计算出各个初始分类的中心位置(均值),用计算出的中心位置重新进行聚类,如此反复循环,直到凝聚点位置收敛为止。
分析过程中的算术方式如下:
首先逐个扫描样本,每个样本依据其与已扫描过的样本的距离,被归为以前的类,或生成一个新类;然后对第一步中各类依据类间距离进行合并;最后按一定的标准,停止合并。
另外,做因子分析还是K均值聚类分析,都需将数据标准化,以此来消除指标间数量级的差异,因此本文在开始分析前,对数据先进行了标准化处理。
第3章数据及指标的选取
3.1建立评价指标体系
财务指标是指企业总结和评价财务状况和经营成果的相对指标。
传统的业绩评价大多使用财务指标,用财务指标来评价业绩简单明了。
财务工作实践中,通过对企业财务状况和经营成果进行解剖和分析,能够对企业经济效益的优劣作出准确的评价与判断,而作为评价与判断标准的财务指标的选择和运用尤为重要。
本文所研究的是金融业上市公司的发展情况,所以选取的是有关上市公司的股票指标以及该公司的财务指标。
在有关股票方面选取的是股票价格、每股收益、每股净资产等能全面反映上市公司股票情况的指标;在有关公司方面选取的是反映经营能力的的净利润、主营业务收入、营业利润率,反映长期偿债能力的资产负债率,反映运营能力的总资产周转率。
将以上指标纳入一个有机整体中,全面地对企业经营状况、财务状况进行揭示和披露,从而对企业经济效益的优劣作出准确的判断和评价。
3.2建立数据体系
本着科学性、实用性、可操作性、可比性、可量化等原则,本文在证券之星、东方财富网站上选取了2014年第三季度金融业上市公司的财务指标以及股票数据作为研究对象,具体指标数据如表1:
表1财务指标数据
股票名称
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
东方证券
15.88
0.33
80.89
4
1.01
-0.99
142754.59
353262.12
48.76
0.05
国元证券
34.8
0.48
57.94
8.49
1.36
1.44
94273.35
218851.3
55.68
0.06
农业银行
3.7
0.47
93.99
2.95
0.99
0.2
15243900
39396600
49.81
0.03
工商银行
4.79
0.63
92.89
4.06
1.82
0.22
22046400
48858900
58.84
0.03
西部证券
44.4
0.35
75.33
4.22
0.9
2.63
42083.08
111412.62
50.65
0.07
新华保险
54.78
2.03
92.33
15.01
5.18
9.63
632500
10992500
7.01
0.19
中国银行
4.38
0.47
93.22
3.6
1.43
1.48
13113300
34633400
51.39
0.02
民生银行
9.64
1.08
93.61
6.86
2.69
2.63
3677800
9991600
49.2
0.03
建设银行
6.14
0.76
92.78
4.83
2.18
1.86
19029800
42904300
56.83
0.03
东吴证券
23.5
0.36
67.3
5.05
0.55
-0.62
77282.95
210622.92
46.37
0.07
平安银行
15.33
1.37
94.09
11.09
3.86
-0.45
1569400
5465100
38.01
0.03
北京银行
11.11
1.19
93.82
8.7
3.16
3.24
1259200
2780000
57.92
0.02
长江证券
15.83
0.26
69.72
2.82
0.67
1.24
122664.06
311139.64
50.35
0.08
宁波银行
17.94
1.59
93.92
10.05
3.96
16.64
458441.9
1108633.5
51.72
0.02
光大银行
4.68
0.5
93.29
3.7
1.16
1.59
2332200
579300
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPS 回归 分析