因子分析与聚类分析案例.docx
- 文档编号:25974137
- 上传时间:2023-06-16
- 格式:DOCX
- 页数:21
- 大小:91.21KB
因子分析与聚类分析案例.docx
《因子分析与聚类分析案例.docx》由会员分享,可在线阅读,更多相关《因子分析与聚类分析案例.docx(21页珍藏版)》请在冰豆网上搜索。
因子分析与聚类分析案例
1因子分析与聚类分析理论简介
1.1因子分析法
因子分析法是一种通过分析多个变量间协方差矩阵(或相关系数矩阵)的内部依赖关系,找出能代表所有变量的少数几个随机变量的计量分析方法。
其中,找出的几个随机变量是不可测量的,将其称为公因子。
每个公因子之间是互不相关的,所有变量都可以由这几个公因子的线性表示。
因子分析通过减少变量的数目,用少数因子代替所有变量去分析整个经济问题,大大简化了现实分析过程。
假设有N个样本,P个指标,
是随机向量,需要寻找的公因子是
,则将模型
...
称为因子模型。
将矩阵
称为因子载荷矩阵,将
称为因子载荷(Loading),因子载荷的实质是公因子Fi与变量Xj的相关系数。
其中,
为特殊因子,代表公因子以外的影响因素,在实际分析时一般忽略不计。
对于需要求出的的公因子,其实际含义取决于该公因子在哪些变量上有较大的载荷。
但一般情况下,初始因子模型的因子载荷矩阵都比较复杂,不利于因子的解释。
因此可进一步通过因子旋转,给出对各公因子更加合理明显的解释。
公因子求出后,可以进一步用回归估计等方法求出各个公因子得分的数学模型,将其表示成变量的线性形式,从而计算求出得分。
模型如下:
(i=1,2,...,m)
1.2层次聚类法
聚类分析的实质是按照距离的远近将数据分为若干个类别,以使得类别内数据的“差异”尽可能小,类别间的“差异”尽可能大。
“差异”的描述是通过距离或相似性的方法来描述。
在统计学中最常用的是距离表达式欧几里得距离,对于两条数据
和
,欧几里得距离的计算公式是:
本文应用的是聚类分析法中的层次分析法,选用的是欧几里得距离的计算方法。
层次分析法通过把距离接近的数据一步一步归为一类,直到数据数据完全归为一个类别为止,再利用一些相应的指标来确定聚为几类的结果是最为合适的。
显然,这一系列的聚类结果存在着嵌套,或者说是层次的关系,由于这种结果上的层次关系,整个分析过程,特别是每一步中完成的合并或分割都可以用一张二维空间的图形来表示,这种图被称为“树状图”,是层次聚类法结果解释的重要工具。
本文也将利用这一工具对我国商业银行竞争力水平进行研究。
2股份制商业银行竞争力的实证分析
2.1样本数据的选取和处理
一、样本选取
本文评价的是我国股份制商业银行的竞争力,以我国国有商业银行和城市商业银行的比较研究得出我国股份制商业银行竞争力的优势与劣势。
由于数据选取的局限性(在本文写作过程中,各家商业银行还未全部公布2009年年报),本文数据主要来自于各商业银行的年报数据[44]以及各家银行网站披露相关信息,因此鉴于数据搜集原因,本文采用了2008年的股份制商业银行、国有商业银行和城市商业银行的的数据。
同时由于无法获得中国光大银行、广东发展银行、恒丰银行、浙商银行和渤海银行等五家银行的财务报表(这五家股份制商业银行不是上市商业银行,非上市银行披露的数据一般不具有全面性和及时性,真实度也较差),所以本文最终研究的是7家股份制商业银行:
中信银行、华夏银行、深圳发展银行、招商银行、上海浦东发展银行、兴业银行、民生银行。
同理,本文选取了4家国有商业银行作为比较研究对象:
中国工商银行、中国银行、中国建设银行和交通银行。
考虑到已上市城市商业银行也具有一定的竞争力,在某些方面有借鉴之处,且代表了城市商业银行的新兴力量,因此将已上市的3家城市商业银行纳入股份制商业银行竞争力对比研究当中,作为比较研究对象,这3家已上市城市商业银行为:
北京银行、上海银行、南京银行。
二、指标的标准化
在指标处理前,先要对原始数据标准化,标准化后的变量为X*i,j,即第i个银行的j指标,具体的标准化如下:
对于正指标:
对于逆指标:
其中,正指标与银行竞争力得分呈正相关关系,相应的逆指标与竞争力得分成负相关关系。
标准化消除了正逆指标的影响,正指标原本越大,处理后也越大,逆指标情况则相反。
2.2实证分析
2.2.1因子分析
运用SPSS软件对原始指标数据进行实证分析,可以得到相关系数矩阵及变量共同度表,见表2.1,分析可得所有变量的共同度都比较大。
变量共同度说明了全部公因子反映出原变量信息的百分比,描述了全部公因子对变量X的总方差所做的贡献。
较大的变量共同度说明变量空间转化为因子空间时,保留了比较多的信息。
所以进行因子分析是有依据的。
表2.1变量共同度表
Tab.2.1Commonvariabledegreetable
变量
X1
X2
X3
X4
X5
X6
X7
X8
共同度
0.879
0.959
0.872
0.966
0.796
0.973
0.964
0.960
变量
X9
X10
X11
X12
X13
X14
X15
X16
共同度
0.952
0.904
0.905
0.629
0.889
0.908
0.772
0.960
变量
X17
X18
X19
X20
X21
X22
X23
X24
共同度
0.960
0.970
0.977
0.888
0.839
0.946
0.846
0.699
变量
X25
X26
共同度
0.628
0.925
对SPSS软件产生的总方差分析表进行整理,可以得到表2.2的各因子对原始指标数据的贡献率。
表2.2因子分析特征值及方差贡献率表
Tab.2.2Eigenvalueandvariancecontributionoffactoranalysistable
因子
特征值
方差贡献率(%)
累计贡献率(%)
F1
7.258
27.916
27.916
F2
4.930
18.960
46.876
F3
2.898
11.145
58.021
F4
2.788
10.722
68.743
F5
2.767
10.644
79.387
F6
2.323
8.936
88.323
由上表2.2可知,因子F1~F6对原始指标数据的累计贡献率达到88.323%,超过了85%的标准,其特征值也较大,均超过1的标准;同时,因子中F1的方差贡献率最大,为27.916%,其次是F2,为18.960%,说明因子F1和F2是银行竞争力因素中更重要的因素。
通过SPSS软件产生的碎石图可以更直观的挑选出特征值较大的因子,从第F7开始,折线趋于平缓。
因此,我们选择Fl~F6作为决定商业银行竞争力的公因子。
图2.1碎石图
从SPSS软件我们可以得到因子F1~F6的载荷矩阵
。
因子载荷
是实际上就是公因子Fi和变量Xj的相关系数,表示变量Xj依赖因子Fi的程度,反映变量Xj对于公因子Fi的重要性。
因此,因子载荷
的绝对值越大,表示变量Xj对公因子Fi越重要。
通过正交旋转得到的因子载荷矩阵,即表2.3,可以进一步明确因子的具体意义。
表2.3正交旋转后的因子载荷矩阵
Tab.2.3Orthogonalrotatedfactorloadingmatrix
指标
因子
1
2
3
4
5
6
资产利润率X1
0.220
0.741
0.167
0.500
0.046
0.016
净资产收益率X2
0.007
-0.074
-0.058
0.970
0.076
0.060
每股收益X3
-0.268
-0.052
0.185
0.862
-0.001
0.140
人均利润率X4
-0.308
0.593
0.016
0.563
-0.447
-0.051
营业费用率X5
0.471
0.603
0.049
0.031
-0.437
-0.123
资本充足率X6
0.020
0.962
-0.066
-0.153
-0.113
0.074
核心资本充足率X7
0.086
0.955
-0.014
-0.198
-0.064
0.011
不良贷款率X8
-0.672
-0.177
0.658
0.089
-0.137
0.133
贷款损失准备率X9
0.508
0.354
-0.692
0.297
-0.040
-0.028
最大客户贷款比率X10
0.110
-0.137
0.046
0.083
0.928
-0.049
十大客户贷款比率X11
0.355
-0.215
-0.015
0.017
0.823
-0.236
人民币流动性比率X12
-0.322
0.468
-0.156
0.095
-0.413
-0.319
外币流动性比率X13
-0.118
0.873
0.079
0.053
-0.107
0.303
存贷比X14
0.757
0.469
0.006
-0.264
-0.157
0.142
现金资产比率X15
-0.429
0.013
-0.235
-0.175
0.452
-0.546
总资产X16
0.919
-0.047
-0.192
-0.088
0.179
-0.191
机构网点数X17
0.919
-0.047
-0.192
-0.088
0.179
-0.191
存款份额X18
0.935
-0.132
-0.180
0.004
0.193
-0.091
贷款份额X19
0.925
-0.159
-0.198
0.014
0.204
-0.118
存款增长率X20
-0.169
0.161
0.896
0.102
0.113
0.079
贷款增长率X21
-0.487
0.310
0.667
0.084
0.004
0.233
股权集中程度X22
-0.507
0.011
0.204
0.015
-0.156
0.789
股东集中程度X23
-0.137
0.220
0.006
0.108
-0.004
0.876
流通股占比X24
-0.583
-0.316
0.269
0.179
-0.204
0.336
非利息收入占比X25
0.234
0.109
-0.507
-0.392
0.388
-0.001
本科以上学历员工占比X26
-0.856
-0.252
0.247
0.164
0.098
-0.175
根据上表,得到因子模型:
X1=0.220F1+0.741F2+……+0.046F5+0.016F6
X2=0.007F1—0.074F2+……+0.076F5+0.060F6
……
X24=0.234F1+0.109F2+……+0.388F5—0.001F6
X25=-0.856F1—0.252F2+……+0.098F5—0.175F6
从因子模型可以看出,因子F1的总资产、机构网点数、存款份额、贷款份额、本科学历以上员工占比、存贷比的系数分别为0.919、0.919、0.935、0.925、0.856、0.757,远大于其他变量的系数,所以因子F1主要是代表银行规模、市场占有率、人力资源以及流动性的因子;因子F2的资本充足率、核心资本充足率、外币流动性比率、资产利润率、人均利润率、营业费用率的系数分别为0.962、0.955、0.873、0.741、0.593、0.603,大于其他变量的系数,所以因子F2主要代表的是资本充足度、流动性和盈利性因子;因子F3的存款增长率、贷款增长率、不良贷款率、贷款损失准备率、非利息收入占比的系数分别为0.896、0.667、0.658、0.692、0.507,远大于其他变量的系数,所以F3主要反映银行的市场份额增长率、资产质量以及创新能力;因子F4的净资产收益率、每股收益的系数分别为0.970、0.862,显著大于其他变量的系数,所以F4主要反映银行的盈利性;因子F5的最大客户贷款比例、十大客户贷款比例的系数分别为0.928、0.823,远大于其他变量的系数,所以F5主要代表银行的贷款集中度;因子F6的股权集中程度、股东集中程度的系数分别为0.789、0.876,远大于其他变量的系数,所以F6主要反映银行公司治理情况。
公因子求出后,考察各公因子的得分。
SPSS会自动计算出公因子得分,保存在fac_1~fac_6中,六个公因子分别从不同方面反映了银行竞争力各因素的情况,但单独使用某一公因子并不能对各银行竞争力水平做出综合评价,因此按各公因子对应的方差贡献率为权数计算如下综合统计量:
(n=6)
即:
F=0.279F1+0.190F2+0.111F3+0.107F4+0.106F5+0.089F6
银行的各因子得分及排名见下表。
表2.4商业银行因子得分及排名
Tab.2.4Factorscoreandrankingofcommercialbanks
银行名
因子1
得分
因子1的排名
因子2
得分
因子2的排名
因子3
得分
因子3的排名
工商银行
2.18983
1
-0.24532
8
-0.09041
7
中国银行
1.13283
3
0.02315
5
-0.94866
13
建设银行
1.76484
2
-0.04068
6
-0.02338
6
交通银行
-0.14099
7
-0.20014
7
-0.4388
11
招商银行
-0.09822
5
-0.32428
9
0.68431
4
中信银行
-0.82277
12
0.28152
4
-0.12563
8
民生银行
-0.85693
13
-0.97866
13
-0.59454
12
浦发银行
-0.71292
11
-0.53027
11
0.11678
5
兴业银行
-0.1253
6
-0.4507
10
0.87571
3
华夏银行
-1.04028
14
-0.66072
12
-2.26567
14
深发展行
-0.32905
8
-1.55653
14
1.65166
1
北京银行
0.15253
4
1.13645
2
-0.22753
10
南京银行
-0.49264
9
2.41827
1
-0.14567
9
宁波银行
-0.62091
10
1.12792
3
1.53183
2
表2.5商业银行因子得分及排名
Tab.2.5Factorscoreandrankingofcommercialbanks
银行名
因子4
得分
因子4的排名
因子5
得分
因子5的排名
因子6
得分
因子6的排名
工商银行
-0.04311
6
0.51567
5
0.78859
2
中国银行
-0.60859
13
0.58136
4
-1.55993
13
建设银行
0.16654
4
-0.1077
10
-0.28429
11
交通银行
-0.05892
7
0.64393
3
0.69883
4
招商银行
1.00492
3
-0.43634
12
0.50806
7
中信银行
-0.19281
8
-0.01838
9
-2.47827
14
民生银行
-0.4087
9
-0.21342
11
0.93063
1
浦发银行
2.16395
1
0.20589
8
-0.83218
12
兴业银行
1.37856
2
0.47843
6
0.60015
6
华夏银行
-0.48998
10
0.25761
7
0.66504
5
深发展行
-1.99109
14
-0.60695
13
-0.14231
10
北京银行
0.14706
5
-3.06818
14
0.2197
8
南京银行
-0.49457
11
0.72477
2
0.72011
3
宁波银行
-0.57325
12
1.0433
1
0.16587
9
表2.6商业银行因子得分及排名
Tab.4.7Factorscoreandrankingofcommercialbanks
银行名
综合得分
综合排名
工商银行
0.67547
1
中国银行
0.072138
7
建设银行
0.463351
2
交通银行
-0.00154
8
招商银行
0.094066
6
中信银行
-0.43441
11
民生银行
-0.47441
12
浦发银行
-0.10698
10
兴业银行
0.229527
5
华夏银行
-0.63387
14
深发展行
-0.4937
13
北京银行
-0.05848
9
南京银行
0.393206
3
宁波银行
0.275644
4
1.1.1聚类分析
通过因子分析,我们得出了影响银行竞争力的主要因素,即公共因子,以及各银行的因子得分及其排名,即各银行间竞争力差异。
为进一步分析股份制银行与其它两类银行的竞争力差异,我们又以因子分析当中的六个公因子进行聚类分析。
在以上因子分析的基础上,我们利用六个主成分因子作为聚类变量,通过SPSS软件对我国商业银行进行聚类分析(见图2.2)。
从聚类变量图可以看出:
首先,招商银行、兴业银行、浦发银行聚到一起,成为A小类;交通银行、民生银行、华夏银行在一起成为B小类;工商银行、建设银行、中国银行聚到一起成为C小类;南京银行、宁波银行聚在一起成为D小类;其次,A小类与B小类再聚成一类E,再与C小类聚在一起,成为一类F;中信银行、深发展行、北京银行各成一小类。
依据该图形,我们就可以把我国商业银行竞争力水平分为五大层次。
第一层:
工商银行、建设银行、中国银行。
第二层:
南京银行、宁波银行。
第三层:
招商银行、兴业银行、浦发银行。
第四层:
交通银行、民生银行、华夏银行。
第五层:
中信银行、深发展行、北京银行与其它银行竞争力水平均不相似,各自具有不同的竞争力水平。
按更大类型分又可以分为四层。
第一层:
工商银行、建设银行、中国银行。
第二层:
南京银行、宁波银行。
第三层:
招商银行、兴业银行、浦发银行、交通银行、民生银行、华夏银行。
第四层:
中信银行、深发展行、北京银行。
图2.2商业银行竞争力水平聚类变量图
Fig2.2Levelofcompetitivenessofcommercialbanksinthevariablegraphcluster
1.2结果及其成因分析
1.2.1因子得分及其成因分析
一、因子F1得分及其成因分析
在反映银行规模、市场占有率、人力资源以及流动性的因子F1上,工商银行、建设银行、中国银行这三家国有商业银行的得分分别为2.190、1.765、1.133,排名前三,中信银行、民生银行、华夏银行这三家股份制商业银行的得分分别为-0.823、-0.857、-1.040居末三位。
因子F1对银行综合竞争力的方差贡献率达到27.92%,远超出其它因子的方差贡献率,成为银行综合竞争力的最重要影响因素。
参照原始指标数据,国有商业银行在总资产以及存贷款市场占有率分别为51.03%、57.97%和48.9%,几乎占有一半的市场,较股份制商业银行具有绝对优势,因此三家国有商业银行在因子F1上排名靠前。
人力资源方面,相对于股份制商业银行以及城市商业银行说来国有商业银行员工中,高学历水平员工人数比较少,其本科以上学历员工占比平均为44.47%,股份制商业银行本科以上学历员工占比平均为70.79%,但在F1排名中却很靠后,说明在我国当下阶段,人力资源对我国商业银行竞争力影响作用有限,银行规模以及市场占有率是银行综合竞争力的最重要影响因素。
同时,考察原始指标数据,股份制商业银行存贷比普遍很高,其中中信银行的存贷比为73.29%,民生银行为75%,而75%是我国银监局设定的存贷比监管比例,说明这两家银行存在很大的流动性风险,成为其在因子F1上排名靠后的主要原因。
而北京银行的存贷比在各家银行中几乎是最低的,得益于此,其在F1上排名也较靠前。
综上所述,在我国当下阶段,人力资源对我国商业银行竞争力影响作用有限,银行规模以及市场占有率是银行综合竞争力的最重要影响因素。
因此,股份制商业银行需要扩大其规模及其市场占有率,同时需要控制其流动性风险,尤其是降低存贷比率,以提高其竞争力。
二、因子F2得分及其成因分析
在反映资本充足度、流动性和盈利性的因子F2上,南京银行、北京银行与宁波银行的得分分别为2.418、1.137、1.128,分列前三,而华夏银行、民生银行、深圳发展银行的得分分别为-0.661、-0.979、-1.557,列末三位,国有商业银行排名也比较靠前。
因子F2对银行综合竞争力的方差贡献率达到18.96%,说明银行资本充足率以及流动性管理能力是商业银行竞争力的又一重要影响因素。
参照原始指标数据,我国城市商业银行和国有商业银行资本充足率指标都较好,均值分别为19.98%、13.03%,股份制商业银行资本充足率指标都较低,其中民生银行和深圳发展银行资本充足率分别为9.22%、8.58%,刚超出8%的资本充足率监管标准,因此,我国城市商业银行和国有商业银行在因子F2的排名上靠前,而股份制商业银行排名则靠后。
流动性方面,华夏银行和深圳发展银行的外币流动性的指标值很小,分别为67.87%和49.68%,说明其具有较大的外币流动性风险,需要加强流动性风险管理,这也导致其在因子F2上的排名靠后。
由于F4对各银行盈利性分离的更加明显,因此将在下部分做详细分析。
因此,股份制商业银行急需提高资本充足度,以提高其竞争力。
具体看来,由资本充足率的计算公式可知,资本充足率的决定因素可以分为分母和分子方面,分母方面主要是风险加权资产的高低,分子方面主要是银行资本大小、附属资本大小、银行的盈利能力高低,以下将从这几方面具体揭示股份制商业银行资本资本充足度低的原因所在。
风险加权资产表示的是银行的资产质量,长期以来,贷款业务一直是银行的主要资产业务,虽然近些年来各银行相继开展了一些创新业务,但总体说来,信贷资产所占的比重依然较高。
我国股份制商业银行相应的平均不良贷款率为1.17%,相对于国有商业银行均值的平均不良贷款率2.27%则显得较低,但由于贷款业务的重要性,股份制商业银行仍需继续加强贷款业务的管理。
由原始指标数据可知,我国股份制商业银行平均资
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 聚类分析 案例