多元统计分析课程毕业论文文档格式.docx
- 文档编号:16801993
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:18
- 大小:33.82KB
多元统计分析课程毕业论文文档格式.docx
《多元统计分析课程毕业论文文档格式.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程毕业论文文档格式.docx(18页珍藏版)》请在冰豆网上搜索。
(1)uiui~1(i=1,2,…,P)0
(2)Yi与Yj相互无关。
(i=j;
i,j=1,2/,p0
(30Yi是Xi,X2,…,Xp的所有线性组合中方差最大者;
丫2是与Yi不相关的Xi,X2,…,Xp的所有线性组合中方差最大者;
…,Yp是与Yi,Y2,…,Yp」不相关的Xi,X2,…,Xp的所有线性组合中方差最大者。
基于以上这三条原则决定综合变量Yi,丫2,…,Yp分别称为原始变量的第一,第二……第p个主成分。
其中,各综合变量在总方差所占比重依次递减。
在实际研究工作中,通常指挑选前几个方差较大的主成分,从而达到简化系统结构,抓住问题实质的目的。
4.2因子分析的基本理论
设有n个样品,每个样品观测p个指标,这些p个指标之间有较强的相关性。
为了方便研究,并消除由观测量纲的差异及数量级不同所造成的影响,将样本的观测数据进行标准化处理,使标准化的变量均值为0,方差为i。
为方便,把原始变量及标准后的变量向
量均用X表示,用Fi,F2,…,Fm(m<
p表示标准化的的公因子。
如果:
(10X=(Xi,X^,Xp)•是可观测随机变量,且均值向量E(X)=0,协方差矩阵
cov(X0='
:
且协方差矩阵V与相关阵R相等;
(20F-(Fi,F2/,Fm)(m<
p)是不可观测变量,其均值向量E(F)=0,协方差矩阵
(30
cov(F)二I,即向量F的各分量是相互独立的;
=(;
i,②…,;
p)■与F相互独立,且E(0=0,;
的协方差矩阵a是对角方阵:
cov(;
)八;
=
2
11
「J
r2
即;
的各分量之间也是相互独立的,则模型:
称为因子模型,模型的矩阵形式为:
其中A称为因子载荷矩阵,而在因子模型中,公共因子的个数少于原始变量的个数,且公共因子是不可观测的隐变量,载荷矩阵A不可逆,因而不能直接求得公共因子用原始变量表示的精确线性组合。
解决该问题的一种方法是用建立回归思想求出线性组合系数的估计值,即建立如下以公共因子为因变量、原始变量为自变量的回归方程:
Fj二」Xi「2X2」Xpj=1,2,…,m
此处因为原始变量与公共因子变量均为标准化量,因此回归方程中没有常数项。
在最小二
乘意义下,可以得到F估计值:
式中,A为因子载荷矩阵;
R原始变量的相关阵;
X为原始变量向量。
这样,在得到一组样本值之后,就可以带入上面的关系式求出公共因子的估计得分,从而用少数的公共因子去描述原始变量的数据结构,用公共因子得分去描述原始变量的取值,在估计出公共因子得分后,可以利用因子得分去进行进一步分析,如样本点的聚类分析,当因子数m较少时,
还可以方便地把各样本点在图上表示出来,直观地描述样本分布情况,从而便于把研究工作引向深入。
五、模型的求解与检验
5.1工业行业经济效益的综合指标确定
由主成分模型的基本原理可得,利用SPSS(19.0)软件对中国国有工业行业的经济效益指标进行主成分分析得到下表1、2:
TotalVarianceExplained
Compon
ent
InitialEigenvalues
ExtractionSumsof
SquaredLoadings
RotationSumsofSquared
Loadings
Tota
l
%of
Varianc
e
Cumulat
ive%
Total
1
3
4
5
2.68
1.18
.630
.376
.126
53.669
23.685
12.593
7.527
2.525
77.354
89.948
97.475
100.000
2.683
1.184
2.443
1.039
1.015
48.868
20.773
20.307
69.641
ExtractionMethod:
PrincipalComponentAnalysis.
表1解释总方差表
RotatedComponentMatrix
总资产贡献率X1(%
.946
.037
-.071
资产负债率X2(%
-.847
.085
.159
流动资产周转次数X3(次/年)
.050
.976
-.172
成本费用利润率X4(%
.892
.211
-.154
产品销售率X5(%
-.180
-.183
.965
表2旋转过后的主成分矩阵
由上表可得,我们选取的5个经济效益指标被提取出了3个主成分,提取的3个主成分
集中了5个原始量信息的89.948%。
能够很好的反映5个经济效益指标。
故三个公因子表示
为:
其中乙为原始变量的相应标准化变量。
第一主成分对原始变量的贡献率为48.868%,
第二主成分的贡献率为20.773%,第三个主成分对原始变量的贡献率为20.307%,其累计贡献率为89.948%,结果表明前三个个主成分提取了原始变量的绝大部分信息。
由上可知,
第一主成分中Zi、Z2和乙的系数绝对值较大,第二主成分中Z3的系数绝对值较大,第三个成分中Z5的系数绝对值较大。
因此,第一主成分主要由总资产贡献率、资产负债率和工业成本费用利润率组成,第二主成分主要由流动资产周转次数和产品销售率组成。
因此,第一个公因子主要由“总资产贡献率”、“资产负债率”、“成本费用利用率”组成,该三个指标主要反映一个行业的盈利能力,所以第一个综合指标可以表示为“盈利能力”,第二
个公因子可得主要反映行业的运行能力,第二个综合指标可以表示为“行业运行能力”,
第三个综合指标可以表示为“市场能力”。
我们把5个影响行业的经济效益的自变量最终用3个综合指标进行表示,接下来我们利用这三个综合指标对每个行业进行综合评价。
5.2基于因子分析的经济效益的综合评价
利用SPS(19.0)软件对中国国有工业行业的经济效益指标进行因子分析得到每个行业的经济效益的最终评分,得到下表KM创球形Bartlett检验结果:
KMOandBartlett'
sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.684
Bartlett'
sTestof
Approx.Chi-Square
83.527
Sphericity
df
10
Sig.
.000
表3KMO口Bartlett检验
首先巴特利特球度检验表明:
巴特利特球度统计量值为83.527,显着性水平少于0.001,即拒绝相关系数矩阵是一个单位阵的原假设。
KMO统计量为0.684,表明简单相关系数平方和远大于偏相关系数平方和,比较适合做因子分析2。
为了能够计算出各行业的因子得分,我们需要将公共因子表示成原始变量的线性组合。
公共因子对原始变量基于最小二乘法的最优线性估计为:
F=atraz
(2)
其中A为利用“最大方差法”旋转后的因子载荷矩阵,R为样本相关系数矩阵,Z为标准化
原始指标向量。
按照
(2)式,估计出三个个公因子的因子得分表达式为:
Fi=0.946Zi—0.847Z20.05Z30.892Z^0.I8Z5
讦2=0.037乙+0.085Z2+0.976Z3+0.211Z4-0.183Z5(3)
f3=-0.070+0.159Z2-0.172Z3-0.154Z4+0.965Z5
各行业经济效益的综合指标得分:
Soccer=48.868/89.948*F1+20.713/89.948*F2+20.307/89.948*F3(4)
按照计算的综合指标得分公式,算出了如下的最终综合评价得分表:
工业行业
市场能力F1
行业运行能力F2
市场能力F3
总得分(Socer)
石油和天然气开采业
烟草制品业
其他采矿业
黑色金属矿采选业
饮料制造业
有色金属矿采选业
家具制造业
石油加工、炼焦及核燃料加工业
电力、热力的生产和供应业
煤炭开采和洗选业
皮革、毛皮、羽毛(绒)及其制品业
印刷业和记录媒介的复制
金属制品业
黑色金属冶炼及压延加工业
有色金属冶炼及压延加工业
非金属矿采选业
交通运输设备制造业
医药制造业
燃气生产和供应业
-0.006052878
化学原料及化学制品制造业
文教体育用品制造业
-0.04804615
仪器仪表、文化、办公机械制造业
农副食品加工业
食品制造业
塑料制品业
0.002260768
非金属矿物制品业
电气机械及器材制造业
纺织服装、鞋、帽制造业
橡胶制品业
废弃资源和废旧材料回收加工业
化学纤维制造业
通信设备、计算机及其他电子设备制造业
工艺品及其他制造业
通用设备制造业
纺织业
造纸及纸制品业
专用设备制造业
水的生产和供应业
木材加工及木、竹、草等制品业
表4工业行业的因子得分及综合得分
根据上述公式
(2)、(3)和(4),计算出工业主要行业的因子得分及排名(由高到低进行排列)见上表4所示,其中可知石油和天然气开采业、烟草制品业和黑色金属矿采选业等行业的经济效益最高;
而其他采矿业、橡胶制品业和纺织业等行业的经济效益最低。
根据上表4,我们可以对39个工业行业的盈利能力、行业的运行能力及市场能力进行分类5.3行业的聚类分析
我们已经对各工业行业进行了综合评价,为了验证评价的客观性和可靠性,本文采用聚类分析加以验证,其主要思想和依据:
如果经济效益高的行业自然会成为一类,经济效益差的行业会成为一类,如果聚类分析能够验证这个结论,则说明我们的综合评价具有一定的可靠性。
本文用欧式距离来度量样本之间的距离,用瓦尔德法测度来类与类之间的距离,将39个行业分为四类:
第一类:
石油和天然气开采业、烟草制造业。
第二类:
黑色金属矿采选业、有色金属矿采选业、非金属矿采选业、饮料制造业、皮革毛皮羽毛(绒)及其制品业。
第三类:
印刷业和记录媒介的复制、文教体育用品制造业、医药制造业、仪器仪表及文化与办公用机械制造业、水的生产和供应业。
第四类为其它行业。
结合表4中行业的综合经济效益可知:
聚类分析中第一类为经济效益最好的两个行业,第二类中除水的生产和供应业和文教体育用品制造业的综合排名较后,分别为26和30名,
而它们在盈利能力的排名分别是13名和14名。
仪器仪表及文化与办公用机械制造业排在第13名,其它行业的经济效益均排在前十名。
即聚类分析中的第二类为经济效益较好的行业,第三类为经济效益较差的行业。
因此,聚类分析基本验证了基于因子分析的综合评价模型,说明表4中所示的综合评价比较合理。
图1聚类树状图
六问题的思考及政策建议
6.1问题思考
一个企业或行业的经济效益由众多因素来刻画,目前反映行业经济效益主要有总资产贡献率、资产负债率、流动资产周转次数、工业成本费用利润率和产品销售率等五个经济指标。
这些众多指标虽然能从多方面对行业的经济效益进行全面考察,但也在一定程度增加了分析问题的复杂性。
在损失少量信息的前提下,设计一个或少数几个综合指标,并用较少的综合指标对工业经济效益进行分析评价,能够简化问题。
此外,挖掘出反映经济效益的众多指标的内在基本结构,有助于指出各行业经济效益的主要决定因素及瓶颈,也有助于对各行业经济效益进行综合评价。
所以如何对一个企业的经济效益的评价对当下的企业和全国的经济增长有着直接的作用,如何去发展一个企业的经济也是至关重要的,对当下企业的经济效益有一定的益处。
6.2政策建议本文以2008年中国国有及国有控股行业进行较为深入的分析与研究,据此提出以下几点建议:
一.在我国国有及国有控股工业行业中,各行业的经济效益及其潜在的优势和劣势不尽相同。
政府部门在扶持行业的发展时,应该同时考虑现阶段行业的优势和劣势,做到强者更强,弱者不弱。
二.尽管分析表明,行业经济效益的主要因子是行业的盈利能力(占比53.65%),但政府部门在决定支持行业的发展时不能只着重行业的盈利能力。
比如烟草制造品业的市场盈利能力为全行业最高,但其市场能力为全行业倒数第二。
要想尽快提高工业行业的经济效益,应该首先重点扶持盈利能力和市场能力均较高的行业,如石油和天然气开采业、黑色金属矿采选业、非金属矿采选业等。
三.合理引导各行业的投资,不能只将投资挤向盈利能力较高的行业,而要适度考虑到市场能力较强的行业。
七参考文献
[1]华中生,梁梁.地区工业行业经济状况的综合评价与分析[J].管理工程学报1995,6.
[2]王树岭等.吉林省轻工业行业经济效益综合评价[J].吉林工业大学学报自然科学版,
1999,1.
[3]何晓群.多元统计分析[M].北京:
中国人民大学出版社,2004
[4]林秀梅.多元统计方法[M].长春:
吉林人民出版社,1996
2013.3
⑸张文彤,董伟.SPSS统计分析高级教程(第二版)[M].北京:
高等教育出版社,
附录
表1:
2008年国有及国有控股工业行业主要经济效益指标的原始数据
行业
序号
总资产贡献
率人(%
资产负债率
X(%
流动资产周转
次数人(次/年)
成本费用利
润率X4(%
产品销售
率X5(%
煤炭开采和
洗选业
16.29
61.04
1.92
17.31
98.2
石油和天然
气开采业
49.47
39.06
4.65
83.47
89.16
黑色金属矿
采选业
19.71
40.69
1.9
32.19
96.26
有色金属矿
17.85
47.53
2.03
17.2
98.88
非金属矿采
选业
13.12
52.51
1.79
11.54
6
0.63
74.37
0.37
0.51
118.57
农副食品加
工业
7
8.95
65.54
2.8
2.66
96.5
8
8.78
63.2
2.25
3.08
97.33
9
21.43
42.61
1.61
17.67
99.07
70
23.35
1.49
41.94
98.94
4.27
67.87
0.2
98.1
纺织服装、鞋、帽制造业
12
8.29
64.65
1.37
5.67
98.82
皮革、毛皮、羽毛(绒)及其制品业
13
16.67
43.22
1.22
11.92
98.27
木材加工及木、竹、草等制品业
14
8.25
64.04
1.77
3.32
93.61
15
15.72
58
2.55
9.22
99.67
造纸及纸制
品业
16
6.53
59.82
1.6
5.06
94.99
印刷业和记录媒介的复
制
17
12.9
41.57
1.66
11.98
97.56
文教体育用
18
5.37
50.58
1.38
2.71
99.94
品制造业
石油加工、炼
焦及核燃料加工业
19
-6.97
58.88
5.54
-7.64
99.15
化学原料及
化学制品制
造业
20
6.2
55.47
2.32
1.99
97.92
21
13.43
46.89
1.39
12.68
96.05
化学纤维制
22
0.48
56.34
1.87
-4.72
98.08
23
73.32
2.07
0.57
98.86
24
9.66
64.5
1.63
6.33
98.3
非金属矿物
制品业
25
61.52
1.74
6.49
97.51
黑色金属冶
炼及压延加
26
7.25
62.22
2.58
1.69
有色金属冶
27
9.12
58.34
2.39
3.42
98.03
28
10.79
58.77
2.12
4.61
98.97
通用设备制
29
7.39
69.74
6.52
97.79
专用设备制造业
30
6.8
67.54
1.29
5.53
95.8
交通运输设备制造业
31
10.85
63.02
1.65
6.87
99.53
电气机械及
器材制造业
32
9.29
63.57
1.43
6.47
98.13
通信设备、计
算机及其他电子设备制造业
33
5.41
59.26
1.35
3.07
97.22
仪器仪表、文化、办公机械
制造业
34
8.84
48.64
1.14
工艺品及其
他制造业
35
5.87
71.59
1.64
3.97
97.71
废弃资源和
废旧材料回
收加工业
36
13.47
64.1
2.9
6.9
92.08
电力、热力的生产和供应业
37
5.86
63.61
3.85
1.55
99.22
燃气生产和
供应业
38
55.96
2.09
4.3
98.26
水的生产和
39
2.17
50.85
0.81
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课程 毕业论文