全国各年文化事业机构数基于因子分析的实证研究.docx
- 文档编号:29687455
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:26
- 大小:56.93KB
全国各年文化事业机构数基于因子分析的实证研究.docx
《全国各年文化事业机构数基于因子分析的实证研究.docx》由会员分享,可在线阅读,更多相关《全国各年文化事业机构数基于因子分析的实证研究.docx(26页珍藏版)》请在冰豆网上搜索。
全国各年文化事业机构数基于因子分析的实证研究
全国各年文化事业机构数
摘要
党的十七大明确提出构建地方文化事业机构的号召,而其最关键的就是促进一些乡镇以及农村的建设,构建社会主义新农村的重要内容是加强农村精神文明建设。
农村公共文化事业作为向农民提供教育、知识、审美熏陶和休闲娱乐的重要载体,对解决“三农”问题,促进社会主义新农村建设具有不可估量的社会功能。
但多年来,我国农村公共文化事业发展相对滞后。
本论文数据取自2009统计年鉴的全国各年文化事业机构数统计表,采用因子分析和主成分分析对数据进行了多个角度的分析。
通过因子分析,我们发现了在这8个文化事业机构种类中存在两个隐性的在关系,即一个是与第一个因子Factor1有关的变量博物馆,公共图书馆,县市级文化馆,乡镇文化馆所组成的文化教育因子。
另一个是与第二个因子Factor2有关的变量艺术表演团体,艺术表演场馆,博物馆,公共图书馆,中等艺术学校所组成的艺术传统因子,而且我们发现中等艺术学校对数据的贡献最小,其实从统计表中根据数据的大小可以直接看出,艺术表演团体,艺术表演场馆,公共图书馆,乡镇文化馆对因子得分起决定作用,所以他们是影响中国文化机构数的主要因素,而他们也正是群众比较集中的地方。
通过主成分分析,我们发现某些文化事业机构种类之间呈现较强的负相关性,比如公共图书馆和中等艺术学校的相关系数为-0.8050,呈现较强的负相关,即当公共图书馆数量增加时,中等艺术学校数量将有所下降;以及公共图书馆和乡镇文化站的相关系数为-0.7816,即当公共图书馆的数量增加时,乡镇文化站的数量有所下降。
这需要我们的政府进行宏观调控。
整个文化机构数,总体呈现上升的趋势,部分文化机构数却有下降的势头,县市级文化馆的数量每年几乎保持不变。
与统计表中的数据不谋而合。
通过以上分析,发现我们的统计方法和效果都是与实际情况吻合的,表明我们的统计方法有其合理性和准确性。
【关键词】因子分析;主成分分析;隐性关系,负相关性;上升
目录
全国各年文化事业机构数-1-
摘要-1-
1问题的提出-2-
2因子分析与主成分分析-3-
2.1因子分析的概述以及原理-3-
2.2因子分析的模型-3-
2.3因子分析的步骤-4-
2.4因子的提取-4-
2.5主成分分析原理-4-
2.6主成分分析数学模型-5-
3对各年文化机构数进行数据分析-5-
3.1符号说明-5-
3.2因子的提取-5-
3.2前几个因子的抽取法-6-
3.3因子对于变量的共通值-6-
3.4转轴处理-7-
3.5因子分析-7-
3.6因子得分-8-
3.7主成分分析-8-
4结果分析与预测-10-
4.1对原始数据的分析结果-10-
4.2对未来发展的预测和建议-11-
5结语-12-
参考文献-12-
6成绩评定表-12-
1问题的提出
党的十七大报告明确指出:
推进社会主义文化大繁荣。
为认真贯彻落实党的十七大精神,深入了解我市文化工作特别是农村文化发展现状,认真贯彻落实《监督法》,为依法监督提供基础依据,促进各项困难和问题的解决。
根据市人大常委会2007年工作安排重点,在常委会领导的高度重视下,今年11月,由教科文卫工委牵头,部分组成人员参加,通过听取汇报、实地察看、座谈了解、征求意见,对我市文化工作重点是文化事业发展现状进行了认真调研,有了总体的把握和思考:
一、文化事业不断发展,成绩应予充分肯定
二、基础条件欠账太多,队伍建设不容忽视
三、增加投入势在必行,建议尽快分步实施
下表是全国范围内2000-2008年间不同类型的文化机构数,我们将利用因子分析和主成分分析对这些数据进行分析,得出他们之间的潜在关系,以及他们间哪个是最重要的影响力,对各个机构数据得出变化的趋势。
(单位:
个)
年份
艺术表演
团体
艺术表演
场馆
博物馆
公共图书馆
群众艺术馆
(省级、地市
级文化馆)
县市级
文化馆
乡镇(街道)
文化站
中等
艺术学校
2000
2630
1912
1392
2677
390
2907
42024
137
2001
2605
1854
1461
2696
399
2842
40138
142
2002
2587
1829
1511
2697
389
2854
39273
131
2003
2618
1912
1515
2709
382
2846
38588
121
2004
2759
1846
1548
2720
380
2841
38181
129
2005
2805
1866
1581
2762
447
2841
38362
120
2006
2866
1839
1617
2778
395
2819
36874
121
2007
4512
2070
1722
2799
411
2806
37384
121
2008
5114
1944
1893
2820
389
2829
37938
117
(注:
艺术表演团体、艺术表演场馆、博物馆、公共图书馆指标分地区数据不含中央单位数。
为便于书写运算,部分地区数据已被删除,数据来源:
中国统计年鉴2009)
2因子分析与主成分分析
2.1因子分析的概述以及原理
因子分析是一种降维、简化数据的技术。
它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。
这几个“抽象”的变量被称作因子,能反映原来众多变量的主要信息,原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。
因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。
R型因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析。
2.2因子分析的模型
因子分析的基本假设是,某因子(Factor
)存在而且可用以解释复杂变量。
只要这个变量共同具有这个因子,便可观测到这些变量是相关的。
因子分析的数学模型,与一般的多元回归模型比较相似,即每个变量都可表示成各个因子的线性组合。
例如“艺术表演团体”的指标可以表示为
(1)
式1与一般多元回归方程式的不同之处是:
括号内的
这三个变量并非独立变量,而是由一组变量按其特征形成了新变量,这就是“共同因子”;而变量
则称为“唯一因子”,它仅是
(即艺术表演团体)指标中的孤立的一个因子。
式1中的
为共同因子的常数(即因子载荷量)
一般的说,对于第
个变量的数学模型为
(2)
式2中,
是共同因子,
是共同因子的常数。
2.3因子分析的步骤
因子分析一般分为以下4个步骤:
(1)先算出个变量间的相关矩阵,包括对缺失值的处理;
(2)然后抽取因子的个数并检验所选的模型拟合度如何;
(3)第3步是考虑如何转轴,即转换因子,使因子更便于解释;
(4)最后要计算每一个因子对每个“个体”的得分(Score),便于以后分析。
2.4因子的提取
一般情况下,是用“主成分分析法”估算出初始的因子个数
在主成分分析里,是以各个变量的线性结合作为因子的形成。
第一个主成分,应该是样本变量的线性结合中具有最大方差的那个组合。
第二个主成分,是与上一主成分无关,而且具有第2个大方差的线性组合。
可以看出,因子越居后,方差则越小,提取的每个因子之间也互不相关。
主成分的个数,可与样本变量的数目相同,当所有主成分都被使用时,每个变量就是1个主成分,但这丝毫没有益处,因为变量个数丝毫没有减少,问题依然复杂,那么究竟用多少个因子才能较完美地说明数据特性呢,为此,应观察每个主成分的方差对总方差所占的百分比,比例越大,对模型的贡献越大。
2.5主成分分析原理
主成分分析也称主分量分析。
由于多个变量之间往往存在着一定程度的相关性。
人们自然希望通过线性组合的方式,从这些指标中尽可能地提取信息。
当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……直到所提取的信息与原指标相差不多为止。
一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。
以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分分析既可以降低数据“维数”,又保留了原数据的大部分信息。
2.6主成分分析数学模型
设
个分量构成的
维随机向量为
.对
作正交变换,令
其中
为正交阵,要求
的个分量是不相关的,并且
的第一个分量的方差是最大的,第二个分量的方差次之,……。
为了保持信息不丢失,
的各分量的方差和与
的各分量的方差和相等
3对各年文化机构数进行数据分析
3.1符号说明
——艺术表演团体
——艺术表演场馆
——博物馆
——公共图书馆
——群众艺术馆(省级、地市级文化馆)
——县市级文化馆
——乡镇(街道)文化站
——中等艺术学校
3.2因子的提取
表1EigenvaluesoftheCorrelationMatrix:
Total=8Average=1
变量对因子模型所贡献的方差
Eigenvalue
特征值
Difference
上下特征值
Proportion
方差比例
Cumulative
累计方差比例
1
5.02133157
3.82558790
0.6277
0.6277
2
1.19574366
0.23093243
0.1495
0.7771
3
0.96481123
0.53592403
0.1206
0.8977
4
0.42888720
0.08331625
0.0536
0.9513
5
0.34557095
0.31070503
0.0432
0.9945
6
0.03486592
0.02611195
0.0044
0.9989
7
0.00875396
0.00871846
0.0011
1.0000
8
0.00003550
0.0000
1.0000
2factorswillberetainedbytheMINEIGENcriterion.
从表1可以看出有以下4个统计量的关键词。
(1)特征值,即每个样本变量的方差值。
方差是按递减顺序排列的,因此,表1第一列的1-8只能表示第1-8个成分,它们和程序语句中的x1-x8并不存在一一对应的关系。
可以看出主成分为1者,方差为5.02133157,主成分为8者,方差为0.00003550
(2)上下特征值(方差值)之差
(3)方差比例,它是某个主成分的方差除以总方差所得的商。
(4)累积方差比例,由表1可看出前7个主成分的方差和为1,由此可以获得初步结论:
这个模型只需要提取前7个主成分作为共同因子。
3.2前几个因子的抽取法
表2FactorPattern
初始的因子载荷量及因子解释的方差
Factor1
Factor2
x1
艺术表演团体
0.83851
0.50126
x2
艺术表演场馆
0.57329
0.65223
x3
博物馆
0.94141
0.15014
x4
公共图书馆
0.97314
-0.01639
x5
群众艺术馆
0.26114
-0.36994
x6
县市级文化馆
-0.82471
0.33790
x7
乡镇文化站
-0.83523
0.45537
x8
中等艺术学校
-0.84284
0.19459
VarianceExplainedbyEachFactor
Factor1Factor2
5.02133161.1957437
由表2显示出前2个因子与各个变量之间的相关关系,这些系数称为因子载荷量。
它们表示系数绝对值较大的变量,与相应因子(Factor)的相关强度较强,可以看出,公共图书馆与Factor1的系数为0.97314,但对于因子2来说系数很小,为-0.01639,表明公共图书馆只与Factor1关系密切。
从表2可以看出x1,x2,x3,x4,x6,x7,x8分别与Factor1相关,x1,x2分别于Factor2相关。
但是到目前为止,不知道前7个因子对模型的拟合度究竟如何,因此需要进一步研究前7个因子。
3.3因子对于变量的共通值
表3FinalCommunalityEstimates:
Total=6.217075
转轴前因子对变量的方差贡献率(所解释的方差)
X1
X2
X3
X4
0.95436817
0.75406630
0.90878880
0.94726203
X5
X6
X7
X8
0.20505198
0.79432053
0.90498010
0.74823731
由表3可以看出各个变量通过主成分分析后所获得最终共通值,由于共通值在0-1之间,当共通值为0时,表示该变量不包含于共同因子中,当共通值为1时,表示该变量所有信息能完全由共同因子解释。
可以看出x1,x3,x4,x7的拟合度很好,但x5,x2,x6效果不是很好,与初始结论不符。
3.4转轴处理
表4转轴后的因子载荷量及因子解释的方差
TheFACTORProcedureRotationMethod:
VarimaxOrthogonalTransformationMatrix
12
1-0.719900.69407
20.694070.71990
RotatedFactorPattern
Factor1
Factor2
x1
艺术表演团体
-0.25574
0.94285
x2
艺术表演场馆
0.03998
0.86745
x3
博物馆
-0.57351
0.76149
x4
公共图书馆
-0.71194
0.66363
x5
群众艺术馆
-0.44476
-0.08507
x6
县市级文化馆
0.82824
-0.32915
x7
乡镇文化站
0.91735
-0.25189
x8
中等艺术学校
0.74182
-0.44490
根据表4可以看出转轴后的因子矩阵与表2大不一样,Factor1因子载荷量大于0.5的,由7个锐减到5个,同时变量与因子相关的情形大不一样了,即转轴前x2,x1与Factor2相关,所以x2,x1相关,但转轴后,x1,x2,x3,x4与Factor2相关,又因为Factor2居后,他们的相关性就显得相对地不太重要。
表5FinalCommunalityEstimates:
Total=6.217075
转轴后的因子共通值
X1
X2
X3
X4
0.95436817
0.75406630
0.90878880
0.94726203
X5
X6
X7
X8
0.20505198
0.79432053
0.90498010
0.74823731
Factor1Factor2
3.17839423.0386810
由表5可以看出转轴不改变因子对于变量的共通值,不影响变量对于因子的拟合程度。
3.5因子分析
如表4所示,经过转轴后,从转轴因子模型中,可容易地解释因子的实际意义,
(1)与第一个因子Factor1有关的变量有:
博物馆,公共图书馆,县市级文化馆,乡镇文化馆。
因此Factor1可以解释为文化教育因子。
(2)与第二个因子Factor2有关的变量有:
艺术表演团体,艺术表演场馆,博物馆,公共图书馆,中等艺术学校。
因此Factor2可以解释为艺术传统因子。
3.6因子得分
表6变量与因子得分
TheFACTORProcedure
RotationMethod:
Varimax
ScoringCoefficientsEstimatedbyRegression
SquaredMultipleCorrelationsoftheVariableswithEachFactor
Factor1
Factor2
1.0000000
1.0000000
StandardizedScoringCoefficients
Factor1
Factor2
x1
艺术表演团体
0.17074
0.41769
x2
艺术表演场馆
0.29640
0.47192
x3
博物馆
-0.04782
0.22052
x4
公共图书馆
-0.14903
0.12465
x5
群众艺术馆
-0.25217
-0.18663
x6
县市级文化馆
0.31437
0.08944
x7
乡镇文化站
0.38407
0.15871
x8
中等艺术学校
0.23379
0.00065
从表6可以看出,变量x1(艺术表演团体),x2(艺术表演场馆),x4(公共图书馆),x7(乡镇文化馆)对因子得分起决定作用,而且因子得分最高。
3.7主成分分析
表7SimpleStatistics
均值等描述性统计量
y
x1
x2
x3
Mean
2004.000000
3166.222222
1896.888889
1582.222222
StD
2.738613
950.654482
75.817947
149.571703
X4
X5
X6
X7
X8
Mean
2739.777778
398.0000000
2842.777778
38751.33333
126.55555556
StD
51.141416
20.5730406
28.230204
1559.82203
8.6618576
表7显示出每个变量的均值、标准偏差等默认统计量。
可以看出在2000-2008年期间,艺术表演团体平均值为3166个,且呈现逐年上升的趋势,即每年增加950个
再从文化机构个数的波动情况分析,8种机构,每年变异性最突出的是乡镇文化站,其次是艺术表演团体,第3是博物馆。
表8CorrelationMatrix相关矩阵
yx1x2x3x4x5
y年份
1.00000.78750.45150.93530.97820.2418
x1艺术表演团体
0.78751.00000.73010.91910.83400.0525
x2艺术表演场馆
0.45150.73011.00000.49320.49990.1289
x3博物馆
0.93530.91910.49321.00000.94050.1052
x4公共图书馆
0.97820.83400.49990.94051.00000.3224
x5群众艺术馆
0.24180.05250.12890.10520.32241.0000
x6县市级文化馆
-0.8003-0.5128-0.3039-0.6905-0.7596-0.2163
x7乡镇文化站
-0.8670-0.4412-0.1831-0.6997-0.7816-0.1578
x8中等艺术学校
-0.8642-0.5593-0.3621-0.7542-0.8050-0.2483
x6x7x8
y年份
-0.8003-0.8670-0.8642
x1艺术表演团体
-0.5128-0.4412-0.5593
x2艺术表演场馆
-0.3039-0.1831-0.3621
x3博物馆
-0.6905-0.6997-0.7542
x4公共图书馆
-0.7596-0.7816-0.8050
x5群众艺术馆
-0.2163-0.1578-0.2483
x6县市级文化馆
1.00000.91480.5961
x7乡镇文化站
0.91481.00000.7936
x8中等艺术学校
0.59610.79361.0000
表8列出的是相关系数矩阵,从表中可以看出,公共图书馆和中等艺术学校的相关系数为-0.8050,呈现较强的负相关,即当公共图书馆数量增加时,中等艺术学校数量将有所下降;其次是公共图书馆和乡镇文化站的相关系数为-0.7816,即当公共图书馆的数量增加时,乡镇文化站的数量有所下降。
表9EigenvaluesoftheCorrelationMatrix
前两个主成分的特征值都大于1
Eigenvalue
Difference
Proportion
Cumulative
1
5.99083062
4.78819937
0.6656
0.6656
2
1.20263125
0.23519139
0.1336
0.7993
3
0.96743986
0.52970512
0.1075
0.9068
4
0.43773473
0.09165168
0.0486
0.9554
5
0.34608306
0.30355699
0.0385
0.9939
6
0.04252607
0.03097605
0.0047
0.9986
7
0.01155001
0.01034561
0.0013
0.9999
8
0.00120441
0.00120441
0.0001
1.0000
9
0.00000000
0.0000
1.0000
从表9中可以看出,前8个主成分的特征值,表示每个原始变量对于各个主成分的因子载荷量的贡献率,比如对于第一个主成分而言,艺术表演团体对于第一主成分的比重为0.339284,是所有文化机构中最关键的。
表10按第一主成分中的个数升序排序年份
y
Prin1Prin2x1x2x3x4x5
x6x7x8
2000
2001
2002
2004
2003
2005
2006
2007
2008
-3.664361.597192630191213922677390
-2.33446-0.042822605185414612696399
-1.69356-0.382842587182915112697389
-0.58189-0.488482759184615482720380
-0.57306-0.059562618191215152709382
0.71832-1.455642805186615812762447
1.30918-1.421072866183916172778395
3.288581.09048451220701722
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国 文化事业 机构 基于 因子分析 实证 研究