南京财经大学经济学院学士学位论文区域信息化水平研.docx
- 文档编号:27989536
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:15
- 大小:49.69KB
南京财经大学经济学院学士学位论文区域信息化水平研.docx
《南京财经大学经济学院学士学位论文区域信息化水平研.docx》由会员分享,可在线阅读,更多相关《南京财经大学经济学院学士学位论文区域信息化水平研.docx(15页珍藏版)》请在冰豆网上搜索。
南京财经大学经济学院学士学位论文区域信息化水平研
南京财经大学经济学院学士学位论文区域信息化水平研
南京财经大学经济学院
学士学位论文
区域信息化水平研究——以上海、江苏、浙江地区信息化水平为例
赵旭东
指导老师:
管于华
答辩日期:
摘要
本文介绍了信息化的背景、指标体系和测量方法,以及对地区信息化水平测量的意义和过程,并进一步以上海、江苏、浙江三个地区信息化水平进行实证研究。
在现有统计指标体系的基础上,初步建立适合上海、江苏、浙江地区信息化评价指标体系,并通过主成分分析法综合评价2004年上海、江苏、浙江地区信息化水平,然后着重分析在不同以及省市之间信息化指数差距的原因,最后提出合理化的建议。
关键词:
信息化指标体系;信息化水平;主成分分析法
ABSTRACT
Thispaperintroducessomethingaboutinformatizationbackground,indicatorssystemandmeasuringmethod,andthesignificanceandprocessoftheinformatizationlevelsurvey,andthentakeempiricalresearchonshanghai、Jiangsuprovince、Zhejiangprovince`sinformatizationlevel.Onthebasisofinexistencestatisticalindicatorsystem,introductionerectfitShanghai,Jiangsuprovince,Zhejiangprovincelocalityinformatizationevaluatingindicatorsystem,combinethroughthemediumofprincipalcomponentanalysisoverallmerit2004yearShanghai,Jiangsuprovince,cheersregioninformatizationlevel.Emphasizeanalysesthesubjectfortheinformatizationindicatorsgapbetweenthedifferentprovinceandcity,thensetstreamlinedproposal.
Keywords:
informatization;indicatorssystemlevelofinformatization;Principalcomponentanalysis
1.引言
信息化(imformationlize)指在经济和社会活动中,通过普遍采用信息技术和电子信息装备,更有效地开发和利用信息资源,推动经济发展和社会进步,使由于利用信息资源而创造的劳动价值在国民产生中的比重逐步上升直至占主导地位的过程。
随着信息革命的兴起,世界经济正加紧向信息化经济转变,人们逐渐认识到“信息”是一种战略资源和经济发展的重要因素。
实践证明,一个国家或地区如要保持并加强其在21世纪的竞争力,就必须抢占信息化这一制高点。
作为中国这样一个处于发展中的大国,必须大力推进信息化战略,发挥“后发优势”,实现跨越式发展,以缩小与发达国家在经济、科技和军事等方面的差距。
上海、江苏、浙江三个地区在改革开放以后,一系列的改革措施和优惠政策使这一地区逐渐成为我国经济发展最活跃和经济增长最快的地区,这三个地区在地缘经济中属于同一个经济板块,各城市拥有相近的资源、共同的市场,以及雷同的经济体制。
因此有必要从宏观角度对这几个地区的信息化水平进行定量测算、分析和评估。
本文在对信息化理论和方法充分研究的基础上,把上海、江苏、浙江作为研究对象,并以04年上海、江苏、浙江地区为例,进行实证研究。
2.信息化水平测度的指标体系
2.1信息化水平指标体系的综述
信息化水平指标是衡量信息化水平的重要指标,对国民经济的发展具有战略指导意义。
因此,十分有必要将信息化水平测度引入信息化分析。
信息化水平的测算始于20世纪60年代,可以说一些理论模型或方法,目前已比较成熟,不少测算早已被世界各国采用。
从国内外近年来的测算看,比较有代表性的主要是一些知名学者和国际组织所设计的方法。
目前国际上比较通行的宏观测度方法有两种:
一是美国著名学者波拉特的方法,波拉特测算理论的核心是将信息部门从国民经济各部门中逐个识别出来,然后将信息部门分为一级信息部门和二级信息部门,并进而建立一套可以量化的测算体系。
首先视四大类中的11项分指标的权重相同,在此前提下,确定某国家或某地区某一年的各项指标法数为基年的基数,即权重定为100,然后将被测地区某年度的各项同类指标值除以基年的各项指标值,再分别按大类累加除以项数,求得各大类的平均指数,最后,将各大类平均指数相加除以常数4(即其为四大类);其除数就是最终所求的信息化水平的“信息化指数”。
用公式表示为:
∏=
(2)
式中,∏代表信息化指数,X代表某项指标的实际数据值,S表示基年的某项指标值。
另一种是信息化指数法。
该法最初是由日本学者提出来的用来计量不同社会、国家和地区的信息化相对发展水平。
此方法体系假定信息化指标体系包括四大类11大项指标。
如下图一:
图一
2.2指标体系的构建过程
2.2.1、指标的选取原则
A综合性:
即要求预警指标具有高度的概括性,能准确灵敏的反映区域信息化水平,揭示区域信息化水平内在联系。
B互补性:
即要求指标体系内的各个指标能互相联系、互相补充,由于一个统计指标往往只能描述某一社会问题或某类社会问题的某一方面,所以,信息化水平指标要真正起到“指示器”的作用,就必须互为补充,客观全面的反映区域信息化水平,揭示各问题之间的内在联系。
C可操作性,即要求每一指标都能有精确的数值表现。
根据以上原则,笔者在吸取了日本学者提出的信息化模型合理成分的同时,剔除其中一些过时的影响较小的指标,如“人均年使用函件数”等,使信息化测度指标具有较强的时代性和可操作性,再参照了国际信息化指标和麻冰冰的模型,对上海、江苏、浙江信息化水平进行了综合的评价。
(指标体系见表一)
2.2.2、数据采集和处理过程
大部分数据来自2005年《中国统计年鉴》、2005年《上海统计年鉴》、2005年《江苏统计年鉴》、2005年《浙江统计年鉴》以及2005年《中国信息年鉴》。
对于一些缺失的指标数据,笔者用相应的数据进行转换和替换。
如:
非文盲占15岁以上人口比率,就用各地区在2000年人口普查时的数据进行了代替。
2.2.3、数据分析过程
根据所得到的各指标值,运用主成分分析法对2004年各指标数值进行分析,将指标体系中17个指标数所含信息缩减成几个成分,并计算出各个地区的综合得分,进行排名,同时着重分析在不同以及省市之间信息化指数差距的原因,提出合理化的建议。
3.对上海、江苏及浙江三个地区信息化水平的实证分析
3.1数据处理
下面本文就以表一所示指标对上海、江苏及浙江三个地区信息化水平的进行实证分析。
表一
指标
地区数值
江苏
上海
浙江
R&D经费支出占GDP比例
1.38
2.29
1.1666227
每10万人研究机构或情报文献机构数(个)
5.065590313
3.846153
2.4366626
每万人拥有图书馆(个)
0.0265
0.16
0.03
每万人报纸期发数(期/万人)
1.89836
6.2726
2.79
年末互联网用户占地区人口比重
0.06
0.3633754
0.11
平均每百人拥有移动电话数
(台/百人)
29.90
75.00
49.20
非文盲占15岁以上人口比率(%)
92.10
89.7
85.72
学龄儿童入学率(%)
99.69
99.99
99.99
每万人拥有的大学生数(人)
0.017112681
0.0289498
0.013893871
信息产业占GDP比重(%)
7.3
11.4
12.00
人均信息产业基本建设投资额
(亿元/人)
122.314968
2018.6638
1042.314448
人均图书报刊出版总印数(册/人)
39.910259
139.5983
61.76049937
三种专利授权量(件)
11330
10625
15249
人均高技术产业科技活动产品销售收入(万元/人)
0.689207
2.26919
1.232028956
人均邮电业务总量(元/人)
749.8957282
178.64524
1417.078251
每人长途通话分钟(分钟/人)
136.40094
564.86
152.6507712
每万人光缆长度(公里/万人)
3.217181298
2.59759
4.220935
注:
以上数据根据2005年《中国统计年鉴》、2005年《上海统计年鉴》、2005年《江苏统计年鉴》、2005年《浙江统计年鉴》以及2005年《中国信息年鉴》整理得到。
由于以上17个指标具有不同的量纲,无法直接进行计算和比较,为消除量纲的影响,首先对数据进行标准化,以消除量纲的影响。
最终得到信息化指数值。
(见表二)
表二标准化后的数据
指标
各地区数值
江苏
上海
浙江
R&D经费支出占GDP比例
-0.38922
1.13609
-0.74687
每10万人研究机构或情报文献机构数(个)
0.97505
0.04815
-1.02321
每万人拥有图书馆(个)
-0.62175
1.15353
-0.53178
每万人报纸期发数(期/万人)
-0.75938
1.13302
-0.37364
年末互联网用户占地区人口比重
-0.73356
1.13906
-0.40551
平均每百人拥有移动电话数(台/百人)
-0.94868
1.04443
-0.09575
非文盲占15岁以上人口比率(%)
0.90865
0.16274
-1.07139
学龄儿童入学率(%)
-1.1547
0.57735
0.57735
每万人拥有的大学生(人)
-0.36234
1.13066
-0.76832
信息产业占GDP比重(%)
-1.14673
0.45609
0.69065
人均信息产业基本建设投资额(亿元/人)
-0.98995
1.00976
-0.01981
人均图书报刊出版总印数(册/人)
-0.77316
1.12932
-0.35616
三种专利授权量
-0.43004
-0.71304
1.14308
人均高技术产业科技活动产品销售收入(万元/人)
-0.88144
1.0867
-0.20526
人均邮电业务总量(元/人)
-0.05159
-0.97321
1.0248
每人长途通话分钟(分钟/人)
-0.61049
1.15405
-0.54357
每万人光缆长度(公里/万人)
-0.15631
-0.91264
1.06895
对标准化以后的数据进行主成分分析。
主成分概念首先由KarlParson在1901年引进,当时只对非随机变量来讨论的。
1933年Hotelling将这个概念推广到随机变量。
设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。
同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。
主成分分析的目的就是:
(1)对数据进行压缩,比较各个地区的情况较难,用主成分分析就可以从众多数据就可以浓缩为几个新的指标由于区域信息化指标较多,并从中进行比较。
(2)数据的解释,在得到新的指标之后,就需要解释,指出这些指标所包括的含义。
笔者使用SPSS软件进行分析结果如下:
表三相关系数矩阵R
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
x14
x15
x16
x17
x1
1.00
0.22
0.97
0.93
0.94
0.81
0.32
0.34
1.00
0.22
0.77
0.92
-0.75
0.87
-0.93
0.98
-0.89
x2
0.22
1.00
0.00
-0.15
-0.12
-0.39
1.00
-0.84
0.24
-0.90
-0.45
-0.17
-0.81
-0.30
-0.57
0.01
-0.65
x3
0.97
0.00
1.00
0.99
0.99
0.92
0.10
0.54
0.97
0.44
0.90
0.99
-0.58
0.96
-0.82
1.00
-0.76
x4
0.93
-0.15
0.99
1.00
1.00
0.97
-0.05
0.66
0.92
0.56
0.95
1.00
-0.45
0.99
-0.72
0.99
-0.66
x5
0.94
-0.12
0.99
1.00
1.00
0.96
-0.02
0.64
0.93
0.54
0.94
1.00
-0.48
0.98
-0.74
0.99
-0.68
x6
0.81
-0.39
0.92
0.97
0.96
1.00
-0.29
0.82
0.80
0.75
1.00
0.97
-0.22
1.00
-0.53
0.92
-0.45
x7
0.32
1.00
0.10
-0.05
-0.02
-0.29
1.00
-0.79
0.34
-0.85
-0.36
-0.07
-0.87
-0.20
-0.65
0.11
-0.72
x8
0.34
-0.84
0.54
0.66
0.64
0.82
-0.79
1.00
0.31
0.99
0.86
0.67
0.37
0.76
0.04
0.53
0.14
x9
1.00
0.24
0.97
0.92
0.93
0.80
0.34
0.31
1.00
0.20
0.76
0.92
-0.76
0.85
-0.93
0.97
-0.90
x10
0.22
-0.90
0.44
0.56
0.54
0.75
-0.85
0.99
0.20
1.00
0.79
0.58
0.48
0.68
0.16
0.43
0.25
x11
0.77
-0.45
0.90
0.95
0.94
1.00
-0.36
0.86
0.76
0.79
1.00
0.96
-0.16
0.99
-0.48
0.89
-0.39
x12
0.92
-0.17
0.99
1.00
1.00
0.97
-0.07
0.67
0.92
0.58
0.96
1.00
-0.44
0.99
-0.71
0.98
-0.65
x13
-0.75
-0.81
-0.58
-0.45
-0.48
-0.22
-0.87
0.37
-0.76
0.48
-0.16
-0.44
1.00
-0.32
0.94
-0.59
0.97
x14
0.87
-0.30
0.96
0.99
0.98
1.00
-0.20
0.76
0.85
0.68
0.99
0.99
-0.32
1.00
-0.61
0.95
-0.54
x15
-0.93
-0.57
-0.82
-0.72
-0.74
-0.53
-0.65
0.04
-0.93
0.16
-0.48
-0.71
0.94
-0.61
1.00
-0.82
1.00
x16
0.98
0.01
1.00
0.99
0.99
0.92
0.11
0.53
0.97
0.43
0.89
0.98
-0.59
0.95
-0.82
1.00
-0.77
x17
-0.89
-0.65
-0.76
-0.66
-0.68
-0.45
-0.72
0.14
-0.90
0.25
-0.39
-0.65
0.97
-0.54
1.00
-0.77
1.00
这17个指标的相关系数矩阵R如表三,并由相关系数矩阵R得到其特征值与特征向量,以及每个成分的贡献率。
据表四可知特征值是11.4851,5.5149,0.000,0.0000,0.0000,0.0000…,在用SPSS做分析时设定主成分的累积贡献率达到85%就可以,从表四可知有两个主成分入选,其贡献率分别为67.5%和32.4%可以解释绝大部分信息。
表四TotalVarianceExplained
Component
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1.0000
11.4851
67.5592
67.5592
11.4851
67.5592
67.5592
2.0000
5.5149
32.4408
100.0000
5.5149
32.4408
100.0000
3.0000
0.0000
0.0000
100.0000
4.0000
0.0000
0.0000
100.0000
5.0000
0.0000
0.0000
100.0000
6.0000
0.0000
0.0000
100.0000
7.0000
0.0000
0.0000
100.0000
8.0000
0.0000
0.0000
100.0000
9.0000
0.0000
0.0000
100.0000
10.0000
0.0000
0.0000
100.0000
11.0000
0.0000
0.0000
100.0000
12.0000
0.0000
0.0000
100.0000
13.0000
0.0000
0.0000
100.0000
14.0000
0.0000
0.0000
100.0000
15.0000
0.0000
0.0000
100.0000
16.0000
0.0000
0.0000
100.0000
17.0000
0.0000
0.0000
100.0000
并根据公式:
其中
是主成分Y与变量样本的线性关系的系数,
是因子载荷矩阵的系数,
是特征值的平方根。
得到主成分的表达式为
y1=0.2839*zx1-0.0165*zx2+0.2948*zx3+0.2936*zx4+0.2945zx5+0.2780*zx6+0.0130*zx7+0.1717*zx8+0.2818*zx9+0.1422*zx10+0.2709*zx11+0.2933*zx12-0.1588*zx13+0.2862*zx14-0.2319*zx15+0.2945*zx16-0.2145*zx17
y2=-0.1167*zx1-0.4250*zx2-0.0221*zx3+0.0413*zx4+0.0285zx5+0.1431*zx6-0.4254*zx7+0.3462*zx8-0.1265*zx9+0.3730*zx10+0.1695*zx11+0.0477*zx12+0.3590*zx13+0.1043*zx14+0.2631*zx15-0.0273*zx16-0.2925*zx17
从表五可看出,第一主成分集中了每万人拥有图书馆数、每万人报纸期发数、年末互联网用户占地区人口比重、平均每百人拥有移动电话数、人均图书报刊出版总印数、每人长途通话分钟等因素,为信息资源,第二个主成分集中了每10万人研究机构或情报文献机构数、非文盲占15岁以上人口比率、学龄儿童入学率、信息产业占GDP比重、三种专利授权量,主要是信息主体(人)和信息技术的因素。
表五因子载荷矩阵
Zx1
Zx2
Zx3
Zx4
Zx5
Zx6
Zx7
Zx8
Zx9
Y1
0.28
-0.02
0.29
0.29
0.29
0.28
0.01
0.17
0.28
Y2
-0.12
-0.42
-0.02
0.04
0.03
0.14
-0.43
0.35
-0.13
Zx10
Zx11
Zx12
Zx13
Zx14
Zx15
Zx16
Zx17
Y1
0.14
0.27
0.29
-0.16
0.29
-0.23
0.29
-0.21
Y2
0.37
0.17
0.05
0.36
0.1
0.26
-0.03
0.29
根据这两个主成分的贡献率可以得到各地的得分情况:
F=0.6755*y1+0.3244*y2
根据得分排名情况为第一名上海;第二名浙江;第三名江苏。
如表六:
表六、三个地区的排名
地区
得分
排名
上海
2.59
1
浙江
-0.59
2
江苏
-2
3
注:
以上由SPSS统计软件计算得出。
3.2三者之间差距分析
从总体上看,上海的信息化水平最高,符合其作为国际化大都市的身份,R&D经费支出占GDP比例、每万人报纸期发数、平均每百人拥有移动电话数、人均信息产业基本建设投资额、每人长途
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 南京 财经大学 经济学院 学士学位 论文 区域 信息化 水平