期刊排名模型.docx
- 文档编号:10263768
- 上传时间:2023-02-09
- 格式:DOCX
- 页数:19
- 大小:86.14KB
期刊排名模型.docx
《期刊排名模型.docx》由会员分享,可在线阅读,更多相关《期刊排名模型.docx(19页珍藏版)》请在冰豆网上搜索。
期刊排名模型
2009高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
B
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
西安电子科技大学
参赛队员(打印并签名):
1.李栋
2.王晓辉
3.叶鑫林
指导教师或指导教师组负责人(打印并签名):
冯海林周杰
日期:
2010年08月04日
赛区评阅编号(由赛区组委会评阅前进行编号):
2009高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
目录
2009高教社杯全国大学生数学建模竞赛1
目录1
摘要2
一问题重述4
二研究背景5
2.1学术期刊在科学发展的地位作用5
2.2学术期刊评价的发展历史与理论方法基础5
三.模型的假设与条件7
3.1对问题可设如下合理假设7
3.2文中用到的符号7
四.模型的建立与求解7
4.1评价对象以及分析框架7
4.2评价指标的选取8
4.2.1模型的建立:
指标选取方法8
4.2.2指标具体意义及其影响8
4.3.4方法优势12
4.5.2实证结果分析15
五.模型的误差分析16
六.模型的评价和改进16
6.1模型的评价16
6.2模型的改进17
七.对对期刊评价的建议18
八.参考文献19
期刊评价模型的探讨
摘要
本文针对期刊评价分析问题,建立多指标期刊评价模型,综合考虑数据给出情况,运用主成分分析方法,避免多项指标间可能存在的相互关系以及对于各个指标权值制定的主观性等问题,细化数据处理过程,得出各个期刊的排名情况。
首先对于问题一,我们结合国内外期刊评价模型的历史发展以及最近被广为接受的评价指标作为依据,已基础理论作支撑,拟定出十一项评价指标,对每一个指标的存在和影响进行了详细的说明,运用主成分分析方法进行模型求解。
其次对于问题二,我们采用了决策理论中的层次分析法进行评价期刊,以问题一中的各个评价指标作为准则层进行建立模型,以期刊的综合得分为有限度的决策条件,由给出的数据确定了五个指标的评价模型,运用主成分分析方法求出各各期刊的综合得分,并进行排名。
对于问题三,我们通过对第二问的求解,发现---,---,---的载荷率比较高,因为考虑到2005到2009年指标的浮动性不应该太大,本文猜测应该2009年这三个指标的载荷率应该还是很高,通过对模型的巧妙移植,五个指标改为八个指标,进行运算,得出结论,并证实了我们的猜想。
根据探讨该问题得出的一些结论,我们对期刊评价模型问题,做了一份详细报告,从而为期刊评价部门提出了一些建议。
本文首先构建期刊评价中评价指标的分析框架,然后对多项评价指标进行选取,分析若干问题,并解决问题。
关键词:
层次分析法,Google算法,期刊排名,多目标评价模型
一问题重述
期刊评价是文献计量学研究的重要组成部分,它通过对学术期刊的发展规律和增长趋势进行量化分析,揭示学科文献数量在期刊中的分布规律,为优化学术期刊的使用提供重要参考。
但是现在普遍使用的针对期刊的评价指标有很多不是很合理,不能体现出期刊的综合指标,为此,我们急需要一种合理的期刊评价指标模型来对期刊进行评价,以此提高期刊在科研生活中的认可度。
问题一:
给出一种或者几种你认为较为合理的针对期刊的评价指标和方法。
问题二:
用你的指标或方法给出针对数据的具体分析结果,用以说明或比较指标(或方法)的优劣。
问题三:
附件中Excel的数据是05年的全球重要刊物的影响因子、半衰期等指标的统计结果,这些指标每年都有新的更新和变化,在JCR数据库中可以找到。
设法找到最新的数据进行分析(快速获取文献也是数学建模竞赛中需要有的基本技能)。
注意该数据中的刊物是英文名称,学科种类各异,你们可以根据自己所做的内容进行选择和分析,但是数据样本要足以说明你们的问题。
二研究背景
2.1学术期刊在科学发展的地位作用
学术期刊是学科发展到一定阶段的必然产物。
学术期刊作为学术成果的传播载体,客观上必然具有评价和引导功能,无论对匡正学术风气,还是对提升研究水准,其作用都不可或缺。
一流的学术期刊之所以能够突破狭隘的文献传播功能定位的局限,引领某一或某些学科领域学术发展的方向,是因为它所具有的学术判断力、学术凝聚力与学术影响力,并且归根到底取决于办刊人自身的学术素养和刊物所依托的相关研究领域的一流学者。
学术期刊承载原创的科学知识,在科学发展中占有独特的地位,发挥着其他形态的文明所不可取代的作用。
这是由学术期刊的根本特质决定的。
学术期刊传播的学术创新、学术自由和学术规范推动着学术繁荣。
学术期刊所蕴涵的学术价值是一个社会的灵魂和旗帜,它在本质上是一种人文之光和科学之光,是推动经济、社会发展的重要力量。
2.2学术期刊评价的发展历史与理论方法基础
2.2.1期刊评价的发展历史
期刊评价是文献计量学研究的重要组成部分,它通过对学术期刊的发展规律和增长趋势进行的量化分析,揭示学科文献数量在期刊中的分布规律,为优化学术期刊的配置和使用提供重要依据。
早在1934年,著名文献计量学家布拉德福(B.C.Bradford)按载文量递减排序将期刊分为3个区,并将第一个区称为“核心区”,其中的期刊称为“核心期刊”。
他首次提出了具有评价意义的“核心期刊”的概念。
美国著名情报学家加菲尔德(E.Garfield)博士在20世纪60年代对期刊文献的引文进行了大规模统计分析,得到了大量被引用文献集中在少数期刊上,而少量被引用文献又高度分散在大量期刊中的结论。
这可以被认为是国外期刊评价理论的起源。
而随后加菲尔德创建了美国科学情报研究所(ISI),相继开发出“科学引文索引”(sciencecitationindex,SCI)、“社会科学引文索引”(socialsciencecitationindex,SSCI)和“艺术与人文科学引文索引”(arts&humanitiescitationindex,A&HCI)3个数据库。
后来又顺应网络环境的需要,研发了ISIWebofKnowledge,它是一个基于Web所建立的整合的数字化环境,为不同层次、不同学科领域的学术研究人员提供信息服务。
ISI每年发布一次《期刊引证报告》(JCR),它是一个综合性、多学科的期刊分析与评价报告,客观地统计WebofScience收录期刊所刊载论文的数量、论文参考文献的数量、论文的被引用次数等原始数据,再运用文献计量学的原理,计算出各种期刊的影响因子、当年被引指数、被引半衰期等反映期刊质量和影响的定量指标。
在学术期刊评价中,主要采用多指标综合评价方法,包括各种主观评价,客观评价,以及主客观评价相结合的综合评价方法。
指标的选取无疑是期刊评价中相当重要的一个环节,选取合适的指标是保证学术期刊评价的基础和关键。
许多学者在指标选取领域进行了很多的研究,R.PLOMP(1989)的研究表明,机构论文的短期影响因子与长期影响因子不一样,即使同一个作者的短期影响因子和长期影响因子也不一样,人们应慎重应用指标因子。
Henk.F.Moed(2000)指出只有当文献计量学先进到了一定的程度,只有当人们对文献计量学指标的缺陷有了足够的认识时,也只有这些指标和那些定性评价信息相融合时,文献计量学指标才会有足够的应用。
总体上来说,研究背景不同,研究对象不同,指标的选取也不同,单独运用一两个指标对学术期刊进行评价不能全方位评价模型,这也是多指标综合评价方法在期刊评价中的重要作用的重要原因,这样就可以不分学科总体进行评价。
JCR是对世界权威期刊进行系统客观评价的有效工具,通过对来源于ISI的SCI和SSCI的数据进行分析,JCRWeb版收录了世界上各学科最具影响的7000多种期刊,这些期刊涵盖了200多门学科。
这被视为国外有关期刊评价的最早的大规模实践。
而这些期刊正好弥补了我们选择期刊时候的不合理性。
2.2.2期刊评价的理论基础
期刊评价研究是文献计量学的重要应用领域,它利用文献从其出现、情报加工、使用3个方面呈现出的核心效应及由此派生出的其他因素(载文率、影响因子、当年被引指数、半衰期、共引关系等)的集中效应,找出期刊发展和应用中的聚散效应。
文献的集中与离散分布规律、引文分布规律和文献老化及引文峰值理论是核心期刊测定的理论依据。
三.模型的假设与条件
3.1对问题可设如下合理假设
1.我们选取的期刊来源认为是相对最优的,最合理的。
2.对于JCR给出的数据我们也认为是相对来说最合理的,数据中没有刻意的恶性数据。
3.。
4.。
5.。
3.2文中用到的符号
X1---两年影响因子
X2---五年影响因子
X3---即时因子
X4---平均引文率
X5---总被引次数
X6---h指数
X7---SJR
X8---引用半衰期
X9---载文量
X10---平均被引率
X11---文章影响力
四.模型的建立与求解
4.1评价对象以及分析框架
本文的评价目标就是对JCR中收录的两份数据。
一份是2005年的数据,包括了六百多种期刊的五项指标,由于有些收录的期刊对应的指标数不存在,所以只考虑实际收录中数据完全的五百多种。
另一份是2009年收录的七千多种权威期刊,同样只考虑实际收录中数据完全的五千多种期刊,用来进行模型验证。
通过研究,设置了能充分揭示期刊学术水平本质特征的评价指标,力求指标具有科学性,合理性,客观性和可操作性。
结合合理的评价方法可对期刊在科学活动和交流中的作用及其质量的高低作出全面客观的评价。
通过评价,找出相对较权威的期刊。
并对期刊的重要性划分档次。
4.2评价指标的选取
4.2.1模型的建立:
指标选取方法
针对获取期刊学术影响力的评价模型,结合时代发展,提出九个标准,其中包括传统期刊评价指标如影响因子,载文量,平均引文率,即时指数等指标除外,又加入最近的文献计量学新指标h指数和SJR。
4.2.2指标具体意义及其影响
(1)4.2.2.1影响因子(ImpactFactor)
影响因子是分析科技期刊发文量和被引用情况得出的结论,即少量的期刊刊载大量的有意义的科研结果。
影响因子是指某刊前两年发表的论文在统计当年的被引用次数除以该期刊在前两年内发表的论文总数,是国际上同性的传统期刊评价指标。
影响因子是一个相对统计平均值,反应期刊在两年内的平均学术影响力。
一般情况下,影响因子越大,期刊的整体学术影响力越大。
近年来研究人员对两年影响因子提出质疑,因为两年影响因子不能反映不同学科领域期刊之间被引次数分布规律的差异,对发展缓慢的学科领域内的期刊是不公平的。
为此,研究人员提出了长期影响因子的概念,长期影响因子可以从较长时间跨度评价期刊的影响力,是对传统的2年影响因子的补充和发展,。
影响因子的计算公式如下:
n年影响因子=
两年的影响因子n=2,我国期刊评价体系中已经有评价体系将五年影响因子(n=5)作为两年的参照。
本文采用两年和五年的影响因子作为评价指标,数据来源2005和2009年的JCR。
(2)即时因子(ImmediacyFactor)
即时因子也称当年指标,当年指数,只某期刊在统计当年发表论文的被引次数与该期刊当年发表的论文数在当年被引用的情况。
即时因子的计算公式如下:
即时因子=
本文即时因子数据来自2005和2009年的JCR。
(3)平均引文率(meancitingrate)
平均引文率只在测评时间内,期刊论文引用参考文献的平均数量。
该指标可测度期刊的平均引文(引证文献)水平,描述的是期刊吸收信息能力以及科学交流程度的高低,可考察期刊论文吸收他人学术思想的水平及其参与科学交流的程度。
平均引文率=
(4)总被引频次(TotleCites)
总被引频次是指该期刊自创刊以来所登载的全部论文在统计当年的统计员中被引用的总次数,该指标可以客观的说明该期刊总体被使用和受重视的程度,以及在学术交流中的作用和地位。
(5)h指数(h=index)
H指数是2005年8月美国学者J.E.Hirsch提出的用于评价科学家个人成就的信息指标。
H指数可以应用到期刊评价中,学术期刊h指数的确定要有一个确定的期限,我国研究人员将h指数定义为:
某期刊h指数是指该期刊在一定期间内发表的论文至少有h篇的被引次数不低于h次,其余论文的被引次数不大于h次。
当用于学术期刊评价时,h指数显示了与传统文献计量指标不同的特点,可配合影响因子应用于学术期刊评价中。
国外研究人员指出h指数相对影响因子的几个优点:
不容易收意外过多的未被因论文或显著被高引用论文的影响;
H指数通过特定平衡方法将载文量和被引频次结合起来,可以减少对一些小期刊明显的过高评价;
将载文量和被引频次结合起来的单一目标优于载文量,被引次数以及诸如(重要论文数)等其他指标。
(6)SJR
SJR可以免费的在SCImagoJounal&Rank平台上查询。
SCImagoJounal&Rank平台是SCImago研究小组所做的一个大型项目,可以在该平台上检索期刊和国家的科技指数,平台山歌数据来源于Elsevier公司的Scopus数据库。
SJR采用GooglePageRank算法,其计算公式如下:
———期刊i的SJR;N———期刊总量;
———期刊印证期刊i的值;
———期刊j参考文献量;
d———常量,通常为设为0.85e———常量,通常设为0.10;
———期刊j论文量。
SCImago为每一个期刊先赋予一个数值,然后再用上面的公式进行迭代计算。
(7)引用半衰期(CitedHalf-Life)
引用半衰期指该期刊引用的全部参考文献中,较新的一半在多长时间内发表的。
通过这个指标可以反映出期刊利用文献的新颖度。
另外本文还设立了载文量(TotleDocs),文章平均被引率,文章影响力(ArticleInfluenceScore)三个指标。
本文的载文量统计了2005年和2009年期刊刊载论文总数记为TotleDocs;文章平均被引率是期刊发表在某一时间的论文在统计当年的平均被引率,本文指的是近两年期刊发表论文在统计当年的平均被引率。
文章影响力指的是文章的影响力指标。
以上数据主要来源于JCR。
4.3期刊学术影响力的评价方法----主成分分析法
在实际评价过程中,为了全面分析测评期刊学术影响力并作出可靠的判断,本文选取了众多与学术影响了相关的指标。
尽管每个指标都能反映都能反映学术影响力的一方面信息,但由于其重要性不同,指标之间有存在一定的相关关系,多个指标之间的变量增加了计算的复杂性,给准确合理的分析,解决问题带来困难。
于是,从数学上考虑,希望通过对原始指标构造适当的线性组合,易产生尽可能少的互不相关的一一系列综合性指标,并能够充分反映原始指标带有的信息,从而达到运用这几个新指标就能分析和解决问题的目的。
这种方法就是处理高维数据的主成分析法。
4.3.1方法简介
主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。
在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。
依次类推,I个变量就有I个主成分。
其中Li为p维正交化向量(Li*Li=1),Zi之间互不相关且按照方差由大到小排列,则称Zi为X的第I个主成分。
设X的协方差矩阵为Σ,则Σ必为半正定对称矩阵,求特征值λi(按从大到小排序)及其特征向量,可以证明,λi所对应的正交化特征向量,即为第I个主成分Zi所对应的系数向量Li,而Zi的方差贡献率定义为λi/Σλj,通常要求提取的主成分的数量k满足Σλk/Σλj>0.85。
4.3.2方法的目的
是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。
通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。
由此可见,主成分分析实际上是一种降维方法。
4.3.3方法步骤简析
数据标准化;
求相关系数矩阵;
一系列正交变换,使非对角线上的数置0,加到主对角上;
得特征根xi(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;
求各个特征根对应的特征向量;
用下式计算每个特征根的贡献率Vi;
Vi=xi/(x1+x2+........)
根据特征根及其特征向量解释主成分物理意义。
4.2.3方法优势
主成分评价方法通过相关系数矩阵的特征向量将评价指标线性变化成彼此独立的主成分,通过特征值确定主成分的取用维数和权重。
使用该评价方法对期刊进行评价的优点是:
(1)可以消除由于指标间的相关性带来的评价偏差,降低计算维数,从而降低指标选择难度。
此外,可以消除人为确定指标全中引起的弊病,是评价模型更具客观性和准确性。
(2)可以考虑尽可能多的计量指标,不用担心指标之间的相关重叠性,通过主要成分分析可以将位计算,去除指标之间的相关重叠因素,根据指标的变化幅度确定权重。
通过主成分因子负荷矩阵分析,可以看出各指标对评价值的影响深度,对今后的评价指标的选取可以提供定量的参考。
(3)可以有效消除自引过高导致影响因子失真对评价带来的负面影响。
4.4期刊学术影响力评价计算
4.4.1期刊学术影响力评价统计工具SPSS
由于主成分分析涉及到的数据量很大且计算过程复杂,所以在数据处理时,使用统计软件SPSS。
主要有以下几个步骤:
(1)定义变量及标签,输入数据。
(2)主成分分析过程;
(3)然后根据解释总方差的累计贡献率判断率主成分的个数,利用因子负荷矩阵表的值算出特征向量,利用公式计算出个主成分的值。
最后使用公式计算综合主成分值,得出排名。
4.4.2常规算法
可以用数学步骤按照主成分分析的原理求解,利用matalb进行数据分析及处理。
4.5期刊评价模型求解
我们利用建立的模型对2005年JCR收录的五千多种期刊的五种指标进行综合分析排名。
2005年实证分析:
(1)原始数据的收集
由于2005年收录的只给出了五项指标,分别为总被引次数,两年影响因子,即时指数,载文量以及半衰期(x5,x1,x3,x9,x8),各指标的原始数据见表1。
表一:
2005年期刊原始数据
X5
X1
X3
X9
X8
1
4218
46..794
21.3
20
3
2
167894
44.016
13.422
308
6.9
...
...
...
...
...
...
5471
4284
0.302
0.028
3671
4.1
5472
38975
0.402
0.062
18868
4.4
表中数据构成原始数据
,(i=1,2,.....501;j=1,2,...,5)。
(2)数据标准化
代表了不同性质的指标,其计量单位也不同,为了消除不同单位的影响,使各个指标具有可比性,需要对原始数据进行标准化处理。
经过处理的数据如下表2。
X5
X1
X3
X9
X8
1
0.01043
1
1
0.00106
0.3
2
0.036462
0.951922
0.508357
0.001537
0.6
...
5471
0.000267
0.000643
0.002911
0.000848
1
5472
0.000356
0
0.002629
0.001908
0.99
表2标准化数据
(3)通过对数据的进一步分析,通过协方差以及相关方差的公式对数据进一步处理,得到相关矩阵表:
X5
X1
X3
X9
X8
X5
X1
X3
X9
X8
表3:
原始指标标准化值的相关矩阵
主成分
特征值
贡献率
累计贡献率
F1
F2
F3
F4
F5
表3:
原始数据标准化值的特征值,贡献率和累计贡献率
F1
F2
F3
X5
0.4842
-0.4619
-0.4619
X1
0.5826
0.3235
0.1412
X3
0.5668
0.3463
0.177
X9
0.2957
-0.6828
-0.3013
X8
-0.1319
-0.3096
0.9243
表4:
因子负荷矩阵
则可以得出三个主成分分析为:
F1=0.4842*X5+0.5826*X1+0.5668*X3+0.2957*X9-0.1319*X8
F2=-0.4619*X5+0.3235*X1+0.3463*X3-0.6828*X9-0.3096*X8
F3=-0.4619*X5+0.1412*X1+0.1776*X3-0.3013*X9+0.9243*X8
根据主成分贡献率,易得出各期刊综合得分模型:
FT=0.1249*X5+0.4129*X1+0.4195*X3-0.1102*X9+0.05*X8
(4)计算综合得分并排序
按得分大小,排名前十的见表六:
次序
期刊名称
FT
F1
F2
F3
1
CA-CANCERJCLIN
0.848585
1.115217
0.571384
0.596392
2
NEWENGLJMED
0.713898
0.987038
0.087654
0.893661
3
NEWENGLJMED
0.640713
0.781718
0.280353
0.780961
4
ANNUREVIMMUNOL
0.520998
0.863088
-0.34617
0.852174
5
SCIENCE
0.503882
0.861662
-0.41164
0.86123
6
NATURE
0.44794
0.563075
-0.13016
0.925787
7
CELL
0.417668
0.395762
-0.04474
1.05941
8
REVMODPHYS
0.417482
0.436
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 期刊 排名 模型