从文献计量学到网络计量学嬗变的可视化分析.docx
- 文档编号:28675841
- 上传时间:2023-07-19
- 格式:DOCX
- 页数:19
- 大小:140.09KB
从文献计量学到网络计量学嬗变的可视化分析.docx
《从文献计量学到网络计量学嬗变的可视化分析.docx》由会员分享,可在线阅读,更多相关《从文献计量学到网络计量学嬗变的可视化分析.docx(19页珍藏版)》请在冰豆网上搜索。
从文献计量学到网络计量学嬗变的可视化分析
从文献计量学到网络计量学嬗变的可视化分析
赵蓉英/许丽敏
2012-10-2615:
44:
58 来源:
《情报科学》(长春)2011年7期
【英文标题】VisualizationAnalysisoftheEvolutionfromtheBibliometricstoWebometrics
【作者简介】赵蓉英,武汉大学信息资源研究中心,湖北武汉430072;许丽敏,武汉大学科学评价研究中心,武汉430072
赵蓉英(1966-),女,教授,博士生导师,主要从事信息管理与知识网络、信息计量与科学评价研究.
【内容提要】文献计量研究从产生到现在已经经历了90余年的历史,形成了一门成熟的学科—文献计量学。
随着定量研究的深入和社会环境的影响,信息计量学在文献计量学的基础上发展而来;而随着网络信息资源的激增,网络计量学应运而生。
本文以ISIWebofKnowledge数据库中收录的以文献计量学、信息计量学以及网络计量学为主题的数据为样本,利用动态网络分析的信息可视化技术和工具—CiteSpaceII,绘制出文献计量学、信息计量学以及网络计量学共被引知识图谱,揭示出它们的主要研究成果与代表人物。
同时绘制出文献计量学研究的前沿演进知识图谱,直观地展示出从文献计量学向网络计量学演进嬗变的发展历程。
Ithasbeenalreadyabout90yearssincetheoriginalofthebibliometricstudy,formedafully-fledgeddiscipline—Bibliometrics.Withthedepthofquantitativeresearchandtheeffectofsocialenvironment,theInformetricshasevolvedonthebasisofBibliometrics.AndalongwiththesharplyincreaseofInternetInformationResources,theWebometricshasemergedasrequired.Inthispaper,thedateresourcesaboutBibliometrics,InformetricsandWebometricsarecomefromISIWebofknowledge.Theauthorstrytousetheinformationvisualizationtechniquesofdynamicnetworkanalysis—CiteSpaceII,drawtheknowledgemapoftheliterature'sco-citationtoidentifytheimportantachievementsandrepresentativescientists.Atthesametime,theauthorsdrawtheknowledgemapoftheevolutionofBibliometrics'frontier,directlyshowthedevelopmentoftheevolutionfromBibliometricstoWebometrics.
【关键词】文献计量学/信息计量学/网络计量学/CitespaceII/知识图谱Bibliometrics/Informetrics/Webometrics/CitespaceII/Knowledgemap
计量研究始萌于20世纪初,到目前为止已经经过了90余年的历史。
纵观计量研究的发展历史,我们可以发现由于计量的对象发生了三次重要的演进与变化,从而形成三个相应的学科。
20世纪初到20世纪80年代,主要以文献为研究起点,形成了文献计量学,即以文献体系和文献计量特征,采用数学、统计学等的计量方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律;20世纪70年代末,信息计量学诞生,它主要以信息为研究起点,它是在文献计量学的基础上扩展和演变而成。
20世纪末,网络信息成为主要研究的对象,众多学者将信息计量学的理论与方法应用于网络信息的计量,进而诞生网络计量学。
可见信息计量学与网络计量学是在特定的环境以及技术条件下,由文献计量学逐步演进嬗变而成的,它们继承了文献计量学的理论基础和基本方法,并形成本学科独有的特征。
本文旨在利用动态网络分析的信息可视化技术和工具—CiteSpaceII,以ISIWebofKnowledge数据库中收录的以文献计量学、信息计量学以及网络计量学为主题的数据为样本,分别对文献计量学、信息计量学及网络计量学的研究成果与代表人物进行可视化分析。
同时我们利用CitespaceII软件中确定文献计量学的研究热点,展示信息计量学、网络计量学在文献计量学的基础演进而成的过程。
1以文献为逻辑起点的计量研究—文献计量学
文献计量学的思想可以追溯到1917年以科尔(COLEF.J.)为第一作者发表在《科学进展》(ScienceProgress)上的《比较解剖学的历史—对文献的统计分析》(TheHistoryofComparativeAnatomy——AStatisticalAnalysisoftheLiterature)。
在之后的一段时间里,许多学者开始致力于文献计量方面的研究,发现和建立了许多描述文献动态特征的经验性规律或定律,丰富了文献计量研究的理论大厦,为文献计量学的产生奠定了理论的基础。
1969年英国计算中心的普里查德(AlanPritchard)首先提出用“文献计量学”这一新名词来代替“统计书目学”一词,标志着文献计量学作为一门学科而产生。
至此之后,文献计量学进入了快速发展的时期,其理论的大厦得到稳固的基石,内容体系得到合理的建立。
在文献计量学的演进过程中,与此相关的文献囊括了文献计量学的理论研究、方法研究以及应用研究,形成了合理的内容体系。
笔者借助动态网络分析的信息可视化技术和工具—CiteSpaceII,绘制了文献计量学文献共被引知识图谱,展示了文献计量学的发展历史,如图1所示。
回顾文献计量学的发展历史,我们可以发现以下具有里程碑意义的研究成果,这些研究在文献计量学发展的长河中起到非常重大的影响。
图1文献计量学文献共被引知识图谱
1.1科尔与文献统计
由文献计量学文献共被引知识图谱可以发现,1917年科尔(COLEF.J.)发表在《科学进展》(ScienceProgress)上的《比较解剖学的历史—对文献的统计分析》(Thehistoryofcomparativeanatomy—Astatisticalanalysisoftheliterature)一文是文献计量学的思想源泉,文中首次利用文献统计的方法。
该文以1543—1860年间欧洲各国发表的有关动物解剖学方面内容的论文为统计对象,计算了在这一期间每年所发表的该专业论文数量,据此绘制了出版物数量的时间分布曲线;同时根据不同国家、地区所发表的论文的内容和数量,对各国、各地区的解剖学发展方向、水平进行了分析和比较,从而得出欧洲各国在此期间对比较解剖学的贡献;而且他们运用该方法,判定了在不同时期,解剖学研究者致力于研究的方面和发表的论文,并探讨了这些研究成果和研究者对解剖学思想史的影响[2]。
这次研究用事实说明了文献统计的方法及意义,其研究成果表明文献定量研究的无比威力和巨大潜力,使得文献计量的方法在文献统计的基础上发展起来。
1.2普理查德与文献计量学
1969年,英国目录学家阿伦·普理查德(A·Pritchard)在《文献资料工作杂志》(JournalofDocumentation)上发表一篇名为《统计目录学或文献计量学》(StatisticalBibliographyorBibliometrics),文中他第一次使用文献计量学(Bibliometrics)这一术语,提出了它的定义:
“文献计量学是把数学和统计学应用于图书和其他交流媒介的一门学科。
”,这一定义具有一定的普遍性和代表性,很快得到图书馆学、情报学界的普遍接受和认可。
同时他认为“书目统计学”涵义上含混不清,“书目统计学”可能被认为是一般性统计学,或者是有关书目的统计[3]。
他主张应当用“文献计量学”来替代“统计目录学”,这一建议很快得到普遍认可。
文献计量学术语的正式提出和确立,标志着文献计量学作为一门独立的学科正式诞生。
1.3洛特卡、布拉德福、齐普夫与文献计量学三大基本定律
洛特卡、布拉德福、齐普夫等著名研究者在文献统计调查的基础上,发掘出一些文献统计的规律,高屋建瓴地归纳出具有普遍指导意义的理论性结论,并取得了许多重要的研究成果,如图1所示。
其中最为重要的当为文献计量学的三大定律,这三大基本定律奠定了文献计量学的理论基础。
1.3.1洛特卡与洛特卡定律
1926年,美国人口统计学家洛特卡(LOTKAA.J.)发表在《华盛顿科学院会刊》(JournaloftheWashingtonacademyofScience)杂志上的《科学生产率的频次分布》(TheFrequencyDistributionofScientificproductivity)一文曾指出,科学文献作者与其撰写的论文呈现“平方反比”的数量关系,即在某一段时间内,写了x篇论文的作者数占作者总数的比例f(x)与其所撰写的论文数x的平方成反比。
同时洛特卡在数据研究中,考虑科学家数量与论文数量之间分布不均匀的局面,从而引入了“科学生产率”的概念,即“个体科研人员在一定时期内所撰写的论文数量”[4]。
由图1可见,代表这篇文献的节点比较大,证明这篇文献在文献计量学领域产生的影响比较大。
洛特卡定律作为较早创立的著名定律,为文献计量学诞生和发展做出了创造性的重要贡献。
1.3.2布拉德福、维克利与布拉德福定律
1934年1月,英国著名文献学家S.C.布拉德福在《工程》(Engineering)周刊的“图书与文献”栏目上的发表了一篇名为《专业学科的情报源》(SourcesofInformationonScientificSubjects)的一文,文中首次提出文献分散定律的基本思想。
布拉德福考察了论文在科技期刊中的登载情况,发现一个明显的趋势:
论文在期刊中的分布是不均匀的,少数期刊中聚集着大量的专业论文,少量的专业论文散落在大量的期刊中[5]。
他采用区域划分和图像描述来阐述其所得的结论,形成文献分散定律也叫布拉德福定律,但是当时这一著名定律的提出根本没有引起学术界的注意。
1948年,布拉德福将这一文献收入他的专著《文献工作》中,这一专著的正式出版使得这一定律有了明显的转机。
这一理论开始得到广泛的传播,并引起了一些学者的关注与研究。
维克利最早研究了布拉德福的文献分布理论,不仅充分地肯定了布拉德福德研究工作,而且对这一理论进行了修正、补充和创造性的推广。
维克利的研究成果,丰富了布拉德福定律,为这一定律的正式确定和广泛的传播与发展做出了重要的贡献。
可以说,布拉德福发现了布拉德福定律,而维克利传播和发展了这一定律。
1.3.3齐普夫与齐普夫定律
1935年,美国哈佛大学教授齐普夫教授,首先用大量的统计数据来验证前人有关词频分布规律的研究成果,并进行了系统的研究,形成和确立了齐普夫定律。
1948年,齐普夫博士完成了他的专著《人类行为与最省力法则一人类生态学引证》,并在1949年首次出版了这一专著[6]。
这一专著引用了大量的数据和事实,对“最省力法则”进行了精辟的论述,这一法则较好地解释了齐普夫定律的内在成因和机制,为齐普夫定律的形成奠定了理论的基础。
在“最省力法则”思想的指导下,齐普夫对语言进行了大量的研究,并进行了系统的分析,发现自然语言词汇的分布服从一个简单的定律,即在任何一篇文章中,词的分布服从以下规律:
如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数个这些词编上的等级序号,即频次最高的词等级为1,频次次之的等级为2……频次最小的词等级为D,若用f表示频次,r表示序号,则有fr=C(C为常数)[5]。
该式被称为齐普夫定律,定量地揭示了文献中词汇出现的频率分布定律,为文献计量学的基本定律之一。
1.4加菲尔德与科技引文索引
由图1可见,1955年美国著名情报学家加菲尔德(E.Garfield)发表在《科学》(Science)上的《引文索引用于科学》一文被引频次为62次,在文献计量学领域影响较大。
文中作者系统地提出了用引文索引检索科技文献的方法,并提出了引文索引和引文技术的概念,开辟了科学研究的新道路,为本学科经典的文献著作。
作为引文索引的开创者,加菲尔德打破了分类法和主题法在检索方法中的垄断地位,打开了从引文角度来研究文献及科学发展动态的新领域[7]。
此后,他和美国著名的科学史专家普莱斯(D.T.Price)在引文索引的基础上发展了引文分析的技术。
1961年加菲尔德在诺贝尔奖获得者J.Lederberg博士的帮助下,编成了第一部有关遗传学文献的引文索引,该索引得到了科学工作者的好评。
1963年他编制、出版了《科学引文索引》单卷本。
1964年ISI(科技信息研究所)开始正式出版发行《科学引文索引》(季刊)。
1973年又继而出版了《社会科学引文索引》(SSCI),1978年又出版了《艺术和人文科学引文索引》(A&HCI)。
由此,科技引文索引这项富有创意的发明在图书馆及情报界牢固地确定了自己的地位,也为文献计量研究提供了方便。
由上可知,文献计量学主要侧重于理论的研究,方法和工具相对研究较少,特别是工具。
由于技术的限制,文献计量学开始的大部分为人工的统计,也因为此文献计量学的应用也不是太普遍。
2以信息为逻辑起点的计量研究—信息计量学
随着定量研究的不断深入,情报学界逐渐感觉到“文献计量学”这一名称又已不能完全涵盖日益扩大的研究范围。
与此同时,纳克(OttoNacke)提出的信息计量学(Informetrics)这一名称。
在其后的文献中很快就出现了与之对应的英文术语,并被许多学者认同,而且得到了国际文献联合会的认可,这不仅消除了人们对信息计量学(Informetrics)一词的疑虑,而且也标志着一门新兴分支学科的兴起。
从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此渗透,有着许多共同的研究内容。
但是信息计量学主要着眼于“信息”本身的计量问题,而信息除了以文献信息的形式而存在之外,还存在很多其他形式的信息,因此两者又有着很多相同的地方。
信息计量学研究的范围比文献计量学的研究范围更为广泛,研究的方法也有很多创新,研究的热点领域也有所不同。
信息计量学研究的热点领域如图2所示,其中在信息计量学的理论、方法以及应用各个方面都有充分的研究。
2.1信息计量学的提出
信息计量学这一术语最先是由德国学者昂托·纳克(OttoNacke)以德文形式提出的,其意义为将数学的方法应用到信息现象的测量。
在1979年的一篇文章中,纳克(OttoNacke)提出,应将信息计量学置于信息科学之内,认为信息计量学是信息科学中有关信息测度方面的科学,也包含运用应用数学的方法对信息现象的研究。
在其后的文献中很快就出现了与之对应的英文术语信息计量学(Informetrics),并逐渐在英语国家中迅速流传开来。
1988年,布鲁克斯进一步指出,应以信息计量学(Informetrics)来替代文献计量学(Bibliometrics),因为文献计量学仅拘泥于“书目的计量”,而且已不适于现代电子化载体文献的计量。
布鲁克斯对于信息计量学的形成和发展起到了推波助澜的作用[1]。
同时,国际文献联合会(FID)对信息计量学进行了充分的认可,它至1987年以后举办的各届国际学术会议“文献计量学和信息检索的理论问题的国际研讨会”无不把信息计量学作为核心议题之一,后来国家文献联合会将会议的名称定为“科学计量学和信息计量学”。
国际文献联合会(FID)对信息计量学的认可,不仅消除了人们对于信息计量学的疑惑,而且标志着一门新兴分支学科的兴起。
2.2计算机辅助信息计量分析法
随着计算机系统功能的不断增加以及文献信息持续激增,信息计量研究对计算机的依赖与日俱增,计算机在信息计量研究中占据了举足轻重的作用,无论是理论研究还是应用研究都离不开计算机,如图2所示,计算机辅助信息计量分析研究已经成为信息计量学研究的重要内容和发展的新趋势。
图2信息计量学研究热点知识图谱
计算机辅助信息计量分析法就是针对某一特定学科或课题,借助有关的计算机系统进行信息的统计、分析、模拟,推理,并给出相应的统计分析结果的研究方法,它与传统的文献信息计量分析法在本质上是一样的,它们都是一种定量的分析方法。
不同的是计算机辅助的信息计量分析法因为有计算机的存在,其收集的数据更为全面、准确,整理分析数据的速度比较迅速,分析的结果也更加有可信度,同时为信息计量学分析应用范围的扩展提供了可能性。
计算机辅助信息计量分析法也要经历三个基本步骤,即数据收集、数据整理、数据分析,每一个步骤中,计算机系统都起到关键性的作用。
2.3地区、机构科研评价
由图2我们可以发现,利用信息计量学的方法评价学术成果的影响力是信息计量学研究的热点领域,同时也是信息计量学主要的应用方面。
从信息计量的角度来探讨和评价国家、地区和机构,是非常有意义的研究。
在实施科学管理的过程中,科学地评价国家、地区及科研机构的科研水平和学术地位是一个难题,也是很有价值的研究,信息计量学为这一研究提供了可行的方法。
匈牙利著名的科学计量学家布劳温(T.Braun)根据美国《科学引文索引》的数据,概略地提出了一种评价的指标体系,并利用这些指标和引文分析方法评价了某一国家、地区及科研机构的科研水平和学术地位的排序,绘制出世界科学地理图,分析了各国的科学现状和发展趋势。
此后,舒伯特(A.Schubert)等也根据《科技引文索引》统计的数据对全世界96个国家的114种主要学科专业的水平以及在世界上的相应地位进行了综合评价,利用了已确定的指标体系,反映了1981~1985年之间,世界各国及地区科研活动的水平和文献交流状况。
利用信息计量学的引文分析方法进行科研机构的统计评价也同样是非常客观有效的,而且近年越来越多地被人们用来评价各类科研机构的科研状况及绩效排序。
这一研究使人们清晰地了解各个机构的科研水平以及所处的位置与差距,为各个机构的未来发展提供一定的指导意义。
3以网络信息为逻辑起点的计量研究—网络计量学
随着信息科学和信息技术的迅速发展以及互联网的普及应用,信息资源进入到电子化、数字化和网络化阶段,网络信息交流活动迅速激增,原有的信息计量的指标不再适用于测度网络信息资源,从而促使了网络计量学的产生。
可以认为,网络计量学是信息计量学为了适应网络环境而发展起来的一个新型分支学科。
目前网络计量学的研究已经取得一些成果,发表了一系列有关网络计量学的文献,形成了部分研究热点领域,研究的内容主要实证和应用的研究,理论研究相对较少,如图3所示,这一学科的主要研究成果表现在以下几个方面。
图3网络计量学文献共被引知识图谱
3.1Almind、PeterIngwersen与网络计量学
网络计量学的提出源于1997年T.C.Almind和PeterIngwersen共同撰写的《万维网上的信息计量分析:
网络计量学的方法探讨》(InformetricAnalysesontheWorldWideWeb:
MethodologicalApproachestoWebometrics)一文,该文的被引频次为50次,位于所有文献被引频次的首位,可见这一文献在网络计量学领域影响非常大。
文中描述了一系列进行Web信息分析的方法和参数,并且以丹麦与其他的北欧国家的比较作为个案。
他指出信息计量方法所使用的手段完全可以应用到万维网上,只不过将万维网看做引文网络,传统的引文由Web页面所取代。
同时他首次提出了“Webometrics”一词,并对其进行了定义,即包括了所有使用信息计量和其他计量方法对网络通信有关问题的研究[8]。
这一术语提出后很快得到了国际学术界的响应和广泛使用,迅速掀起了网络计量学的研究热潮,这一文献被认为是网络计量学诞生的标志。
3.2McKiernan与链接分析
1996年,McKiernan根据文献计量学引文的含义,提出了“Cited—sites”的概念,用以研究网页之间的链接关系[9]。
此后,链接分析进入快速发展时期,许多学者利用链接分析对网页进行研究与评价。
在链接分析以后的发展过程中有这些概念:
Larson的共链分析(1996年),Almind和Ingwersen的“Webmetrics”(1997年),PeterIngwersen的“网络影响因子”(1998年),SergeyBrin和LawrencePage提出“Pagerank算法”、J.Kleinberg提出“HITS算法”(1998年)等等。
事实上,从“citation”到“sitation”,从“期刊影响因子”到“网络影响因子”,从“文献的同引与耦合”到“网页的同引与耦合”,都表明链接分析带上了引文分析的烙印[10]。
链接分析目前在网络计量学中占有相当大部分的研究内容,网络计量研究大都将分析网络超链接结构作为出发点。
网络链接分析在分析链接自身特点的基础上,更多地借鉴了引文分析的理论与方法。
未来网络链接分析将着重研究链接分析数据的来源,链接分析的本质特征,链接分析的基本机理和链接的基本动机等。
这些方面除了计量分析外,还需要采用传播学、社会学和心理学等多学科的定性研究;另外,链接分析过程中也还需要综合其它方法,如社会网络分析法和数据仓库及网络数据挖掘等。
3.3RonaidRousseau与网络信息的洛特卡分布
随着网络的兴起及网络信息的飞速增长,有学者将洛特卡定律应用于网络计量学中,研究网络信息及其生产者的分布规律。
1997年,著名信息计量学家RonaldRousseau在电子期刊Cybermetrics上发表了题为Sitations:
AnExploratoryStudy的论文,文中他以bibliometrics、innformetrics和scientometrics为主题,利用AltaVista研究该领域研究了域名和链接的分布规律。
通过对网址的分布模式和进入网页的链接分析发现,他所选择的343个网址中最高层域名服从洛特卡分布,而且对这些网址的引用也符合洛特卡分布,自引比例约为30%。
而且他还指出,对网页链接关系的研究与对发表文章的引文研究具有相似性,但也有很大的不同。
他还指出,网络内容具有很强的易变性,导致研究过程无法重复,研究者应该谨慎[11]。
3.4PeterIngwersen与网络影响因子
PeterIngwersen在1998年发表的文章《网络影响因子探索》(Thecalculati
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 计量 学到 网络 计量学 嬗变 可视化 分析