国内三大中文期刊全文数据库的比较.docx
- 文档编号:9143706
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:10
- 大小:24.36KB
国内三大中文期刊全文数据库的比较.docx
《国内三大中文期刊全文数据库的比较.docx》由会员分享,可在线阅读,更多相关《国内三大中文期刊全文数据库的比较.docx(10页珍藏版)》请在冰豆网上搜索。
国内三大中文期刊全文数据库的比较
中国期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据库资源系统数字化期刊》是国内影响力和利用率很高的综合性中文电子期刊全文数据库,这三个数据库已经成为大多数高等院校、公共图书馆和科研机构文献信息保障系统的重要组成部分。
在互联网中,这三大数据库也成为中文学术信息的重要代表,体现了我国现有的中文电子文献数据库的建设水平。
笔者结合工作和学习中的实践,就上述三大数据库的收录情况、检索功能、检索结果、检索界面、用户服务等方面进行全面的比较,并通过检索实践举例进行比较分析,以供参考。
1收录情况(数据较早,甚至不是2004年的数据,感觉更像2002年左右的数据,后面将尽可能给出最新的数据值。
)
收录范围与数量
《中国期刊网全文数据库》(本文中简称“清华”)是由清华同方光盘股份有限公司、光盘国家工程研究中心和中国学术期刊(光盘版)电子杂志社共同研制出版的综合性全文数据库。
该数据库收录自从1994年来公开出版发行的6600余种国内核心期刊和一些具有专业特色的中英文期刊全文,累积全文文献618万多篇,题录1500万余条,按学科分为理工A(数理科学)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学九大类,126个专题文献数据库。
《中文科技期刊数据库》(本文中简称“维普”)由科技部西南信息中心主办,重庆维普资讯有限公司制作。
其前身为《中文科技期刊篇名数据库》。
该数据库收录了自1989年以来国内出版发行的12000种期刊,其中全文收录8000余种,按学科分为经济管理、教育科学、图书情报、自然科学、农业科学、医药卫生、工程技术等7大类,27个专辑,200个专题,按《中图法》编制了树型分类导航和刊名导航系统,基本覆盖了国内公开出版的具有学术价值的期刊,同时还收录了中国港台地区出版的108种学术期刊,积累700余万篇全文文献,数据量以每年100万篇的速度递增。
《万方数据资源系统数字化期刊》(本文中简称“万方”)是万方数据库资源系统三大组成部分之一,由中国科技信息研究所属下的北京万方数据股份有限公司创办。
万方期刊收录了我国自然科学的大量期刊以及社会科学的部分期刊,范围包括基础科学、医药卫生、农业科学、工业技术、人文科学等5大类,以及英文版期刊、中国科学系列杂志,共2500多种期刊。
期刊收录情况
通过对三个期刊数据库收录情况进行统计分析,得到以下结果:
1.2.1根据《中文核心期刊要目总览》(2004年版)统计,我国核心期刊共1800种,由这三个数据库收录的期刊统计结果显示,“清华”收录核心期刊1391种,“维普”收录1490种,“万方”收录1300种核心期刊。
从绝对数量来看,三者的核心期刊收录量相差不大,但从以上三大数据库核心期刊收录量分别占期刊总数的百分比来看,分别为%(“清华”)、%(“维普”)和52%(“万方”),“万方”数据库占有绝对优势。
文史哲类期刊收录情况。
“维普”收录了5种,占此类期刊总量的%;“清华”收录了451种,占此类期刊总量的%;而“万方”收录了500种,占此类期刊总量的%。
说明“维普”在收录文史哲类期刊中所占比例很低,也比较符合它《中文科技期刊数据库》的名称。
医药卫生类期刊收录情况。
“维普”收录1153种,占此类期刊总量的%,“清华”收录809种,占此类期刊总数的%,“万方”收录588种,占此类期刊总数的%。
农业类期刊“维普”收录756种,占此类期刊总数的%,“清华”收录531种,占此类期刊总数的%,“万方”收录了246种,占此类期刊总数的%。
另外,在自然科学与工业技术、教育与社会科学、政治经济与法律等类目中,“维普”的收录量都是排名第一。
通过比较“清华”和“维普”收录期刊名录,得知两数据库期刊收录重复率约为50%,说明两数据库互补性很强,相互不可替代。
而“万方”收录期刊与这两个数据库的重复率较高,在80%以上。
从上述分析看,这三个数据库基本覆盖了科学技术和社会科学的各个领域。
其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“清华”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。
“清华”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。
而“万方”收录期刊数量为三者中最少,但核心期刊比率很高,收录文献的质量最高。
2检索功能
检索入口比较
通过对三个数据库的使用、检索及测试,笔者得出以下结论:
(1)三个全文数据库都配备了强大的检索系统,提供了导航检索、简单检索和复合检索等三种检索方式,其中导航检索都包括了学科分类导航和期刊名称导航两项功能,读者不需要输入具体的检索词,就可按照分类或期刊名称,通过层层递进的方式,检索到某一专题下的论文,并按题录链接浏览全文。
检索方法简单易学。
数据库检索选择范围灵活,可以选择一个或多个专辑进行检索,在同一专辑下,可选择一个或多个专题进行检索。
(2)三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个的检索入口。
同时根据各自系统的特点,“清华”的检索入口最多,还提供了引文、基金、全文、ISSN、主题词、年、期等7个特有的检索入口。
“维普”则提供了第一作者、分类号、任意字段等3个特有的检索入口。
而“万方”没有提供其他检索入口。
(3)通过“清华”的“全文检索”和“维普”的“任意字段检索”,在对相同检索词进行检索时发现,前者的命中率较高,在一定程度上弥补了主题标引缺乏规范化所带来的漏查,有利于提高文献的查全率,但往往检出的文献太多,用户难以挑选到合适的文章,该检索方式对于检索前沿性课题文献信息或文献量较少的冷门课题较为适用;而后者(“维普”的“任意字段检索”)是在文章中除正文以外的其他任何部分进行检索,检出率虽然低于全文检索,但相对比较实用。
检索策略比较
简单检索
“清华”和“万方”的简单检索只有一个检索框,不支持同时输入多个运算符,就是说一次只能输入一个检索词。
而“维普”的简单检索支持同一检索框内同时输入多个运算符组配的词。
高级检索
“清华”有四个检索框,提供多个检索项目进行逻辑组合检索,有检索结果排序方式和检索年限设定和专辑的选择;“万方”提供有两个检索框,提供多个检索项目进行逻辑组合检索,可以限定检索内容的大类和检索期刊的所在地区;“维普”提供四个检索框,可以实现检索条件的组配,还可以限定检索期刊范围,提供了检索年限的设定。
检索特殊功能比较
“清华”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。
“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。
而在进行作者字段检索时,可以通过调用同名作者库实现作者单位的限定,提高查准率。
另外进行了期刊类型的划分,分为全部期刊、重要期刊和核心期刊,使检索可根据需要灵活选择。
同时“维普”还提供了中图法分类号的检索功能。
对于关键词不规范的学科和领域,通过分类号检索,能提高某一学科文献的查准率。
《万方数据资源系统数字化期刊》在检索时,可以对期刊所分布的地域进行限定。
但笔者认为这一功能实用性不强。
3检索结果
检索效果的比较
对于三大数据库,在设定相同检索条件的情况下(检索入口和检索限定一致),分别选择“题名”、“关键词”、“著者”和“分类”等四个检索入口进行检索,得出的结果见表1。
表1检索结果数量统计表
原表见
通过检索返回数量统计表中的数据分析,可以得出这三种数据库的自身特点、收录的范围和学科类别的情况。
比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“清华”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇;张靖龙教授是从事文学研究的,在上表中“清华”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。
从这个对比中可以看出,三个数据库中综合性最强的是“清华”,收录理工科科技信息文献最多的是“维普”。
全文浏览的比较
三个数据库中的文献都可以浏览原版的图像全文,也可以用文献浏览器上提供的OCR识别系统进行文字识别处理文献。
其中“清华”的全文要用CAJ全文浏览器或AcrobatReader浏览器;“维普”的全文需要用VIP浏览器打开(已改为AcrobatReader浏览器);而“万方”使用AcrobatReader浏览器打开,有些文献可以在IE中直接打开。
单从数字化水平来说,笔者认为“万方”的数字化技术在三者中是最好的,它所用的是全球通用的PDF格式全文,方便交流,从打开的页面上看,制作得也比较精细。
其他两个所用的是自己公司生产的浏览器,文献页面存在一定的缺陷,特别是“维普”的全文甚至出现手写文字。
当然数据库数字化的水平也在不断进步中,比如:
“清华”也推出了PDF的下载方式,自身的CAJ浏览器也在不断完善;“维普”页面数字化水平也在不断提高,同时从最新的信息来看,“维普”也将推出PDF格式的全文。
可以说未来的趋势就是三大全文数据库都会提供通用的PDF格式的全文,并最终过渡到统一的格式。
显示、排序与去重功能比较
“清华”的检索结果是按照主题的相关度和文献的日期排序输出,可以设定每页显示文献的数量。
“维普”的检索结果是按照时间的倒序排列,同时间段按期刊顺序排列,用户不用翻页就可以浏览最新的文献。
“万方”在初次检索时不能设定检索结果显示的顺序,但在二次检索中可以设定是通过“升序”或“降序”排列。
数据库的去重功能做得都不够好,有待于进一步完善技术。
(不是很理解这句话的意思,倒是希望有进一步分析。
)
文摘结果显示比较
通过文献的文摘就可以了解一篇文章的基本情况,而不用浏览全文,这样科研人员就可以通过浏览文摘了解是不是自己找的文章,可以节约大量的时间。
“清华”的文摘显示内容有:
篇名、作者、刊名、机构、引用链接、被引用链接、聚类检索、摘要、光盘号。
“维普”的文摘显示内容有:
标题、刊名、作者、关键词和摘要。
“万方”的文摘显示内容有:
光盘号、题名、作者、机构、刊名、ISSN号、CN号、藏号、关键词、分类号和摘要。
三个数据库中文摘做得最好的是“清华”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。
4界面友好性
一个数据库的特点和优越性可通过它的检索界面表达出来的,界面友好、使用简单的数据库可以很快地让读者接受,读者也能比较容易地从海量文献中检索出自己要找的文献信息,反之,一个数据库收录了很多优秀的文献信息,数字化水平也很高,但是检索界面比较复杂、缺乏人性化,这样就会使数据库的使用大打折扣。
“清华”配备了功能强大的网络数据库全文检索系统,从它的检索界面中可以看出,该数据库检索方法简单、灵活,即使不具有专业检索知识的用户也很容易掌握。
“维普”通过分类和导航实现文献的浏览,还能通过初级和高级检索进行检索,页面之间衔接的比较清楚,从单个页面上看,也一目了然。
“万方”通过多种途径检索文献,但是页面过于复杂、繁琐,很难让初次接触的读者顺利地检索到文献,或达到很高的查准率和查全率,同时在页面的组织、导航的实现上也有待完善。
但是和外文全文数据库相比,国内这三大数据库都没有开发相应的个性化检索功能,智能服务程度不高,不能不说是一个遗憾。
5用户服务
在服务方式上,三个数据库都提供了检索服务卡、光盘、局域网等检索方式,同时还提供了建立镜象站点、包库、流量计费等服务方式。
从订购价格上看,“维普”最为便宜,且使用和维护比较方便。
“万方”则价格相对较高。
从用户角度上看,在选择数据库时可根据本单位具体特点及需求进行选择,对大型综合性图书馆,在经费许可的前提下,可考虑购置以上三种全文数据库或根据需要选择相应专辑进行补充选购。
对一些专业性图书馆,可采用购置本专业的光盘、包库、流量计价等方式来降低费用;对于检索量小的综合性图书馆或单位,可通过建立镜像站点,并控制用户数,这比购买光盘价格更优惠。
对个人读者,可考虑购买检索阅读卡,通过互联网进行检索。
当从网上获得全文时,从直接下载速度看,“清华”和“万方”快于“维普”,并且,每一篇文献都能从题名及题录直接链接到全文进行下载,而“维普”却有许多文献要通过E-mail方式才能获得。
全文型文献数据库的评价标准
郁笑春胡芒谷
内容提要本文在对全文型文献数据库的新特点进行阐述的基础上,强调对全文型文献数据库的评价标准必须坚持科学性、整体性、可行性、动态性和针对性的原则,定义了评价标准的4个要素,即内容、界面设计、检索功能和可获得性,并展开了详细讨论和分析。
关键词全文;文献数据库;特点;评价标准
全文型文献数据库是当前图书馆和情报所对外提供文献服务的重要文献资源,具有集成度高、信息量大而全、可获得性强等特点。
在国内,万方、维普、清华同方、书生和超星等机构都有自己成熟的全文型文献数据库产品;在国外,Elisever、EBSCO、Blackwell等公司也有各自的全文型文献数据库对外提供服务。
本文拟在阐述当前全文文献数据库新的特点的基础上,对全文型文献数据库的评价标准进行讨论和分析。
1 全文型文献数据库的新特点
全文型文献数据库经过多年的发展和完善,在现阶段呈现了以下新特点:
(1)强大的检索性能,检索结果处理多样化
全文型文献数据库已不是简单意义上提供关键词检索和外部特征字段检索并提供全文即完成任务的传统数据库。
事实上,随着其检索入口和手段的不断丰富,各类索引技术(包括基于形态的字索引技术、基于语义的词索引技术、基于内容的主题索引技术完全匹配的高效串索引技术以及字词混合索引技术)的开发,全面提高了全文型文献数据库的检索速度、查准率和查全率,检索功能不断加强。
如EBSCO的图片检索、索引词检索和引文检索,清华同方期刊全文数据库的引文检索,维普全文数据库的同义词词典等,均大大加强了全文型文献数据库的检索功能。
同时,许多数据库在检索结果的显示方式上灵活多样,更加人性化,主要表现为:
显示记录数的限定;排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列:
显示格式的多样化,可提供题录、题录+文摘、全记录或选择字段等多种格式显示。
(2)类型多,收录文献全,数据库质量高
如Elsevier收录的270种医学类期刊中,有171种被SCI收录,20种被SSCI收录;部分期刊从创始年开始收录,回溯检索与印刷型期刊同步发行与更新;数据标准、规范、多元,都支持IE、Netseape等通用浏览器,且支持功能强,数据更新及时,大多为日更新:
网络型期刊通常使用PDF格式文档的标准阅读器AcrobatReader等。
许多全文型数据库提供了多种形式的链接,用户通过检索不但能看到全文,也为读者提供了其他服务线索。
(3)用户界面友好方便,易于理解,便于使用
数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号表示。
数据库往往设有专门的功能帮助键,帮助信息详略适当、清晰,便于查阅。
(4)增加了个性化服务内容
任何文献用户都有其特殊的文献需求,越来越多的全文型文献数据库开始为用户提供强大的个性化服务内容。
例如,EBSCO的host文件夹就是一个强大的个性化服务工具,其功能包括保存结果列表(ResuhListItems)、网络链接保存(PersistentLinkstoSearches)、检索历史保存与定制提醒(savedSearches/SearchAlerts)、期刊提醒(JournalAlerts)、资料整理网页(WebPages)等。
2 全文型文献数据库的评价原则
对于用户和图书情报机构来说,如何选择全文型文献数据库,对于相同类型的全文型文献数据库如何进行评价和选择,是一个很重要也很现实的问题。
一般来说需遵循以下原则:
(1)科学性原则
全文型文献数据库既是网络资源,也是科技文献的一种。
要求指标的定义、计算方法等应符合网络资源评价分析和一般文献评价的基本理论,在考虑应用的同时需要与此相互协调。
(2)整体性原则
建立数据库评价指标体系是一项系统性的工作,应该使评价指标全面反映评价对象多方面的主要特性。
因此,评价指标体系应体现主客观相结合、定性与定量相结合的特点。
整体性原则还要求各指标间相互独立,指标间的相关性,不仅增加了评价工作量,而且直接影响评价的有效性和可靠性,使评价结果出现偏向性。
因此,在建立指标体系时要考虑各指标反映的信息是否与其他指标存在重叠,并尽量减少这种相关性。
(3)可行性原则
评价指标应力求简便、实用、指标涵义明确,数据便于获取。
同时,数据在时间和空间上要具有可比性。
(4)动态性原则
指标应能够反映系统动态变化的特点,即反映全文型文献数据库内容变更、软件升级、软件服务变化等动态特性。
(5)针对性原则
指标体系应该符合读者使用需求的特点。
表征全文型文献数据库的指标很多,如果选取的指标太多,一方面难以突出影响数据库品质的主要因素,另一方面太多的指标也增加了指标间相关的可能性。
同时,评价体系以满足文献用户的一段时间的特定需求为目的,没有必要采用太多的指标。
3全文型文献数据库的评价要素
根据以上评价标准设定的原则,综合分析国内外诸多全文型文献数据库,我们认为,可由内容、界面设计、检索功能和可获得性4个要素作为全文型文献数据库的评价标准。
3.1内容(Content)
内容代表了一个数据库的真正价值,内容的质量又可由权威性、覆盖面和收录时间3个方面来体现。
(1)权威性(Authority)
全文型文献数据库的权威性体现在出版者、审查制度和收录文献3个方面。
例如,ScienceDirect是Elisever公司出版的全文型文献数据库,该公司是国际知名的科学和工程技术文献提供商,历史悠久,并且在业内享有很高的声誉和口碑,用户普遍有认同感,该数据库收录的文献都是特定专业领域的高质量论文,有非常严格的审查制度,保障了数据库的权威性。
(2)覆盖范围(Coverage)
覆盖范围包含覆盖内容和覆盖时间两个方面的含义。
全文型文献数据库根据覆盖内容和领域分为综合性和专业性两类全文型文献数据库,如ScienceDirect是世界上最大的科学、技术和医学文献数据库,而Emerald则是管理学和图书馆学情报学专业类数据库,其建设目标都是给文献用户一个彻底的全文解决方案,因此数据库覆盖本文原文的广度、提供内容的多少等是至关重要的:
对于时间上的覆盖范围来说,文献数字化的浪潮出现在上世纪90年代末和本世纪初,文献全文数字化程度与其加工能力有很大提高,因此全文型文献数据库收录文章一般都是从上世纪90年代开始的,这也是我们判断全文型文献数据库好坏的重要依据。
(3)时间性(Timeline)
全文型文献数据库与纸质型文献相比在出版上要滞后一个时间差,这个时间差如果过长,读者就会转而去查阅纸质型文献或者其他数据库产品。
随着读者需求的进一步提高,许多数据库生产商正在努力减少甚至消除这种时间差,有的数据库产品与纸质型文献做到了零时差,有的数据库生产商能够提供预印本期刊全文,有效地消除了时间差。
3.2界面设计(InterfaceDe-sign)
因为读者对数据的浏览和检索都要通过人机界面来实现,优秀的人机界面会对用户起到良好的引导作用,而不好的人机界面常常会有误导、出错等情况产生,因此界面的设计也是评价数据库系统的重要指标。
有的数据库系统界面除了有很多类信息外,还提供了很多使用工具和选择项,但同时也产生了负面影响,就是界面过于纷乱复杂;而有些数据库界面就比较简洁直观,读者也比较容易上手,类似于搜索引擎的Google和Baidu。
因此,特定需求下的一些功能和界面的设计是非常有用的,比如清华同方的“知网节”为读者提供了单篇文章的关联线索,包含了单篇文献的题录摘要以及该文献各种扩展信息的入口汇集点,这些扩展信息通过概念相关、事实相关等方法揭示知识间的关联,达到知识扩展的目的,帮助实现知识获取和知识发现,也为读者二次检索提供了方便;SeienceDirect有一个“主题页面”的界面(subjeetHomepage),对用户使用数据库提供了记忆功能,可以记忆用户使用系统的路径,避免了老用户对使用路径的多次反复操作,而且作为国际文献提供商,还提供了多种非英语语言的支持。
3.3检索功能(SearchFunc—tionality)
首先,优秀的全文型文献数据库可以提供读者适用的检索工具,包括检索语句、下拉菜单等,检索功能的优劣要靠系统响应速度、使用灵活性以及读者对人机交互能力的控制上来判断。
同时,强大的浏览功能也是必不可少的,因为许多读者的需求要用检索和浏览交替进行来实现。
其次,系统提供的下载速度和功能也很重要,下载速度过慢会导致读者心理焦虑和信心丧失,对数据库评价降低。
HTML文本格式下载速度较快,消耗系统资源也较少;相反,PDF格式的文本需要更多的下载时间,但是它更能完整地反映文本的原貌,所以系统使用何种文本格式对系统的检索功能构成影响。
3.4可获得性(Accessiblity)
数据库产品目前有单机版和网络版之分,网络版的数据库可通过局域网进行共享,产品可获得性较好;单机版数据库只能在一台计算机上使用,共享性差。
除此之外,数据库还应配有FAQ和HELP等性质的文档供用户学习借鉴,用户可以方便地进入和使用数据库,有的数据库系统还专门为图书馆员配备了专门HELP系统,可以帮助他们更好地开展参考服务。
综上所述,在全文型文献数据库不断发展和完善的今天,用户对全文型文献数据库提出了更新的要求,如何选择高质量又符合用户需求的文献数据库产品,对于文献用户特别是图书情报机构愈发显得重要,我们希望本文的论述能对他们的工作和实践产生一定的帮助。
同时要指出的是,很少有全文型文献数据库产品都做得近乎完美无缺的,最重要的是它们在满足用户需求方面做得如何。
原载:
《中国信息导报》 2007年第1期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国内 中文 期刊 全文数据库 比较