科学数据出版应用实践-中国科研信息化_精品文档.pdf
- 文档编号:3212733
- 上传时间:2022-11-20
- 格式:PDF
- 页数:18
- 大小:1.03MB
科学数据出版应用实践-中国科研信息化_精品文档.pdf
《科学数据出版应用实践-中国科研信息化_精品文档.pdf》由会员分享,可在线阅读,更多相关《科学数据出版应用实践-中国科研信息化_精品文档.pdf(18页珍藏版)》请在冰豆网上搜索。
第1章科学数据出版应用实践胡良霖黎建辉高瑜蔚姜璐璐(中国科学院计算机网络信息中心,北京,100190)摘摘要要:
文章在综述国内外科学数据出版研究现状的基础上,结合我国科学数据开放共享的进展及制约因素,重点介绍了我国科学数据出版的实践,明确出版流程、建立标准体系、构建出版系统、创立数据存储库,并主办国家网络连续型出版物的首批试点刊物中国科学数据(ChinaScientificData,国内统一连续出版物号CN11-6035/N),建设数据出版平台和科学数据存储库,面向未来数据出版全面发展深度思考了数据出版生态系统的建设,力推我国科学数据出版的健康发展。
关键词关键词:
数据出版,数据论文,中国科学数据Abstract:
Onthebasisofdomesticandforeignresearchforscientificdatapublication,combinedwithconstraintsintheprogressoftheopensharingofscientificdata,thisarticlefocusesonsomepracticesofscientificdatapublication,suchashowtomakethepublicationprocessclear,howtoaccomplishtheestablishmentofstandardsandthecreationofpublicationsystemanddatarepositories.Basedontheabovecontent,anationalcontinuousnetworkpublicationofthefirstpilotnamedChinaScientificDatawascreatedandoperatedin2015(thenationalunifiedpublicationnumberisCN11-6035/N).Ecologicalsystemofdatapublicationisputmoredeepthoughtsoninthisarticle,forcomprehensivedevelopmentofdatapublicationinthefuture,andpushingthehealthygrowthofscientificdatapublicationinChina.Keywords:
datapublication;datapaper;ChinaScientificData1.1综述综述作为南极条约、百慕大协议等众多国际数据共享条约、协议、宣言等的缔约国,我国政府和科学家很早就积极参与了全球数据开放共享的探索和实践,中国科学院1982年率先启动了科学数据库工作并持续建设和共享服务至今,科技部2001年起从更高层面、更广范围内牵头组织实施了科学数据共享工程,以这两个项目为代表的我国科学数据共享的探索取得了显著的社会效益和一定的经济效益,在科技创新、学科发展、国家经济建设、国防建设、规划决策、国际合作等诸多方面得到广泛应用,并在国内外产生了积极的影响。
但不可否认的是,整体上来看我国在公共资助产2生的数据的共享和获取方面仍处于较低水平,被纳入有关工程项目中提供开放共享的数据也只是公共资助产生的数据中的一小部分1,置身大数据时代的当前,数据共享资源总量及程度远远不能满足社会各界的期望或要求,由于国家管理体制机制等多方面原因,科学数据难以共享的问题十分突出2。
张晋朝、何琳等各自对科研人员数据共享意愿研究发现科研人员的自我价值感知、互惠预期等都是影响共享数据资源的重要因素,并建议完善数据共享奖励政策、知识产权认定和科学数据引用评价机制等,通过一系列措施增加数据共享增值效益,提高科研人员数据共享积极性,可以有效地促进科学数据共享发展3,4。
近年来被各界逐渐关注的数据出版,明确定义数据发表者及发表机构的权益和归属、贡献,提升各贡献方的知名度和影响力,同步公开共享有质量保障的数据资源,克服了诸多传统数据共享中存在的不足,被认为“有望从机制上改变目前数据共享所面临的根本问题”5。
作为一种创新的科学共享数据方式,黎建辉等认为“科学数据出版是指科研人员与科研机构按照统一规范的质量管理和控制机制,利用互联网公开发布其通过观察、实验、计算分析等科研过程所产生的原始数据(rawdata),或通过对已有数据进行系统化地收集、整理和再加工后形成的数据及数据产品(dataproduct),帮助使用者便捷地发现、获取、理解和再分析利用数据,且可在科研论文及相关科研成果中引用数据的出版行为”6。
当前,科学数据出版主要有独立数据出版(StandaloneDataPublication)、学术论文辅助数据出版(DataPublicationbyProxy)、附录数据出版(AppendixData)、期刊数据档案出版(JournalDrivenDataArchival)以及数据论文出版(Overlaypublication)等五种模式。
以数据论文(DataPaper)的方式出版科学数据,可规范数据引用并对其进行跟踪统计与分析,很好地解决了传统科学数据共享中存在的科研激励机制、知识产权模糊、数字资源标识等核心问题。
所谓数据论文,是指“对特定在线数据集进行描述、按照一定学术规范出版并可被检索的元数据文件”7,目标是提供“数据内容、数据位置和数据来源信息”8,“主要描述相关数据集的数据收集方法、特征描述,获取方式和潜在重用性,而不强调数据的处理和分析过程”9。
Nature认为数据论文作为一种开放访问并经过同行评议的新型出版物,对具有科学价值的数据集进行描述,结合传统期刊论文内容和结构化描述模式,使数据更具发现性、引用性、解释性和重用性。
10本文将在综述科学数据出版国内外现状的基础上,重点介绍科学数据出版研究中对科学数据出版流程、标准体系、出版系统和长期存储等内容的系统探索,特别是创刊中国科学数据的实践,以及面向未来数据出版全面发展的生态系统构建的思考。
1.2国内国内外现状外现状2013年以来,国内诸多学者对Ecologicalarchives、EarthSystemScienceData、BiodiversityDataJournal、NatureScientificData等的数据出版实践进行了多维度的研究,诸如吴立宗从学术出版界、科学数据共享界的角度分析国际科学数据出版现状5,刘凤红等从数据论文及其相关概念、数据论文的出版实践等方面探讨了国际上数据出版的种类和数据出版的关键问题:
出版流程、质量控制和权3益管理11,傅天珍等重点分析了我国现有期刊的数据出版及其政策的现状12,雷秋雨等在分析现有数据期刊出版模式等现状的基础上探讨了未来发展趋势13,欧阳峥峥等从学科属性、出版方式、收录内容要求、引用机制、版权协议、费用等方面深入分析了国际上15种重要数据期刊的现状14,张静蓓等详细探讨了现有数据出版模式及其引用策略15,高雅等以Nature出版集团的ENCODE项目为例探讨了基于数据挖掘和可视化等新技术的科学数据出版的模式创新16,张小强等采用定性方法厘清数据出版涉及的关键问题:
伦理规范、用稿机制规范、数据引用规范和元数据标准等17,李小燕等通过分析数据出版相关环节、利益主体、发展现状与存在问题等明确了数据出版是未来科研成果出版的重要组成部分和发展趋势18。
可见,我国学者对数据出版的研究已经相当的全面和深入。
前述研究中部分文章提及应尽快将数据论文纳入科研成果评价体系的建议5,12,14-15,17-18,希望藉此根本上激发科研人员的数据共享和出版的积极性,促进科学数据出版的繁荣发展。
鉴于数据出版在我国还是比较创新的工作,数据论文纳入科研成果评价体系可能还需要时间,但国外已发表的数据论文已经有了很好的使用情况,如Ecologicalarchives刊发文章为例:
PanTHERIA:
aspecies-leveldatabaseoflifehistory,ecology,andgeographyofextantandrecentlyextinctmammals,被引用次数:
3441BODYMASSOFLATEQUATERNARYMAMMALS,被引用次数:
240上述两篇数据论文被引用频次之高,充分说明了国外学术界同仁对数据论文的高度认可。
而世界顶级学术期刊Nature于2014年正式发布ScientificData专刊,也充分说明了学术出版界对数据论文的认可。
2014年底,中国科学院心理研究所左西年研究员在Nature旗下数据期刊ScientificData发表数据论文“Anopenscienceresourceforestablishingreliabilityandreproducibilityinfunctionalconnectomics”2,开启了我国科学家在顶级学术期刊数据专刊发表论文的先河,这也充分说明了我国科学家对数据出版工作的高度认同,以及未来能够纳入科研评价体系的乐观态度和高度信心。
截止2015年11月,我国科学家作为第一作者已经在NatureScientificData发表数据论文5篇。
1.3科学科学数据出版数据出版国内外数据出版的研究表明,科学数据出版是一个复杂的系统工程,既有传统学术出版的特点,同时还有数据发布且与数据论文关联等带来的新需求。
基于广泛而深入的研究,以及我国当前科学数据出版的认识及实施可行探索,中国科学院计算机网络信息中心科学数据出版团队提出了国内科学数据出版的体系框架,主要包括明确出版流程、建立标准体系、构建出版系统、创立数据存储库等四个方面的内容,示意图1-1。
12015年11月3日,googlescholar查询得到。
下同。
2http:
/4图1-1科学数据出版体系架构示意图科学数据出版与传统学术文献出版具有明确的不同,所以其出版流程将在借鉴传统出版流程基础上,针对科学数据出版及数据论文的特点,确定科学数据出版过程中数据及其论文的出版流程,特别是其间相互关系的明确与呈现,以及数据加工、数据整理、数据发布、数据评价、数据引用等关键环节。
作为创新的共享模式,科学数据出版需要面向未来科学数据出版生态环境的建设培育发展支撑标准体系,主要涉及数据论文模板、数据资源(特别是质量)、元数据、数据或其论文的开放获取等,籍此实现资源(数据实体、数据论文等)描述、展示、访问、应用等方面的标准化,支持科学数据出版的规模化发展和高效应用。
构建数据出版系统和存储库,面向未来科学数据出版生态环境的建设确立数据论文发布和数据存储分离模式,分别建立支撑学术刊物/数据刊物等的发布与共享平台和支持科研数据开放共享的公共存储库,并探索公共存储中的数据和在线数据论文的联动方式,支撑未来科学数据生态环境的复杂性和多样性。
1.3.1出版流程科学数据出版既不同于传统学术论文出版,也不是简单的数据发布5,而是具有自身典型特征的新出版模式,特别是融入了数据对象的提交以及相应的数据注释与整编等工作。
科学数据出版的一般流程主要包括数据论文的提交与评审,数据资源的提交、评审与标注,数据论文与数据资源的关联,数据及其论文发表等等几个主要环节。
科学数据出版的流程如图1-2所示。
科学数据出版出版流程标准体系出版系统存储库5图1-2科学数据出版流程图1.数据论文和数据集提交作者按照论文模板等标准要求完成数据论文撰写和数据整理以后,在线提交必要的数据论文描述信息和数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科学 数据 出版 应用 实践 中国 科研 信息化 精品 文档