国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书Word文档下载推荐.docx
- 文档编号:17637547
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:24
- 大小:116.05KB
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书Word文档下载推荐.docx
《国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书Word文档下载推荐.docx(24页珍藏版)》请在冰豆网上搜索。
4.3.5、专业类非接触式扫描仪(超大、非接触、实物等加工处理)1套34
4.4、培训要求及售后服务35
4.5、对文件数字化处理中心承建商的要求36
一、前言
国家数字图书馆文献数字化加工中心主要承担国家图书馆馆藏资源中,文献资源的数字化生产,包括普通纸介质文献、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等)。
它是国家数字图书馆数字资源建设和服务的起点,它是国家数字图书馆核心业务系统之一。
该中心的主要职能是数字资源创建。
本次项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业采集设备及它们之间的集成和接口程序。
建设单位要以高度的责任心和为能参加这样的国家级项目的荣誉感,站在全局的角度,以细致、科学的工程实施手段高质量的完成此次项目。
二、国家数字图书馆总体建设目标及总体架构
国家数字图书馆将全面履行国家图书馆的职能,有重点的收藏、建设和长期保存中文数字信息,在互联网上形成超大规模的、高质量的中文数字资源库群,建构数字资源采集、加工、保存的技术支撑平台,并通过国家骨干通信网向全国以及全球提供中文数字信息服务,使国家数字图书馆成为世界最大的中文数字信息保存基地与服务基地,成为国家重要的信息基础设施。
利用先进的技术和传播手段,向全国及全球展示中华优秀文化,实现馆藏资源的共享。
国家数字图书馆的建设要完成我国中文文献的书目数据库建设,通过网络通道向公众全面提供中文二次、三次文献的检索(包括图书、期刊、报纸的名称及篇名数据);
完成馆藏特色资源库的建设,向公众提供具有中国文化特色的信息资源,包括:
甲骨资源库、金石拓片资源库、敦煌资源库、地方志资源库、图书馆学资源库、中国国情资源库、中国博士论文资源库、中国学资源库等;
建立中文互联网信息资源库,保存中国重要的网站网页信息,并向公众提供查询服务;
与其他行业性、地区性数字图书馆系统连通,向公众提供全方位的知识信息库,使国家数字图书馆成为世界中文数字信息资源的权威查询中心和服务中心。
站在信息化建设的角度讲,它的总体架构如下:
三、国家数字图书馆的核心业务系统功能模块架构
3.1、国家数字图书馆核心业务系统架构
数字图书馆从业务流角度来讲,它分为数字资源的采集、数字资源的集中管理和保存、数字资源的发布与服务。
整个核心系统各模块的功能用以支持系统中信息资源的流向、转换、管理及发布。
架构中主要包括和涉及的功能模块有:
●文献数字化和数据采集系统
●数字资源集中保存与管理
●数字资源长期保存
●服务与发布平台
●元检索
●与核心业务系统配套的唯一标识符系统
●与核心业务系统配套的版权管理系统
●与国家数字图书馆各业务系统配套的应用支撑平台
3.3、国家数字图书馆数字资源的分布状态
1.外部信息资源
2.采集系统数字资源
3.集中保存数字资源
4.长期保存数字资源
5.面向特定检索应用的元数据资源
6.呈现给外部用户的数据
四、国家数字图书馆文献数字化加工中心
本项目需求书是围绕着文献数字化加工中心的建设展开的。
文献数字化加工中心包括文献数字化处理及管理软件、采集设备、输出设备、系统运行平台及基础设施和配套设备。
本项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业扫描仪、缩微数字化处理设备及它们之间的集成。
文献数字化加工中心,并不单纯是一个软件开发和软硬集成项目。
承建商不仅是提供一个生产系统,更重要的是要提供一套行之有效的生产和管理流程,并通过培训使用户指定的人员熟练使用直至交付。
其中文献数字化加工中心的应用软件中的数字成品管理(包括介质)模块,负责对中心的生产产品进行有效的管理,侧重的是毛成品的管理,而数字资源集中保存与管理系统中的数字资源管理侧重的是资产管理、长期保存及面向服务的管理。
4.1、文献数字化总体要求
文献数字化中心业务处理能力
●普通纸质文献数字化处理能力:
30万册(件)/年;
●缩微介质数字化处理能力:
300万拍/年;
●文摘记录加工处理能力:
9万个/年;
●书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接处理能力:
各9万个/年;
●目次的处理、挂接处理能力:
180万行/年
●篇名的处理、挂接处理能力:
600万个/年
●音频、视频资源的深度标引处理能力:
6000小时/年
4.2、文献数字化加工中心应用软件要求
文献数字化加工中心应用软件从功能要求上讲主要包括三个方面。
一是对各类文献数字化生产和标引生产过程中各道工序的处理提供软件工具级支持,以提高各道工序(操作员处理或程序自动完成)的完成质量和生产效率;
二是对文献数字化处理任务进行流程化管理,通过对任务的分派和跟踪管理,提高文献数字化处理的整体质量和工作效率;
三是提供系统级支撑和管理功能,包括用户及权限管理、生产工序配置管理、全局数据管理、生产情况统计、数字成品管理(包括介质管理)和移交管理。
文献数字化加工中心应用软件提供对数字化生产过程中物流数据、生产管理数据、数字化元数据和对象数据、历史数据的有效管理,这是提高各处理环节生产效率的基础。
文献数字化加工中心应用软件从组成上讲,包括文献数字化生产(扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统。
文献数字化加工中心应用软件要尽可能遵循的国家图书馆关于汉字规范处理、唯一标识符、对象数据、元数据等相关标准规范。
对于规范所不能涵盖或不适用的部分,要在实施的过程中制定相应的内部标准。
文献数据化成果以对象数据和元数据的形式体现。
4.2.1、文献数字化加工中心应用软件开发技术要求
文献数字化加工中心应用软件是作为国家数字图书馆整个应用系统的一部分,它的开发要符合国家数字图书馆工程建设对软件开发的规范要求。
所谓国家数字图书馆软件开发的规范要求至少包括如下几个方面:
1.符合软件工程规范的要求
承建商对软件设计、开发要符合软件工程的规范要求,它的具体表现之一就是在设计和开发过程中按软件工程规范要求承建商向用户和总集提交过程文档,经多方评审通过再进入下一步的流程,以保证软件开发质量及开发过程受控。
软件工程实施过程中关键的技术和过程文档如下:
⏹软件开发计划
⏹软件需求规格说明书
⏹质量保证计划
⏹配置管理计划
⏹数据结构设计说明
⏹软件概要设计说明
⏹软件详细设计说明
⏹软件测试计划
⏹软件测试说明及用例
⏹软件测试报告
⏹用户手册
⏹安装部署手册
⏹运维手册
⏹部署实施报告
⏹软件配置文档
⏹试运行报告
2.承建商应采用统一的标记语言
3.承建商应采用统一的开发语言版本
4.承建商应采用主流的开发集成平台
5.接口的规范
4.2.2、文献数字化加工中心应用软件开发功能要求
文献数字化加工中心应用软件包括:
文献数字化生产(扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统,该系统是一个B/S与C/S相结合的软件项目,其中服务端采用UNIX操作系统。
另外,在该管理子系统中其很重要的一部分是对生产所得到的数字成品进行有效管理,它将作为该中心生成的数字成品的管理工具。
本节是项目需求书最重要的一节。
4.2.2.1、术语
文献:
本系统涉及的文献指普通纸质书册、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等)国家图书馆拥有的资源。
元数据:
数据的数据。
一般记录对象数据的描述信息、结构信息、管理信息(技术、数据版权、数据出处、数据来源等),用于检索、分类、统计等功能。
数字化:
采用数字手段将普通数据转化为数字信息。
这里普通数据指纸质、胶片、舆图、甲骨、磁带、录像带等介质上载有的数据;
数字信息则存储于磁盘、光盘、磁带等载体上的数字信号。
数字化的手段一般是数字采集、OCR识别、存储。
对象数据:
普通文献数字化后形成的数据,称为对象数据,如一段数字视频,一个TIFF图象文件等。
数字水印:
数字水印技术是将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中,但不影响原载体的使用价值,也不容易被人的知觉系统(如视觉或听觉系统)觉察或注意到。
通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。
4.2.2.2、需求描述
(1)、文献数字化生产
文献数字化生产的任务,就是要对各类文献通过一系列流程工艺处理,最后形成可供移交的数字对象资源,以及相关的元数据。
文献数字化生产的核心是对生产流程的管理,流程工序包括任务分配、资料前整理、对象数据处理、数据后处理、数据输出、实物整理归还等。
各流程工序为独立模块,生产线以任务为目标而灵活设置。
文献数字化生长应用软件的开发,就是要对文献数字化生产工序的各生产环节提供软件支持,提高文献数字化生产各环节的自动化程度,从而提高文献数字化生产效率和数字化成品质量。
(2)、文献数字化标引
文献数字化标引的任务是对文献数字化生产所得到的数字资源进行二次加工,包括编辑加工书目数据、篇名数据、摘要、全文等,形成或完善相应的元数据。
文献数字化标引的核心是对标引生产流程的控制管理,流程工序包括任务分配、工序设置,文献对象的加工标引、校对检验、数据整合、数据输出等。
文献数字化标引应用软件的开发,就是要对文献数字化标引生产工序的各生产环节提供软件支持,提高标引生产的自动化程度,从而提高标引生产的效率和数字化成品质量。
文献数字化生产和文献数字化标引的相关环节,可供配置组合到一起构成一个新的工序。
文献数字化标引子系统应提供预留接口以处理国图其它渠道获得的数字资源。
(3)、系统管理
从业务角度讲,系统管理的目的,就是要对文献数字化生产和文献数字化标引提供全局性的配置、管理和控制功能,提供数字成品管理功能,并通过统计分析为生产决策服务。
系统管理的功能,包括管理和提供文献数字化生产、文献数字化标引所需的工序和工艺表,根据不同的任务类型和登录类型组配生产工序;
组配任务分至相应生产线,接收生产线管理系统的各种信息;
提供生产线上文献信息、数字成品、生产信息、人员、光盘加工数量以及历史数据等的各种查询和统计功能,按需输出各种电子报表;
提供系统管理员权限管理的功能,对操作员等进行管理;
提供以及报警和数据备份等维护功能。
4.2.2.3、功能描述
以下是文献数字化加工中心生产流程示意图,不同文献的数字化流程所包含的工序,需要在软件实现时进一步分析确认:
文献数字化生产流程图(此图为示意图,仅作为参考)
一、文献数字化生产系统
(1)文献前整理
实现自动接收和输出书目数据或其他元数据;
按文献类型,分发任务,补充元数据(描述型元数据);
登记文献是否需要修正或修裱;
记录整理信息;
检查校对;
数据输出至相应生产线等功能。
(2)图书数字化
按设定工序扫描;
数据整合;
图象编辑处理;
版面切分处理;
格式转换;
检查、校对;
数据封装(全部元数据、对象数据);
数据刻盘;
数据输出至服务器;
磁盘清理;
生成装订、还书单等。
(3)期刊数字化
(4)报纸数字化
(5)普通古籍善本数字化
按设定工序,扫描或数码拍摄;
预处理(遵循标准);
版面还原等处理;
生成归还清单等
(6)特殊文献数字化
专业设备组建的特殊文献生产线。
文献包括超大幅面地图、拓片、实物、珍贵古籍等。
由于文献的特殊性,在生产过程中,强调生产工艺和工序环节,注重文献的细节处理。
特殊文献生产要求、设定条件、生产时间、人员、文献保护等等,根据对象和任务具体情况,设置参数指标和生产线工序。
基本工序同普通古籍善本生产线,特殊工序的添加,需在任务加工初期配置。
(7)缩微品数字化
针对16毫米、35毫米、平片等缩微制品,进行数字化处理。
系统支持专业硬件设备接口,并将设备处理的数字文件导入生产系统,完成进一步的编辑处理。
工序可根据对象的文献类型,进行生产线配置,如图书、报纸、期刊、善本等文献。
(8)音频、视频数字化(采集;
导入)
合理组织、配置生产线,使硬件系统与软件系统实现高指标的的生产效率。
音视频文献的数据来源包括模拟资源(VHS)和原生数字资源(DV、DVD、VCD),所以数据的生产流程又分为数据采集和数字转换。
由于音视频文件的加工大多采用专业软件或编码器来完成,所以音频、视频加工生产线系统应注意与第三方软件的接口问题。
生产主要过程如下:
原始资源组织整理----〉建立工作目录----〉文件数字化----〉质量检查----〉数据保存
(9)其它数字化
临时或指定的生产任务。
根据具体需求,在工艺、工序、加工等参数表中,自动组配、定制生产线系统。
比如对购买数据的格式转换、封装、拆分、命名,或更加深入数字处理对象文件。
(10)对硬件设备和专业处理软件配置管理功能
能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。
能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。
(11)数字水印处理
对文献数字化产生的对象数据进行水印处理。
根据数字水印处理策略,按照工序流程,对文档、图片、音视频数字资源加盖数字水印,数字对象的水印属性可以记录在相关元数据中。
数字水印处理可以作为一项独立的功能,嵌入到文献数字化生产支撑软件中。
数字水印处理功能支持可见水印和隐形水印的处理,提供数字水印查看工具。
隐形水印应有安全性。
(12)元数据的生成与管理
包括管理型在内的各类元数据的生成贯穿于整个文献数字化处理的过程中,并在文献数字化的各个环节中会不断的补充与完善。
描述性元数据的获取与完善需要根据不同种类的文献数字化工序而定。
(13)唯一标识的和成与唯一标识符注册
根据中心管理系统的唯一标识管理策略对生成的对象数据分配与指定唯一标识,并按唯一标识符系统的注册格式要求,向唯一标识符系统注册并获取数字对象唯一标识符。
内部唯一标识的生成和唯一标识符注册将作为生产环节的两个功能模块配置到各类文献数字化的流程工序中。
二、文献数字化标引系统
(1)书目编辑
提供书目数据的编辑,以及书目与数字对象的挂接处理。
能提供多种书目的编制方法:
外部数据导入、相近记录拷贝、人工录入等。
能够按基本元数据进行字段提取与处理;
能够区分数据各个字段,并按要求在CNMARC、DC、XML或其他元数据格式、数据库之间的转换。
要求具有检索、剔重、唯一标识处理的能力,且能够分配唯一资源标识符。
(2)篇名标引
提供多种制作方法:
数据导入;
OCR识别;
人工录入等;
提供目次、书目、摘要、数字对象的挂接;
建立目次到资源的唯一对应关系;
校验、检查
(3)摘要标引
主要处理摘要信息与对象实体进行连接;
对于基本元数据进行提取与处理;
数据倒入;
提供目次、书目、摘要、其他元数据与数字对象的挂接,建立唯一定位关系;
(4)自定义内容标引
版面指定内容置标(OCR识别、人工录入、数据导入);
多媒体指定段落置标(OCR识别、语音识别、人工录入、数据导入);
置标位置信息、与其它载体管理关系的记录;
(5)全文数字化处理(手工录入;
或OCR识别)
生成ISO2709、XML、HTML、PDF、TXT、等格式和元数据转换;
商业数据格式转换;
支持多种加工方式;
多种校验方式;
检查
(6)编辑管理
专用文字输入编辑管理工具,可以处理横排、竖排的输入;
可以使用多种输入方法;
可以进行多种信息编码之间的转换;
可以支持形码、音码的输入;
有多重输入比较的能力,版式预览的能力,支持基准的XML文件结构,含位置信息(对应加工图像)、可转换进入通用的文本编辑工具中
(7)数字水印处理
对标引后形成的全文数据,在必要时可以作为对象数据来看待。
当这些全文数据作为对象数据时,其发布与服务必须受到版权的约束,因此标引生产系统也需要具有数据水印处理功能。
根据数字水印处理策略,按照工序流程,对数字对象加盖数字水印,数字对象的水印属性可以记录在相关元数据中。
数字水印处理可以作为一项独立的功能,嵌入到标引生产支撑软件中。
(8)字符集外管理
可建立Unicode字形字库,提供简单容易正确操作的输入方法,检索指定字形的字,对外字进行自动查重。
可建立和修改字形曲线库、字的结构图、字音、自给编码等外字库,建立外字的属性。
建立数字资源与外字的关联表。
提供外字输入、检索、查重和统计。
提供输出外字功能。
根据Unicode版本升级,修改外字库,并可按需要修改已做数字资源中相关外字的编码。
该部分功能需要与中文信息处理系统子项目所购软件提供的功能进行整合。
(9)元数据的生成与管理
数字资源标引生产过程所产生的元数据,一般都以元数据的形式保存。
所产生或补充的元数据信息包括描述型元数据、管理型元数据等。
元数据的属性字段规范需要在软件需求分析时进一步分析确定,原则上尽量采用国图标准。
(10)对硬件设备和专业处理软件(主要是OCR)配置管理功能
能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。
(11)标引生产管理
根据任务生产通知单,按照要求分发到相应的标引生产线;
根据具体任务设定生产流程、工序,掌握和控制生产进度和数量;
数据接收(输入);
置标字段管理,实现自定义字段名称和属性、任意选择字段、自动灵活组配标引数据库;
统计及报表输出;
人员角色、权限管理;
生产线数据库维护;
文件系统管理,包括对象文件、元数据和备份数据;
数据输出。
三、文献数字化中心管理系统
文献数字化中心管理系统是与文献数字化生产文献数字化标引配置的管理系统,一方面实现文献数字化加工中心日常生产管理所需要的功能,另一方面实现事后统计分析功能。
(1)任务管理
包括任务定制和管理。
根据文献类型、任务要求,生成任务单。
调用工序工艺管理相关指标,与任务单一起发至生产线。
根据生产线完成人员的不同(馆内文献数字化加工中心、馆内其他业务部门和馆外加工企业),负责任务下达、质量监督、工程过程控制、标准制定等。
(2)人员权限管理
系统管理员、子系统管理员、操作员的帐户、密码、权限的管理。
(3)接收管理
接收生产线外数据;
接收生产线各个模块应用数据库数据;
根据参数化管理来适应底层不同数据库和操作系统的不同数据传输格式的需要。
(4)工序工艺管理
不同加工对象的工序工艺的配置。
设置各种相关设备的参数,设置存储方式方法,设置数据格式转换要求,设置检查与校对的方式等。
针对不同加工对象的数字化生产工序工艺的缺省设置,要符合国图实际的数字化加工规范要求。
对于生产流程的管理与任务分配,应充分考虑对服务器的支撑能力,以及终端处理过程的支撑能力。
工序工艺配置信息可与定制任务进行匹配。
提供色彩、实物管理。
对于实物扫描、拍照等的色系、拼图体系进行管理,主要是色基的管理、生产设备与处理参数说明、实体说明、数据格式、拼图等
(5)数据库管理
对形成的各类数字资源的库进行维护管理,并有相应的功能应对生产过程需要的配置。
(6)文件管理
对形成的各类文件进行维护管理,并有相应的功能应对生产过程中需要的调整。
(7)数据输出管理
管理、输出各个文献数字化加工过程中产生的过程文件、资源数据格式、加工数据格式、元数据、对象数据。
提供批量、增量等多种输出方式。
对于输出可以根据加工任务时间、加工任务的质量检查、完成的批量等进行控制输出转移。
加工完成前输出到临时存储区域,验收完毕,转移到资源储藏存储区域。
对于输出任务形成一个可管理的、可检查的清单文件标签,便于再加工、转移、存储使用。
(8)软硬件接口参数配置管理
负责有关扫描仪、摄像系统、非线性编辑系统、音频视系统等各种设备的驱动、格式转换和格式控制等参数配置信息的管理。
根据工序的不同调整和设置相应的硬件设备参数。
根据工艺的需要,转换各种设备输入输出的格式。
负责对配属的专业处理软件的相关参数的配置管理,根据工序的不同调整和设置相应的专业处理软件参数。
(9)版权信息登记
根据需要对数字资源的版权信息进行登记。
(10)数字化产品移交管理
可定时批量或单独将生产审校通过的数字化成品,自动生成移交电子通知单,送至数字资源集中保存与管理系统,接收电子回执,并回送收到的通知回执。
处理过程信息自动记录到加工记录中。
(11)统计管理
对工作人员、加工时间、加工数量、数据成品、生产过程(工序)等各个方面进行统计。
统计结果可打印、可显示棒形图、饼形图、表格,并可按时间输出电子表格。
(12)快速印刷
根据已有的书目记录和数字资源目录进行查重、确认。
提供待印刷清单,并通知快速印刷系统。
任务批准后,进行质量检查,包括数据的完整性、顺序关系、版权关系、文献状态。
(13)数字成品管理(包括介质管理)
能够管理各种存储介质的出入库。
对新介质和成品盘的出入库、库内报废以及库内丢失都进行计算机管理,使介质的管理系统化。
查询各种介质的使用情况。
用户可以方便的查询成品盘的情况以及盘中图书的信息。
提供统计库存各种介质的数量,使管理者清楚库存各种介质的情况。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国家 数字图书馆 文献 数字化 加工 中心 处理 项目 技术 需求
![提示](https://static.bdocx.com/images/bang_tan.gif)