最新地方文献数据库系统 精品.docx
- 文档编号:1285013
- 上传时间:2022-10-20
- 格式:DOCX
- 页数:7
- 大小:23.11KB
最新地方文献数据库系统 精品.docx
《最新地方文献数据库系统 精品.docx》由会员分享,可在线阅读,更多相关《最新地方文献数据库系统 精品.docx(7页珍藏版)》请在冰豆网上搜索。
最新地方文献数据库系统精品
地方文献数据库系统
一、前言地方文献是我国公共图书馆藏书建设的重要组成部分。
这些出版物记载和反映了当地社会发展的历史进程,是国家的重要资源和财富。
目前,地方文献工作在我国省市、自治区公共图书馆已受到普遍重视,许多馆建立了地方文献专藏,对文献的收集、整理、报道和利用做了大量工作,为当地的四化建设发挥了积极的作用。
但是,我国的地方文献工作基本上还是沿用传统的理论和方法,在各方面已远不能适应当今信息社会的要求。
在今天新技术革命浪潮蓬勃兴起的形势下,公共图书馆的地方文献工作怎样才能适应时代的需要这一重要课题,已历史地摆在我们图书馆工作者的面前。
我们认为,面对新技术革命的挑战,地方文献工作必须实现现代化,才能使传统的地方文献工作获得新的发展,从而达到促进地区出版物资源共享的目的。
基于这种认识,我馆在原有地方文献工作的基础上,开始用电脑建立地方文献数据库。
经过一年多的研制,该数据库已初步建成并投入使用。
为与国内同行交流,本文对该数据库系统作简要介绍。
二、收录范围与文献源建立地方文献数据库,首先要明确收录范围和解决文献源问题。
对地方文献的收录范围,我馆前馆长杜定友先生曾提出过著名的史料、地方出版物和地方人士著述三部分的论述。
在杜定友先生的倡导下,我馆致力于地方文献的收集工作,建立了广东地方文献专藏。
根据我馆地方文献的收集入藏情况,我们拟定了地方文献数据库收录范围的原则1.具有广东地方特点,并有一定学术、史料价值的文献资料包括有地方特点的科技文献。
2.反映本省人物包括广东籍知名人士以及在广东有过影响的非广东籍人士生平、传记、事迹的文献资料。
3.有广东地方特点的本省出版物和外省出版物。
4.广东人士著述拥有地方特点的文献资料部分。
对不予收录的文献,也作了如下规定1虽是地方出版物,但内容并无地方特点的文献资料。
2作者虽是广东人士,但文献内容并无地方特点的著述。
3无地方特点的科技文献。
4印刷质量差,内容贫乏的非正式出版物。
5同收录原则相悖的其它文献资料。
具体的收录范围有24项。
地方文献数据库所收录文献的类型包括专著,期刊、报纸、会议录、汇编、学位论文、科技报告、专利文献、手稿、地方志、族谱、检索工具、参考工具、图表、古籍等。
其中检索工具包括反映本省图书馆馆藏的各种书目、文摘、联合目录;图表包括地图、气象图、地质图;参考工具包括年鉴、手册等;专利文献只限于本省单位和个人申请的国内外专利;报纸限于本省出版报纸的目录。
广泛征集地方文献资料,保证地方文献数据库有充足的文献源,是建立地方文献数据库极为重要的一环。
我馆地方文献工作,早在解放前即已引起重视。
建国后,更加广泛深入地开展了地方文献的收集和整理工作。
省人民政府曾先后发出三个关于地方文献工作的文件,指定我馆为全省地方文献的征集工作机构和收藏中心,要求各级人民政府和各企事业单位,将所出版的文献资料无偿向我馆缴送二册,这为征集地方文献打下了良好的基础。
在全省各有关单位的大力协助下,经过几十年的努力,我馆已逐步建立起拥有18万册,在海内外有一定影响的广东文献专藏,形成了广东文献的收藏中心。
这是建立地方文献数据库的基础。
建立地方文献数据库,在确定收录范围的同时,还要认真选择和挖掘文献源。
因为地方文献包括了反映当地历史和现状的文献资料,数量以万计,内容极为繁杂。
图书馆应该首先选择利用率高,有一定学术和史料价值的文献存贮进电脑,其中科技文献应占有相当的比例。
这是时代的要求。
因此,我馆在建库前对文献源的选择进行了较深入的研究,最后决定从现代期刊入手,对符合收录范围的期刊论文进行著录标引,然后输入电脑。
目前文献的前处理工作正顺利进行,现已标引出地方文献资料8,000多篇,输入电脑5,000篇。
对于其它类型的文献资料,今后将有计划按步骤地进行输入,从而逐步建立起我省的地方文献数据库。
三、数据库系统目标与模式作为地方性情报检索系统的地方文献数据库,其总目标是收录和存贮反映本省历史和现状的地方文献资料目录,编辑出版综合性的地方文献通报书目和各种专题的地方文献目录,为当地党政军领导机关和各科研生产单位提供文献检索服务;作为地方文献的查目中心,将通过联机网络同当地的主要图书情报部门联网,逐步实现地方文献的联机编目和检索,从而促进地区性的资源共享。
为了实现上述目标,我们根据本省的实际情况,为地方文献数据库设计了下述模式1.选择具有良好汉字处理功能的远程通讯能力的微型电脑作为数据录入工作站和脱机检索系统,这一系统配有完整的外部设备,可独立进行地方文献书目数据的录入、检索和编辑出版地方文献通报。
对已输入电脑的大量数据,可转贮到软盘,为将来在中、大型电脑上建库作好数据准备。
我馆已购置了四套5550中文电脑,其中一至二套用于地方文献数据库的建库工作。
2.设置电脑联机通讯线路,同当地计算中心的中、大型机联网。
利用主权的计算机资源建立地方文献数据库,一般可存贮几百万篇的文献,从而为实现地方文献书目数据的资源共享打下基础。
我馆已同省计算中心达成协议,利用该中心引进的4341主机建立地方文献数据库,并在86年二月成功地进行了利用市内话线联机通讯的试验,计划在明年内实现我馆5550同主机的联网。
3.在本馆购置中、小型主机后,将进一步完善地方文献数据库系统,在省、市领导机关和主要科研机构设置检索终端,并同当地的主要图书情报部门联网,进行联机编目和检索,从而使地方文献数据库真正达到资源共享的目的。
4.把电脑同缩微技术结合起来,实现地方文献资料的全文检索。
我馆准备在条件具备时,购置一套16毫米的缩微拍摄设备,用于拍摄地方文献资料。
在数据库中检索命中的文献,可根据其文献号,在缩微阅读机上获得原文。
在我省有关部门的大力支持下,经过全馆同志的努力,广东地方文献数据库的系统目标正在逐步实现。
目前,在5550微机上已实现了以下功能1地方文献书目数据的录入与存贮。
针对地方文献具有多种类型的特点,本数据库根据国家文献著录标准,设置了多种文献类型的自动格式识别程序,不但提供了完善的人机对话录入和修改方式,而且能够对录入的书目数据自动进行著录格式的自动识别,从而使书目数据达到标准化的要求。
2编辑和打印综合性检索刊物《广东文献通报》。
该刊物以及时报道我馆新入藏地方文献为宗旨,两月出版一期。
每期通报正文约70页,按《中图法》分类体系排列,并附有地区索引,方便县、市图书馆、档案馆等有关单位从地区途径查找文献。
从86年五月起,至今已出版文献通报六期及通报的年度累积索引一册。
3自动编目功能,数据库系统可根据输入的地方文献书目数据,自动生成数据库倒排文档,供文献检索之用。
另外,还可根据指定的专题,编制各种类型的地方文献专题书目,以及编制地方文献的累积本。
4文献检索功能。
因受15550系统外存的限制,目前数据库的存贮容量为25,000篇文献。
如将外存扩大到40,数据库容量将可扩大到10万篇。
在此范围内,用户可从篇名、著者、分类、主题、地名等五个途径进行联机检索,并允许用多个主题词或多个检索途径进行组配,以提高检准率。
输出结果既可在屏幕显示,也可以用打印机输出。
5词表管理功能。
数据库系统可对地方文献标引词表、地名表和机内分类表进行插入、修改、删除等项操作,并提供编辑打印词表的功能。
目前我馆已编制出《地方文献标引词表》、《广东省地名表》和《地方文献数据库分类表》。
6地方文献征集和标引管理功能。
数据库能为地方文献中的连续性出版物建立档案,并有催索、记到、装订以及标引管理等功能,可以对地方文献征集和标引实现科学管理。
除了上述功能外,我们计划在87年上半年前,为该数据库增加机读目录生产、远程联机通讯等程序,使数据库的各种功能进一步完善。
四、数据库的设计与实现本数据库系统使用5550高档微机作处理机,其主要技术性能指标为主机内存512-640,15英寸高分辨度显示器、24针汉字打印机和键盘各一台,可配81或20硬盘及525英寸软盘各一台。
操作系统为5550中文由-演变而来,配有、、、以及宏汇编等程序设计语言,还有20、30、、、、1-2-3等软件。
该机具有良好的多语种处理功能中、英、日、俄均可处理和远程联机通讯能力。
屏幕显示和打印输出字形美观。
根据上述计算机资源的特点和省级公共图书馆地方文献工作的业务流程,我们首先进行了数据库的总体设计。
该数据库分为文献库、期刊库、词表库三大部分文献库实现各种地方文献资料目录的存贮和检索包括打印;征集库实现连续出版物包括图书的征集管理;词表库实现广东地方文献标引词表的管理。
所有程序在总控程序的调度下分块进入内存运行。
总体设计方案确定后,使用什么语言实现?
开始我们考虑用30。
但后来经模拟试验和论证,发现30用于开发文献型的数据库系统并不理想,原因是1记录字段不能适应书目数据可变长的特点;2不能使用数组,而且程序变量限于128个,响应速度慢;3如作组配检索一般要几十秒的等待时间;4难以实现人机对话方式的检索,即在检索过程中无法修改检索策略。
基于上述原因,我们决定用编译进行系统开发。
在开发的过程中,尽可能采用自顶向下、分块实现、逐步求精等行之有效的软件开发技术,仅用了四个多月的时间,就完成了程序的设计和调试。
经过半年多的试运行,根据暴露出的问题,我们又对程序作了较大修改,形成了第2版本。
目前该系统的源程序共有4,000多行,17个运行模块占260。
以下对本数据库的文件结构和主要算法作简要介绍一文献库文献库的任务是通过书目控制字段实现书目控制;按国家标准录入和存贮文献记录;编辑和打印各种书目;提供多途径的文献检索手段。
文献库共设置了书目控制文件、主数据文件和倒排文件。
1书目控制文件—该文件采用杂凑随机文件结构,每个记录由书目记录控制关键字、文献地址和冲突链组成见图1。
每个记录的控制关键字,首先考虑用号我国今年出版的图书开始使用该号。
对没有该号的图书文献,采用下述方法取号①整本文献和非书资料,用题名首字符著者末字符地区代码出版年页数。
②析出文献用录入号即系统分配的顺序号。
书目控制关键字的取号要求是唯一性较为方便。
本系统通过该文件将可对所有输入数据库的书目记录进行控制,实现快速查找或修改。
2主数据文件—该文件采用固定长记录可变长字段的随机文件结构,记录长256字节。
如有数据溢出,溢映部分将存入溢出文件中。
本系统将所有书目数据划分为3种类型整本文献、析出文献和非书资料。
每种类型的字段虽有不同,但可存贮于同一数据文件中,通过文献类型代码进行识别。
为便于新数据的处理,本系统又将主数据文件分为新书文件和数据库主文件两种。
新录入的数据暂存于新书文件中,待打印出文献通报和地区索引后,再合并入数据库主文件。
数据库主文件的记录是按文献通报的顺序号排列的。
主数据文件的记录字段考虑了同国家机读目录的一致性,在必要的时候可通过一个格式转换程序,把书目数据的系统内部格式转换为标准格式,以利于资源共享。
本系统的书目记录输出,采用了汉字取整装配技术,并按国家文献著录标准在各著录项目中加入分隔符号。
3数据库倒排文件---该文件采用二级索引结构第一级是杂凑随机文件,每记录分为前链和后链两个字段。
第二级是顺序随机文件,每记录分为文献地址和后链两个字段。
这样,一级索引作为检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新地方文献数据库系统 精品 最新 地方 文献 数据库 系统