数字图书馆个人空间构想.docx
- 文档编号:9830084
- 上传时间:2023-02-06
- 格式:DOCX
- 页数:19
- 大小:26.15KB
数字图书馆个人空间构想.docx
《数字图书馆个人空间构想.docx》由会员分享,可在线阅读,更多相关《数字图书馆个人空间构想.docx(19页珍藏版)》请在冰豆网上搜索。
数字图书馆个人空间构想
数字化图书馆中个人信息空间之构想
AConceptionofPersionalInformationSpaceforDigitalLibraries
曾元显
辅仁大学图书信息学系副教授
Email:
tseng@blue.lins.fju.edu.tw
中国图书馆学会会报,第56期,1996,页69-75
http:
//www.webtools.org/counter
前言
数字化图书馆的运作问题
个人信息空间
技术的可行性
结语
参考数据
Abstract:
Thefavorablecharacteristicsofdigitaldata,namelyinformationare
readyformanipulation,transmission,andarchivingbycomputers,have
madelibrariesanopportunityforprovidingbetterserviceseverimagined.
ThispaperproposestheparadigmofPersonalInformationSpace(PIS)asan
interfacetothefuturedigitallibraries.Inthismodel,theuser
collectsfrequentlyusedinformationandresourcesinavirtualspace
wherehecaneasilyaccess.TheuserretrievesinformationfromtheWWWor
instead,he/sheasksthedigitallibrarianforhelpwhenheisnot
familiarwiththeretrievingtoolsorwhenhe/shecannotformproper
searchstrategies.Heorsheinthisspacecanconcentrateoninformation
consumingandproducingratherthanmanipulatingcomputerfiles.Thespace
providesaNEWS-likechannelsothattheusercancommunicatewithexperts
fromotherfields.Byanalyzingtheuser'sinformationneedandsearch
patterns,thePIScanprovidebetterservicesinanactivefashion.The
feasibilityofthePISideaisalsodiscussed.Thispapershowsthatthe
technologicalfoundationsforthePISmodeltocometruearealreadyin
place.
摘要:
数字化数据便于储存、整理、修改、传输、复制与运用的特性,使图书馆有机会以
过去无法想象的便利方式,提供使用者更好的服务。
本文提出「个人信息空间」的观
念与运作模式,试图作为未来数字化图书馆与用户互动的接口。
在这模式里,读者
可将常用的信息汇集在一起,以便随手取得,随时运用,其功能类似目前大型图书馆
开辟的研究室,只不过使用者不占有一实质的地方,而是拥有一虚拟的空间。
此模式
重要的特性如下:
一、读者根据自己的需求在信息网络中找数据,若不谙网络使用方
式或无法有效检索数据,可以请求数字图书馆员的协助;二、数字图书馆里的实质收
藏由专业的馆员来做适当的分类编目,对于汇入个人信息空间里的资源,则依适合读
者的方式各自处理;三、读者透过浏览器签入自己的信息空间,直接接触信息,而不
必费心于低层次的档案操作,以提高信息的生产能力;四、读者专业的参考问题,可
以透过公开的讨论空间获得解答或指引;五、信息空间里有读者的信息需求与检索行
为的记录,分析这些数据,可使数字图书馆主动提供读者更好的服务。
此外,本文也
针对个人信息空间的可行性提出探讨,说明目前全球信息网络上的相关技术,已可用
来实现此一构想。
关键词(Keywords):
数字化图书馆(digitallibraries),
个人信息空间(persionalinformationspace),
全球信息网络(WorldWideWeb)
壹、前言
信息科技在近数十年来发展得非常快速。
过去计算机技术的发展,促使图书馆
作业自动化,达到书目数据可经由计算机检索查询的便利。
近几年计算机与网络技术
的结合,除了便利书目数据的查询外,更进一步可以透过网络存取其内容。
不仅
如此,声音、图像、视讯等其他信息媒体也都可以数字化,储存成计算机可以立即
处理的型态。
这些进展,使得数字化图书馆不仅成为未来图书馆发展的方向,甚
至在某种程度上,已经存在于现有的国际网络(InterNet)或全球信息网络
(WorldWideWeb,以下简写成WWW)上了。
近两三年来,探讨「数字化图书馆」的期刊、研讨会及项目计划纷纷涌现。
如一九九五年四月CommunicationsofTheACM期刊推出了「数字化图书馆」
专辑,内容包括数字化图书馆的多项议题、ACM尔后的出版政策、以及美国数所
大学在NSF、ARPA、NASA等政府机构二千四百四十万美元经费支助下,发展的数
位化图书馆计划[1]。
另外,美国德州农工大学于九四年举办第一届「数字化图
书馆」研讨会[2],九五年德州奥斯汀举办第二届[3]。
同年,日本[4]、新加
坡[5]也纷纷加入探讨的行列。
九六年则有ACM及英国的研讨会[6,7]。
显见
国际间对数字化图书馆发展的重视。
国内的情形则发展较慢,目前教育部正在推动图书馆自动化和网络系统整合
工作[8],未来几年各级学校、各级图书馆将经由网络链接,形成「全国图书资
讯网络」,以配合国家信息基础建设(NII)的发展。
而图书数据数字化将是NII
能否发挥功能的重要关键。
图书数据数字化后一个重要的效益是:
数字化的数据便于储存、整理、修改、
传输、复制、运用。
这些特性使得信息更能够达到「为全体国民公开、公平使用」
的目的,对于民主社会的发展、人民权利的保障极具重大的意义[9]。
贰、数字化图书馆的运作问题
相对于传统图书馆的采、编、典藏、流通服务的运作流程,数字化图书馆的
运作方式也需考虑这些问题,以提供图书馆的用户最便利的信息存取服务。
但
是由于数字数据(尤其是网络资源)的特性与纸本数据不同,以及数字数据运用
方式的极具弹性,若以传统的运作流程来推导未来图书馆的作业模式,将无法使
图书馆的服务达到最大的效用。
与兹列举重要的问题如下:
一、网络资源的采访:
最近几年,政府机构、公司行号、研究单位、乃至于
个人均可透过免费的服务器如http、gopher、wais、news等系统在网络上提供资
讯。
由于硬件价格的滑落、免费软件安装的简易、全世界均可看到的宣传效果以
及商业上潜在的利益,网络上的信息站几乎每半年即成长一倍。
这种数量庞大、
分散各处、而且随时随地就会冒出信息站的情况,对网络资源的采访工作是极大
的挑战。
目前有三种主要方法[10]:
第一是人工方式:
由熟悉网络资源检索技术
的人员来过滤、筛检网络上的资源;第二为自动方式:
透过像Webwalkers,worms,
spiders,harvesters等自动采访器(robot)或检索引擎(searchengine)来
搜集网络上各节点的数据;第三种方式则由大众推荐:
网络用户透过传送
Email或填写服务器所提供的WWWform来推荐有用的数据。
在此情况下,数字
图书馆的馆员如何发展适当的方式采访数据,并且摘要精确,使人一目了然,以
迅速满足读者的需求?
二、网络资源的分类、编目:
传统分类、编目方式虽可对馆藏数据作精确的
掌握,但数字化数据存在的格式与纸本数据不同,不仅版本加多、不定期更新、
编目索引的项目不同,而且分散各地、文件与文件相互连结,内容短而数量大,
这些特性将使传统想要掌握全部信息而做分类、编目的努力,不符合成本效益,
也难以跟上网络资源扩张的速度。
三、网络资源的管理:
网络上的信息具有定期或不定期修订、变动的特性
[11]。
因此,我们应当典藏采访得来的数据,以确保数据存在本地随时可用,或
是仅储存链接(hyperlink),分享别人的数据,以确保数据为最新的版本?
四、如何提供读者服务:
网络信息的变动性、零碎性、相互连结特性,再加
上网络利用需要相关的计算机、网络技术,将对传统图书馆的用户造成信息检索
与利用的更大困扰。
传统的服务如何持续,以满足读者使用信息的需求,而不会
使原本为便利而提供的特性,变成读者使用上的障碍?
五、开发新的服务:
数字化图书馆出现后,信息的生产者─「作者」不必再
透过印刷、出版的手续,即可将作品置于网络上,供消费者─「读者」直接利用。
数据经过数字化后,修改、复制、储存、与传输的便利性,使信息的整理中介者
──「图书馆」得以利用计算机与网络技术提供新的服务。
面对使用信息网络的新
兴读者群,发展哪些新的服务,可以充分发挥信息科技的效益?
本文的目的,在提出「个人信息空间」(PersonalInformationSpace,PIS)
这样的观念与运作模式,藉由一种整合的接口与用户互动,来试图解决上述数
位化图书馆所面临的问题。
参、个人信息空间
传统图书馆,受限于空间、工具、技术、与资源的限制,是以「建构一个一
致的图书馆以服务读者」为思考方向。
在这个架构里,每个人看到的图书馆都一
样,必须遵守一致的规定,图书馆才能以合理的资源服务最多的人。
「个人信息
空间」的概念则藉助进步的信息科技,以读者的角度来思考图书馆的服务方式。
例如,从信息需求密集的用户角度思考,他可能需要属于个人的数字化图书
馆,将其常常需要的信息、资源汇集在一起,以便随手可得,随时运用。
此功能
类似目前大型图书馆开辟的研究室,只不过使用者不占有一实值的空间,而是拥
有一虚拟的「个人信息空间」。
同理,由一群信息密集的用户角度思考,他们
常需要与志同道合的人交流信息、交换意见,他们可能就需要一个「信息交流空
间」,排除无关的信息干扰,集中某一议题的思考与讨论,并且不会受到时间、
空间的限制。
另外,以区域性考虑,数字化图书馆里可轻易的建构「小区电子出
版社」,提供小区、学校、或区域性机构一个公共的空间,做为言论出版、政令
倡导、或传播与大众利益相关的事宜。
将上面的思考具体化后,一个可能的「个人信息空间」的运作方式将如下所
述:
读者跟某个数字图书馆申请账号后,可以藉WWW浏览器签入这个数字图书
馆的个人信息空间。
在这个空间里,他可以将常用的信息集合起来,以他偏好的
方式分类摆设。
他可以摆设自己在全球信息网络上撷取的数据(也许是全文文
件、也许只是个连结),也可以将自己的档案、文件拷贝进来。
最重要的是,他
如果不熟悉网络资源的撷取,或尝试很久后在网络上仍找不到满意的数据,他可
以向数字图书馆里的馆员求助。
馆员获得读者留下的问题或提供的关键词后,分
析出较佳的检索策略,帮读者透过网络寻找数据。
当数据找到时,透过软件的协
助,数据会自动分派到有登记需求的读者的信息空间去。
读者在常用的数据随手
可得的情况下,可以更专注于信息的组织、整理,进而更快速的生产出新的信息,
回馈到网络里供自己或别人利用。
如果他需要与别人讨论,可以连上News或
BBS之类的讨论区,或是透过Email与人通讯。
如果他只需要与局部(local)
地区的人讨论,他可以进入数字图书馆所提供的研讨室与别人交换意见,甚至互
相参阅对方的电子出版品。
数字图书馆藉由在这样的运作模式与用户互动,前面所说一些数字化图书
馆面临的问题,某种程度上可以得到解决。
第一:
数字图书馆里的馆藏方向是根据读者的需求形成的。
至于是收藏文件
的内容,或仅收藏文件的连结,则以「最佳的运作方式」原则决定。
例如,由读
者在自己的信息空间中决定要收录文件内容,或是文件的连结。
收录文件的内
容,可以保证文件的存在性,不受网络断线或链接改变的影响;收录文件的连结,
可以减少储存空间,确保资料的一致性及以及最新版本,而不会过时。
读者对其
使用的数据最清楚,图书馆应当保留这项决定权予读者。
此外,读者也可以选择
将文件摆在公共的信息空间,让文件收藏的方式留给图书馆处里。
这样做除了不
能掌握文件的存在性、一致性、与最新版本外,如果图书馆有收藏,他一样可以
随时取得文件不受网络的影响;而如果馆里面不收藏文件内容,仅留住连结位
址,则他可以与别人共享这份文件,节省自己以及图书馆的馆藏空间。
在这里我
们假设文件内容的收藏不会侵害到著作财产权,惹出法律上的问题,而如果有此
问题,当然保留文件的连结是目前唯一的收藏方法了。
第二:
读者根据自己的需求在信息网络中找数据,若不谙网络使用方式或无
法有效检索数据时,可以请求数字图书馆馆员协助。
图书馆是提供「终身学习」
的绝佳场所,重要的任务之一是为广大的民众服务,使用者也许专精于某个领
域,但并非都能娴熟计算机网络的使用方式或对搜寻数据有明确概念。
虽然目前已
有讨论智能网络代理员(agent)的研究出现[12],但要达到人性化、普及化
的服务还有一段距离。
因此「个人信息空间」里,必须有人员,亦即图书馆员的
协助,以提供一般民众人性化的服务。
第三:
数字图书馆根据读者需求的主题或提供的关键词,将馆员或自动采访
器搜索来的数据自动分派到读者的信息空间去,读者可以不定期收到图书馆送来
与自己需求有关的资料,经过进一步分析后,可以决定收录起来、或保留在公共
空间、或者回绝这项数据。
因此,「个人信息空间」里的数据采访是读者自己为
主角,图书馆员、或自动采访器为配角。
读者采访自己所要的信息,最能达到精
确的效果。
图书馆员、自动采访器、或检索引擎最大的好处,是节省读者的力气、
拓展读者搜寻的范围。
第四:
全球信息网络上的数据是以分散储存的方式存在,而且呈现动态的演
变发展。
依此想象,要对网络里的所有信息做分类编目是不可能的。
每个数位图
书馆仅能就自己实质的收藏做分类编目,便利外界查询检索,这部份的分类编目
工作可由专业的馆员来做。
对于外来的资源,就留给读者在个人的信息空间,依
自己的偏好处理。
他可以不遵守传统分类编目的规则,引进大量的链接互相参
照,以切合本身的要求。
第五:
读者只要能利用浏览器进入网络,就可在图书馆员的指导与协助下建
构自己的信息空间。
他不再像签入主机型计算机一样,面对的是一层层的子目录与
一个个的计算机档案,而是直接接触到抽象层次比较高的「信息」而不是「档案」。
在此,「信息」与「档案」的差别在于,「档案」需要知道其性质(如确定其为
文本文件、图形文件、声音文件、图像文件,或是确定其储存的格式),并以手动的方式
选用适当的工具,才能打开档案浏览其内容;而「信息」虽然是以档案的方式存
在计算机里,但是透过浏览器的协助,我们就不再关心此档案的性质与低阶层次的
操作,只专注于其实质的内容。
让读者掌控信息,在信息消费与生产的循环当中
扮演主要的角色,是设计图书馆时的最高目标,而不是图书馆本身存在的形式。
第六:
利用参与共同空间的讨论区,协助解答读者的问题。
图书馆的参考问
题可概略分为四种:
指引型(direction)、快速参考问题(readyreference)、
特殊检索(specificsearch)与研究型问题(research)[13]。
前面描述的数
位图书馆馆员所提供的服务约略涵盖了指引型、特殊检索型、与研究型参考问
题。
至于快速参考型问题,我们认为目前News或BBS讨论区的模式相当理想:
读者在某个适当的讨论区提出问题,网络里对这些问题专精的人士可以提供快速
的解答,若不幸有人提供了谬误的答案或观念,由于这个讨论空间是公开的,就
会有人再提出指正。
图书馆员的专业有限,而网络上的用户遍及各行各业的人
士,所触及的问题包含个个层面,而一个问题在讨论时可得到的回答,其广度是
目前为止没有任何媒体可以望其项背的。
此种网络上的讨论,可以模拟成脑神经
思考网络,每个用户的智能,经由网络的组合,可以输出更好的答案。
因此在
「个人信息空间」里建立读者与专业人士类似的接触与沟通的管道,可以提供读
者更完整的参考服务。
第七:
数字化图书馆里有读者的基本数据与需求条件,甚至可以获知读者检
索的行为。
分析这些数据,可以随时掌握图书馆经营的情形,据以提供读者更好
的服务。
肆、技术的可行性
目前浏览器市场上网景(Netscape)公司推出的领航员(Navigator),由
于连接速度快、功能较多、教育人员可以免费使用,使得它在极短的时间,占有
广大的市场。
领航员有多项功能可以支持「个人信息空间」的构想。
例如:
一、它提供网络检索工具(InfoSeekSearch),用户可以根据关键词来
搜寻网络上的资源。
二、提供卷标(Bookmark)功能,可以将拜访的信息站地址或阅读时遇到的
链接存起来,并透过卷标编辑功能依用户的偏好做分类。
三、支持FTP(文件传输协议)与存盘功能,用户可以将网络上的文件
存在自己的磁盘驱动器,或将自己的档案上传到某个文件传输站。
四、支持News功能,可以连到某个News讨论区,参与某个议题的讨论。
五、透过预先设定的方式,可以自动分辨文件类型,叫用适当的软件开启网
路上的文件,使用者不会感受到浏览文件的不便。
然而,目前全球信息网络使用的HTTP(HyperTextTransferProtocol)
协议是属于「不记录状态的」(stateless)。
这使得服务器与浏览器之间的连
线迅速、制作也较为简单。
但是从另一个角度看也有缺点:
每次浏览器向服务器
要求一份文件,就要重新建立连结,传送完文件后,就断线。
这情形就像跟某个
人讲电话时,每讲完一句就必须挂断,要讲下一句,需要再重新拨通电话。
这种
协议方式对于需要交谈、对话(session-based)的应用极不适合[14]。
无法记
录使用者状态、无法辨识使用者,就无法保留用户的信息空间,数字图书馆的
馆员就无从将使用者的需求响应到这个空间去。
上述的情况并非无解,不过需要额外的程序设计技巧。
HTTP协定里有几种
特别的方法让使用者端与服务器端做较复杂的互动。
当服务器收到使用者的需求
时,如果此项需求是要求传回一个档案,服务器就找出档案传回然后结束与使用
者的联机。
如果此项要求是其他情况需要额外的处理,服务器不会去执行这项处
理,而是传给「信道程序」(GatewayPrograms)来执行。
「共同信道接口」(Common
GatewayInterface)就是在定义HTTP服务器与「信道程序」的沟通方式[15]。
因此解决上述的情况,需要了解「共同信道接口」及熟悉任何一种程序语言来撰
写我们所要的「信道程序」,必要时可能再加入一些机制来加强HTTP这项通讯
协定。
网景公司的作法,是在标准的HTTP协议之外,加入了「饼干」(Cookie)
这样的通讯机制,使得服务器与浏览器透过这项协议得以记录用户状态[16-
17]。
网景的解决方式是属于「浏览器端的饼干」(client-sidecookies),也
就是说需要浏览器的配合,服务器端才能记录用户状态。
目前大多数的浏览器
并未支持此项功能,有少部分的单位甚至发展自己的「饼干」作法[18]。
相对的,
另一种相似的作法则是「服务器端的饼干」(server-sidecookies)[19]。
它
不需要浏览器额外的功能,只要服务器支持「共同信道接口」即可。
这项要求,
几乎目前的服务器都已具备。
这使得「个人信息空间」的构想,只剩下「通到程
式」的设计以及加强浏览器功能的整合,即可实现。
伍、结语
由于计算机与网络技术的发展,使完全以读者为导向的图书馆服务变得可行。
本文提出的「个人信息空间」,就是此一构想下的产物。
这个构想,某种程度上,
可以解决未来数字化图书馆面临网络资源的分类、编目、馆藏发展与读者服务的
问题。
而这些问题应当是图书馆学或信息科学急切探讨的课题。
在全球信息网络的环境下,发展克服其「不记录状态」(stateless)的技
术,对以「对话」为导向(sessionbased)的应用非常重要。
这项技术将使更
多的信息网络应用变得可行,网络上的用户也将因此获得更好的服务。
全球信息网络上的浏览器、服务器毕竟属于应用程序的层次,是一种介于使
用者与操作系统之间的软件,其中操作系统则是介于应用软件(或用户)与电
脑硬件之间的系统。
Windows95操作系统出现时标榜其设计理念以「文件为中
心」,让用户透过操作系统来管理抽象层次较高的文件,而不是档案。
虽然此
种设计理念早在苹果(Apple)公司推出麦金塔(Macintosh)个人计算机时就已存
在,但微软(Microsoft)的努力,将会加速促使后续的操作系统具备更佳的亲
和性。
未来不管网络应用程序与操作系统如何结合、怎么发展,我们需要的是像
「个人信息空间」这样的系统或者更好的构想,使我们专注于信息的消费与生
产,而不必只为了拥有一个Email账号,却必须签入(login)一部计算机,面对
学习一大堆指令的困扰。
参考数据
[1]SpecialIssuesonDigitalLibraries,CommunicationsofTheACM.,
Vol.38,No.4,April1995.
[2]DigitalLibraries'94,ProceedingsoftheFirstAnnualConference
ontheTheoryandPracticeofDigitalLibraries.CollegeStation,
Texas,USA.June19-21,1994,http:
//atg1.wustl.edu/DL94
[3]DigitalLibraries'95,ProceedingsoftheSecondInternationalConference
ontheTheoryandPracticeofDigitalLibraries.Austin,Texas,USA.
June11-13,1995,http:
//bush.cs.tamu.edu/dl95/README.html
[4]ISDL'95:
InternationalSymposiumonDigitalLibraries1995.Universityof
LibraryandInformationScience,TsukubaScienceCity,Ibaraki,Japan,
August22-25,1995,http:
//www.DL.ulis.ac.jp/I
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图书馆 个人空间 构想
![提示](https://static.bdocx.com/images/bang_tan.gif)