信息检索与服务-信息管理概论-柯平.doc
- 文档编号:1280121
- 上传时间:2022-10-20
- 格式:DOC
- 页数:15
- 大小:201.50KB
信息检索与服务-信息管理概论-柯平.doc
《信息检索与服务-信息管理概论-柯平.doc》由会员分享,可在线阅读,更多相关《信息检索与服务-信息管理概论-柯平.doc(15页珍藏版)》请在冰豆网上搜索。
8信息检索与服务
信息检索是获取信息最重要、最有效的手段。
其作用在于节约检索者的时间和精力,避免科学研究中的重复劳动,指引读书治学等。
信息服务是与信息和信息工作密切相连的一种特定范围的劳动,同其它商品一样提供自己的特殊使用价值为社会带来财富。
本章概述了信息检索与服务的基本原理与方法,作为信息过程管理的一个重要组成部分。
8.1信息检索
8.1.1信息检索基础理论
1、信息检索(InformationRetrieval)概述
(1)信息检索的含义:
狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。
广义的检索包括信息的存储和检索两个过程:
①信息存储(Storage)是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。
②检索(Retrieval)是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
(2)信息检索的类型:
①数据检索(dataretrieval)
数据检索:
以文献中的数据为对象的一种检索。
存贮的信息是数据,检索时要搜索数据资料档,并针对提问输出答案。
数据检索是从文件、数据库或存储装置中查找和选取所需数据的操作或过程,包括数值形式和非数值形式的数据。
按查询问题的要求,分为简单检索(即单一因素的检索)和综合检索(即综合条件检索)。
如:
查找各种物质的物理化学常数、各种统计数据和工程数据等。
(“某一新型载货汽车的载重量是多少?
百公里油耗是多少?
”)
②事实检索(FactRetrieval)
事实检索以文献中的事实为对象,检索某一事件发生的时间,地点,或过程;存贮的信息是各种事实,检索时可以对被检索的事实作某种逻辑推理,进行比较和分析,然后再输出有关某一事物的具体答案。
如:
查找鲁迅生于某年?
世界上最长的斜拉桥是哪座?
该桥位于什么地方?
何时建成?
事实检索要求检索系统不仅能够从数据(事实)集合中查出原来存入的数据或事实,还能够从已有的基本数据或事实中推导、演绎出新的数据或事实。
例如,系统中存储如下事实:
①李明是A校学生。
②A校学生都学外语。
如果该系统是事实检索系统,则它应当能回答某用户提出的“李明学外语吗?
”这种问题。
事实检索是情报检索中最复杂的一种。
它要求系统中的数据和事实以自然语言或接近于自然语言的方式存储。
不仅要存入各种数据或事实单元,还要存入各单元之间的语义关系、句法关系以及各种有关的背景知识。
允许用户用自然语言提问,并能用自然语言作答。
更重要的是,系统必须具有一定的逻辑推理能力和自然语言理解功能。
目前事实检索通常还是依靠人工来完成。
③文献检索(InformationRetrieval)
文献检索:
以文献原文为检索对象的一种检索。
存贮的信息是文章标题、著录项目和关键词组成的文献单元,检索时,按提问检索词查找文献资料档,输出文献题录和文摘。
例如,“设计人行天桥的参考文献有哪些?
”
文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。
一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。
2、信息检索原理
信息检索系统是通过信息存储和信息检索两个互逆的过程来实现系统的职能。
工作原理如下图所示。
一个完整的信息检索系统是由存储子系统和检索子系统两部分组成的。
(1)存储过程
对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即组织检索系统的过程或生成检索工具库。
(2)检索过程
分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与途径检索有关信息,即检索系统的应用过程。
(3)信息存储与检索相互依存
由于职业、知识水平、个人素质甚至习惯等因素的差异,信息存储人员(标引者)与信息检索用户(检索者)对同一信息的分析、理解会存在不同。
比如《计算机在生物化学中的应用》一文,标引者可能将其归入“生物化学”类,而检索者则可能在“计算机”类查找该文。
这样,标引者与检索者之间发生了标引错位,存储的信息就无法检索到。
怎样才能保证信息存得进又取得出呢?
那就是存储与检索所依据的规则必须一致,也就是说,标引者与检索者必须遵守相同的标引规则。
这样,无论什么样的标引者,对同一篇文献的标引结果一致,不论是谁来检索,都能查到这篇文献。
信息存储与检索共同遵循的规则称之为信息检索语言(详见8.1.3)。
只要标引者和检索者用同一种检索语言来标引要存入的信息特征和要查找的检索提问,使它们变成一致的标识形式,信息的存储过程与检索过程就具备了相符性。
相应地,存入的文献也就可以通过信息检索工具(系统)检索出来。
如果检索失败了,那么就要分析一下检索提问是否确切地描述了待查课题的主题概念?
在利用检索语言标引时是否出了差错,从而导致检索提问标识错误?
只有检索提问标识和信息特征标识一致时,相关的文献才能被检索出来。
信息检索正是以信息的存储与检索之间的相符性为基础的。
如果两个过程不能相符,那么信息检索就失去了基础。
检索不到所需的信息,存储也就失去了意义。
3、信息检索方法
(1)常用法
又称直接法、工具法,是指直接利用检索系统(工具)检索文献信息的方法。
这种方法优点在于能够明确判断文献所包涵的信息内容是否符合需要,缺点是难以获得全面的文献,且费时费力。
如果检索课题单一,文献相对集中,又熟悉检索书刊,则可用这种检索方法,而对有多个主题、文献离散度较大的课题,就难以获得理想的检索效果。
由于此方法不依靠检索工具,因此不是严格意义上的文献信息检索方法。
它又分为顺查法、倒查法和抽查法。
①顺查法
经过分析,确定查找文献信息的起始年代,再利用选定的检索工具或检索系统,由远及近地逐年查找,此法的检索效果显著,但费时费力,工作量较大。
如:
查找《信息论》的资料可从1948年查起。
②倒查法
利用选定的检索工具或检索系统,由近及远的逐年查找,重点是查找近期的文献信息,此法节省时间,但容易漏检。
这种方法多用于检索某一课题的新技术、新方法、新理论、新进展等。
③抽查法
针对某学科处于兴旺发达时期的若干年进行文献信息的查找,此法的检索效果较好、效率也颇高,但使用的前提是必须熟悉该学科的发展过程及其特点。
(2)追溯法
追溯法是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。
它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。
(3)循环法
循环法又称分段法或综合法。
它是分期、分段交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。
4、信息检索途径
检索途径依赖于文献信息的特征。
文献具有两种特征:
即外部特征和内容特征。
文献的外部特征主要是指文献载体上标明、易见的项目,有文献题名、责任者、序号、出版者、出版地、出版年等;
文献的内容特征有所属学科及所属主题等。
因此,根据文献的外部特征和内容特征,将信息的检索途径分为两大类型。
(1)内容特征途径
①分类途径
分类途径是指按文献内容的学科分类体系查找文献信息的途径。
一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样编排的结果可将同一学科的文献集中,便于按学科查找文献。
分类目录和分类索引是普遍使用的分类检索工具。
分类途径缺点是,对于较难分类的新兴学科和边缘学科来说,查找不便,查找时须首先了解反映学科体系的分类表,再将概念变换为分类号,然后按分类号进行检索,由于概念变换为分类号的过程中易出差错,所以也会导致漏检和误检。
但是很多检索者希望从其熟悉的分类系统,从学科概念的上下左右关系了解事物的派生、隶属、平行等关系,满足族性检索的需求。
分类途径能够较好地满足这一要求。
②主题途径
主题是文献所表达的中心思想、所讨论的基本问题和研究对象。
主题途径指根据表达文献主题内容的主题词及其派生出的关键词为标识查找文献信息的途径。
主题途径的主要检索工具是主题目录和主题索引,或标题词索引、关键词索引、叙词索引等。
主题目录按文献内容主题词组织,以文献所讨论的主题直接检索,可以查到分散于各学科里同一主题的文献。
主题索引是工具书辅助索引之一,它可揭示包含该主题的文献信息在文献正文中的位置。
主题途径检索文献信息的优点是,用主题词作为标识,表达概念准确、灵活、专指度高,可使同一主题的文献集中,检索效率高。
又由于主题词可随科技发展增加或更新,因此便于查找新兴学科的文献信息,在各学科和其分支交叉渗透日益增多的当前,主题途径较好地适应了这一要求。
主题途径检索文献信息缺点是,主题索引缺少学科系统的整体性和层次性,因此,难以达到很高的查全率。
③分类主题途径
分类主题途径是分类途径与主题途径的结合,它能够尽量避免两者的不足,取其所长。
一般说它比分类体系更具体一些,无明显的学术层次划分,又比主题法概括一些,但保留了主题体系按字顺排序以便准确查检的特点。
④其它途径
主要是指一些辅助检索途径,如按化学分子式排出的“分子式索引”,可提供一种从分子式角度查找化学化工文献的目的,另外还有化学物质索引、合金索引、地名索引等各种专门索引,以满足查检特定种类文献信息的需求。
(2)外部特征途径
①著者途径
著者途径,即通常所说的责任者途径。
著者是指对文献内容负责或作出主要贡献的个人或团体,包括著者名、评者、编者等。
著者途径是根据文献著(译、编)者的名称查找文献信息的途径,是外文检索工具较为重要的途径和惯用途径。
按著者姓名字顺排列,易于利用,又便于编排,也易于机械加工。
通过著者途径进行检索,可以查找特定学者、专家的最新论著,系统地发现和掌握他们的研究方向和研究进展。
在使用著者途径检索文献时,需要注意的是检索系统对著者索引的编制规则和不同国家作者姓名的拼写。
国外比较注重劳动者途径检索,而我国很少有人去记忆人名,故著者目录少。
②序号途径
利用文献的代码、数字编号进行查找。
它的标识是书刊号、专利号、标准号等。
例如:
ISBN号7(→国别)-5001(→出版社号)-0016(→序号)-7(→校验位)
ISBN号是由10位数字组成,共分四段:
㈠组号:
代表出版者的国家、地理区域、语种等,我国的组号为“7”。
㈡出版者号:
代表组内所属的一个具体出版者(出版社、出版公司等)。
由国家或地区的ISBN中心设置和分配,可取1-7位数字。
㈢书名号:
由出版者给予每种出版物的编号。
㈣校验号:
ISBN号的最后一位数值,它能够校验出ISBN号是否正确。
例如:
武汉大学出版社出版的《图书馆学导论》,其中国标准书号是:
ISBN7-307-00211-6/G53。
其中,“7”为我国的组号,“307”为武汉大学出版社的代号,“00211”为书名号,表示该书是出版社出版的第211种书,“6”为校验码,G为分类号。
“53”为种次号,即该书为G类的第53种书。
例如美国《化学文摘》的专利索引(PatentIndex)、美国《政府报告通报和索引》(GrovernmentReportsAnnouncements&Index)的合同号/资助号索引(Contract/GrantNumberIndex)和NTIS订购号/报告号索引(NTISOrder/ReportNumberIndex)。
③名称途径
也称题名途径、书名途径。
题名是表达、象征、隐喻文献内容及特征的词或短语,是文献的标题或名称,包括书名、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 服务 信息管理 概论 柯平