科技信息检索与利用2PPT课件下载推荐.ppt
- 文档编号:15586703
- 上传时间:2022-11-06
- 格式:PPT
- 页数:88
- 大小:3.42MB
科技信息检索与利用2PPT课件下载推荐.ppt
《科技信息检索与利用2PPT课件下载推荐.ppt》由会员分享,可在线阅读,更多相关《科技信息检索与利用2PPT课件下载推荐.ppt(88页珍藏版)》请在冰豆网上搜索。
v第三阶段:
联机检索阶段。
1965年以后,第三代集成电路计算机进入实用化阶段,存储介质发展为磁盘和磁盘机,存储容量大幅增加,数据库管理和通信技术都有深入发展,信息检索从脱机阶段进入联机信息检索时期。
1967年以后,许多联机系统相继出现。
比较有名的就是美国洛克希德公司的DIALOG系统和系统发展公司的ORBIT系统。
这一时期的信息检索实现了远程实时检索。
v第四阶段:
光盘检索阶段。
20世纪80年代以来,一种新型的信息载体激光光盘在信息检索系统中得到越来越广泛的应用。
v第五阶段:
网络化联机检索阶段。
20世纪90年代以来,以Internet为核心连接起来的全球计算机网络为人们跨越时空、行业、地域,快速、高效传递信息提供了国际化的知识信息平台,极大地提高了获取信息的主动性。
传统的“提问检索”模式已逐步被网络环境中“浏览查询”模式取代。
2.1.1信息检索的概念广义的信息检索有两方面的含义:
一是将信息按照一定的方式组织和存储起来;
二是根据用户的需要找出有关的信息资料的过程和技术,称为“信息的存储与检索”又叫信息的存取。
狭义的信息检索仅仅指从信息集合中找出所需要的信息的全过程。
v信息检索原理信息检索原理信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出。
信息检索原理图信息需求信息表达标引检索提问信息标识比较与匹配评价与反馈检索结果1、信息的外部特征:
题名、责任者、出版机构、ISBN、专利号、标准号、报告号等,将其按一定的方法进行组织、排列。
形成检索途径。
2、信息的内容特征:
按信息的学科属性或主题按照一定的方法进行排列。
3、存储过程4、检索过程5、检索点:
也称检索入口,一般来说,设置的信息检索点主要有:
分类、主题、名称、著者、代码等。
2.1.2.1.信息检索的类型信息检索的类型1、以检索内容区分1)文献检索:
凡以文献(包括文摘、题录或全文等)为检索对象的检索称为文献检索。
根据检索内容的不同可分为书目检索和全文检索。
文献检索一般是一种相关性检索,不直接解答用户所提出的技术问题,只提供与之相关的文献或文献线索。
检索工具一般利用书目、文摘、索引、题录及全文数据库等。
2)数据检索:
数据检索的对象是数值性数据。
3)事实检索:
是以从文献中抽取的事项做为检索内容的信息检索。
2、以检索方式区分1)手工检索2)计算机检索v2.1.3信息检索系统v1.信息检索系统的类型v目录v题录v文摘v全文v信息检索系统的构成1、广义的信息检索系统的构成1)检索文档2)技术设备3)语言工具4)作用于系统的人2、狭义的信息检索系统的组成v从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分v数据库的结构:
文档记录字段$文档:
数据库中一部分记录的有序集合$记录:
数据库的信息单元,每条记录描述了一个原始信息的外部特征和内部特征。
$字段:
比记录更小的单位,是组成记录的数据项目。
2.1.4文献信息检索方法类型1、常规法:
利用检索工具,以主题、分类、著者等为检索入口检索所需文献的方法。
顺查法、逆查法、抽查法。
2、追溯法:
利用原始文献后面所附的参考文献和有关论著引文注释进行追踪检索的一种方法。
3、循环法:
是常规法与追溯法的结合,交替使用的检索方法,也叫综合法。
2.1.5文献信息的一般检索步骤1.分析研究课题,明确检索要求搞清楚本课题属于什么学科,所需情报的文献类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。
2.1.5文献信息的一般检索步骤2.选择检索工具或检索系统v按照课题的检索要求和目的,选择收录文献种类、专业覆盖面、年代跨度对口的数据库;
v当需要查找最新文献信息时,选择数据更新周期短的数据库;
v当还需要获取原文时,选取原文获取较容易的数据库;
2.1.5文献信息的一般检索步骤2.选择检索工具或检索系统2.1.5文献信息的一般检索步骤2.数据库的选择自然科学常用的文献数据库v中文类自然科学常用数据库:
中国期刊网全文数据库,文理各科维普期刊网全文数据库,文理各科万方数据资源系统全文数据库,理工科超星读秀、方正Apabi数字图书馆、v外文类自然科学常用数据库:
SpringerLink数据库EBSCO文摘/全文数据库,文科为主2.1.5文献信息的一般检索步骤v3.确定检索途径v4.记录和阅读文献线索v5.索取原始文献2.1.6检索效果评价1、检索效果的有效性评价v信息检索的效果评价是指运用科学的方法,按照设定的指标体系,对信息检索效果进行评价的过程。
目前主要从三个方面进行评价。
1)查全率和查准率是由美国的佩里和肯特于20世纪50年代中期提出来的,后经过不断改进和完善,至今已成为评价检索效果最常用的两项关键指标。
确定查全率和查准率最常用的方法是有名的2-3表:
查全率指检出的相关文献量与检索系统中相关文献信息总量的比率,它反映出信息检索系统检出相关文献信息的能力。
查全率(R)=(检出相关文献信息量/检索系统中相关文献信息总量)100%=(a/a+c)100%查准率是指检出相关文献信息量与检出文献信息总量的比率,它反映出信息检索系统的精确度,说明系统排除干扰,减少噪音的能力。
查准率(P)=(检出相关文献总量/检出文献信息总量)100%=(a/a+b)100%2)漏检率与误检率漏检率指漏检相关文献信息量与检索系统中相关文献信息总量的比率,它与查全率相对应。
漏检率=(漏检相关文献信息量/检索系统中相关文献信息总量的比率)100%=(c/a+c)100%误检率是指误检(检出不相关)文献信息总量与检出文献信息总量的比率,它与查准率相对应。
误检率=(误检文献信息量/检出文献信息总量)100%=(b/a+b)100%2、检索系统实用性评价。
包括系统对用户是否需要,是否实用,有多大实用效果,即检索的社会效果的评价。
3、检索费用效率评价,即检索的经济效果评价,包括检索系统完成检索服务的成本及时间消耗。
v影响检索效果的因素影响检索效果的因素1、标引的质量2、检索语言的性能3、检索途径的数量4、检索策略的优劣5、检索人员的素质2.2检索概念的分析和检索语言的应用2.2.1概念分析准备v1课题分析方法v探索研究型课题v调查研究型课题v面向应用型课题v2.课题背景知识的获取方法v课题的背景知识包括课题研究的对象、研究对象所属的学科和主要涉及内容(包括研究对象、使用方法、主要研究单位和人员等)v网上搜索引擎、专著、手册、百科全书等2.2.2检索概念的切分、提取和扩展方法v.概念的切分。
v以词为单位进行划分,切分需要彻底,做到“到词为止”,但又必须是表达一件事物的完整名称。
例如:
“计算机管理系统”应切分成“计算机、管理系统”,而不能切分成“计算、机、管理、系统”。
切分后,所要检索的课题就转换成词的集合,但必用的核心词往往很少,多数的是限定词。
v.主要检索词、辅助检索词和禁用词。
v主要检索词:
与课题所研究的对象、方法有关的特指性事物名词。
v辅助检索词:
泛指性名词,它们只在检索结果过多需要限制时使用。
v禁用词:
介词、连词等虚词。
v.概念的扩展方法v基于同一概念的检索词的扩展法v
(1)寻找同一事物的学名和俗名、商品名和代号等如:
贸易与商业,便携式录音机和walkman,涉外与对外,刊物与杂志,v
(2)寻找同一事物的简称、全称、音译和意译等如:
外语与外国语言,worldwideweb、WWW、互联网与因特网、科技与科学技术,培养与教育v(3)寻找同一事物名称的近义词和反义词如:
教学与培训、教育,研究与分析、比较、理论、变化,翻译与直译、意译,美术与艺术,英汉与汉英,否定与肯定v(4)如果是英语,寻找同一事物名词的单复数、不同词性、英美语的不同形式如:
cheque与check,colour和color,stock和share等v基于内容分析的概念扩展法v
(1)上位概念扩展法,分析检索对象的学科归属。
如:
英语与外语,美术与艺术,上海图书馆与公共图书馆,词法与语法,专利与知识产权、继承法与民法、唐诗与古诗、词法与语法等v
(2)下位概念扩展法,又称概念分析的树形展开法。
v英语外贸应用文英汉科技翻译书信函电公文化学机械通信口译笔译v(3)隐含概念扩展法如:
“投资管理”的显见主题是“投资管理”,隐含主题还有“投资法规”、“投资法律”。
又如,“作家笔下的主人公特征比较”,隐含主题还有“文学作品”和“小说”。
v基于检索结果的概念扩展法v对初步检索结果进行分析,往往能够得到与课题相关的新的检索概念,将这些概念经过重新组合,就可以达到扩展检索结果的目的。
思考题v1、StudyonthemarketmanagementinChina中哪些词宜选做主要检索词,哪些词宜选做辅助检索词,哪些词属于禁用词?
v2、就“外语”使用同物异名方法、上位概念方法和下位概念方法,各扩展一个检索词。
v3、“大学语文课程现状调查与问题分析”检索词的选取。
2.2.3文献信息的内外部特征和检索语言的定义v.文献信息的内外部特征v信息的外部特征:
v信息的内容特征:
.定义和类型信息检索语言是用来表达信息概念的一种人工语言,它是根据信息组织和检索的需要所编制的特殊标识。
检索语言由基本词汇和语法规则组成。
类型:
1、按结构原理划分:
等级体系分类法和组配分类法2、按包括的专业范围划分:
综合性、专业性3、按标识的组合使用方法划分:
先组式和后组式4、按描述语言的选词特征来划分,可以分为单元词、叙词、关键词、主题词、代码、引证5、按规范形式来划分:
可分为规范检索语言和自然语言。
6、按描述文献的特征划分:
外部特征表标识和内容特征标识。
2.2.4分类检索语言分类检索语言又称分类法,是用分类号来表达信息中所含有的主题概念。
它一般包括类目表和分类规则。
我国近代三大分类法分别是:
中国图书馆分类法(简称中图法)、中国科学院图书馆图书分类法(简称科图法,主要在科学院系统使用)、中国人民大学图书馆图书分类法(简称人大法)中国图书馆分类法中图法在结构上主要有类目表、标记符号、说明和注释、类目索引等四部分组成。
类目表是在基本大类的基础上,由基本大类、简表、详表、复分表四部分组成。
类目之间的关系有从属关系、并列关系、交替关系、相关关系四种。
中国图书馆图书分类法v1999年推出了第四版,共分大部类22个基本大类。
22个基本大类是在5在部类的基础上第一次划分得到的,称为一级类目,分别对应一个英文字母;
从基本大类起,再连续划分3次,得到二级、三级、四级类目。
采用汉语拼音字母和数字相结合的方式对图书进行分类,是目前国内各公共图书馆和高校图书馆普遍使用的图书分类法,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科技 信息 检索 利用