科技信息检索资料.pptx
- 文档编号:1063192
- 上传时间:2022-10-16
- 格式:PPTX
- 页数:129
- 大小:617.30KB
科技信息检索资料.pptx
《科技信息检索资料.pptx》由会员分享,可在线阅读,更多相关《科技信息检索资料.pptx(129页珍藏版)》请在冰豆网上搜索。
,科技信息检索,第一章信息概论,1.1信息、知识、文献1.2信息资源及其类型1.3文献信息资源的类型与特点1.4电子信息资源的类型与特点1.5文献信息资源与现代科技、经济的发展,1.1信息、知识、文献,信息是用文字、数据或信号等形式通过一定的传递和处理来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。
信息是事物存在的方式、形态和运动规律的表征,是事物具有的一种普遍属性,它与事物同在,存在于整个自然界和人类社会。
信息的属性,信息所具有的基本属性可归结为以下四方面:
普遍性和客观性相对性和特殊性实质性和传递性媒介性和共享性,信息的类型与载体,信息的类型可以从不同的角度划分。
按形成的领域可分为自然信息和社会信息;按存在的状态可分为瞬时信息和保留信息;按表现的形式可分为文字信息、图像信息、语音信息等。
信息必须借助于一定的载体才能表现、传递和利用。
信息载体也在变化。
古代现代甲骨、金石、锦帛、竹简纸张、感光材料、磁性材料,信息载体和存储技术已发生数次质的飞跃。
知识,知识是与信息密切相关的另一个概念。
知识是人类在认识和改造世界的社会实践中获得的对事物本质认识的成果和结晶,即人类通过有目的、有区别、有选择地利用信息,对自然界、人类社会及思维方式与运动规律的认识、分析与掌握,并通过人的大脑进行思维整合使信息系统化而构成知识,因此,知识仅存在于人类社会。
知识的属性,意识性信息性实践性规律性继承性渗透性,知识的类型,根据国际经济合作发展组织(OECD)的定义,人类现有的知识可分为四大类:
Knowwhat(知道是什么)关于事实方面的知识。
Knowwhy(知道为什么)关于自然原理和规律方面的知识Knowhow(知道怎么做)关于技能或能力方面的知识Knowwho(知道归属谁)关于产权归属的知识,文献,文献是记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。
构成文献的三个最基本要素:
构成文献内核的知识信息负载知识信息的物质载体记录知识信息的符号和技术,文献的基本属性,知识性传递性动态性综上所述,信息、知识、文献三者的关系可归结为:
信息是生产知识的原料,知识是被人类系统化后的信息,文献是存储、传递知识信息的载体。
1.2信息资源及其类型,信息资源的含义与特点信息资源是信息与资源两个概念整合而衍生出的新概念。
信息并非都能成为资源,只有经人类开发与重新组织后的信息才能成为信息资源,即信息资源是信息世界中对人类有价值的那一部分信息,是附加了人类劳动的、可供人类利用的信息。
构成信息资源的基本要素信息、人、符号、载体,信息是组成信息资源的原料人是信息资源的生产者和利用者符号是生产信息资源的媒介和手段载体是存储和利用信息资源的物质形式,信息资源与其他资源相比,具有可再生性和可共享性的特点。
可再生性是指它不同于一次性消耗资源,它可以反复利用而不失去其价值,对它的开发利用越深入,它不仅不会枯竭,反而会更加丰富和充实。
可共享性是指它能为全人类所分享而不失去其信息量。
信息资源的使用价值,构成信息资源使用价值的主要要素有二:
一是真实度二是时效性,信息资源的类型,以开发的程度为依据,可分为潜在信息资源和现实信息资源按表述的方式和载体为依据,可分为口语信息资源、体语信息资源、实物信息资源和文献信息资源,1.3文献信息资源的类型与特点,以载体材料、存储技术和传递方式划分:
印刷型微缩型声像型电子型,以撰写的目的和文体划分:
著作学术论文专利说明书科技报告技术标准,以加工的深度划分:
零次文献一次文献二次文献三次文献高次文献,零次文献信息资源是最原始的信息资源,虽未公开交流,但它是生成一次文献信息资源的主要素材。
(实验记录、内部档案、设计草稿等)一次文献信息源是最主要的信息资源,是检索和利用的主要对象。
(专著、学术论文、专利说明书、科技报告等)二次文献信息资源是一次文献信息资源的集中提炼和有序化,是检索文献信息资源的工具。
三次文献信息资源是将一、二次文献信息资源,按知识门类或专题重新组合高度浓缩而成的知识产品,是查考数据信息和事实信息的主要信息资源。
(各种教科书、技术书、参考工具书、综述)高次文献信息资源是对已知知识信息进行整理、分析与评价的成果,可为研究选题、可行性技术论证、发展前景预测等提供参考、借鉴。
(述评),1.4电子信息资源的类型与特点,电子信息资源是以电子数据的形式,把文字、声音、图像等形式的信息存储在光、磁等介质上,以电信号、光信号的形式传输,并通过计算机和其他外部设备再现出来的一种信息资源电子信息资源实质上是一种机读信息资源。
电子信息资源始于20世纪60年代初,美国国家医学图书馆(NLM)设计的第一个大型批式检索数据库MEDLARS。
20世纪70年代以来,随着光盘技术发展,得到广泛应用。
1993年后,随着internet的出现和发展,网络信息资源空前发展。
电子信息资源的类型,按信息载体和通信方式分:
联机信息资源光盘信息资源网络数据库信息资源internet网络信息资源,电子信息资源的类型,按信息的表现形式分:
文本信息资源超文本信息资源多媒体信息资源超媒体信息资源,电子信息资源的特点,以磁性介质和光介质作为信息存储载体,以现代信息技术为记录手段,信息以数字化的形式存在,既可在计算机内高速处理,又可借助于通信网络进行远距离传送,使全球资源得到共享;信息表现形式为文本、超文本、多媒体和超媒体,使得信息的组织方式发生质的变化,提高了信息资源的利用价值。
1.5文献信息资源与现代科技、经济的发展,文献信息资源与现代科技的发展据不完全统计,20世纪前50年的科技成果远比19世纪多。
进入20世纪60年代后,科技的新发明、新发现,比过去2000年的总和还要多。
科技发展综合化,综合学科、边缘学科和交叉学科大量出现;自然学科和社会学科之间相互汇流。
文献信息资源与现代科技发展关系的主要体现信息量急剧增长文献信息的使用寿命缩短文献信息载体的多样化和信息传播、检索的多途径化,文献信息资源与现代经济的发展,信息是现代经济发展的保证知识经济特征:
科技、知识和信息相互融合。
经济结构不断软化产品制造模式转向知识密集型不断学习和更新知识变得越来越重要,第二章信息检索原理及检索技术,2.1信息检索概述2.2信息检索原理2.3信息检索方法2.4信息检索技术及其应用,2.1信息检索概述,信息检索通常是指以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。
完整的信息检索含义还包括信息的存储。
信息检索全过程应包括:
信息标引和存储过程;信息的需求分析和检索过程。
信息检索实质是:
将描述特定用户所需信息的提问特征,与信息存储的检索标志进行大小、异同的比较,从中找出与提问特征一致或基本一致的信息。
即对比匹配。
实例:
硅藻土在塑料工业中的作用,“硅藻土”和“塑料”为第一层面的提问特征“硅藻土”和“通用塑料、特种塑料、工程塑料”为第二层面的提问特征“硅藻土”、“聚氯乙烯、聚乙烯、聚丙烯、聚酰胺、聚酰亚胺、聚酯,玻璃钢”等塑料品种为第三层面的提问特征。
信息检索的重要意义与作用,充分利用信息资源,避免重复劳动可以检索到有关课题的全部资料,增加科研的成功率缩短劳动时间,促进社会进步为人们更新知识,实现终生学习提供门径,信息检索的类型与特点,信息检索根据检索的目的和对象不同,可以分为:
书目信息检索全文信息检索数据信息检索事实信息检索,2.2信息检索原理,信息检索效率:
1.查全率,R=检出的相关信息量/该系统信息库中存储的相关信息量*100%,2.查准率P=检出的相关信息量/检出信息总量*100%,信息检索效率,查全率与查准率之间存在着相互制约的现象,即提高查全率会使查准率下降,提高查准率会使查全率下降。
因此,在实际检索中,必须同时兼顾查全和查准,不可片面追求某一方面。
信息检索系统,手工检索系统手工检索系统又称传统检索系统,是用人工查找信息的检索系统。
其主要类型有各种书本式的目录、题录、文摘和各种参考工具书等。
计算机检索系统计算机检索系统,是用计算机技术、电子技术、远程通信技术、光盘技术、网络技术等构成的存储和检索信息的系统。
手工检索系统,优点:
操作简便,反馈迅速,可随时根据需求修改检索策略,费用低廉,图书馆和文献收藏单位都有比较完整的这种检索工具可供利用,随时可查找。
缺点:
检索速度受限,检索效率低,查全率低。
计算机检索系统,优点:
检索速度快,检索效率高,节省人力和时间;服务范围广;采用灵活的逻辑运算和后组式组配方式,便于进行多元检索,检索结果形式多样;可实现远程检索;缺点:
检索费用高,数据库收藏文献的时间有限。
数据库类型,参考数据库源数据库全文数据库数值数据库,数据库结构,书目数据库结构全文数据库结构数值数据库结构指南数据库结构,书目数据库结构,书目数据库是以文档形式组织的一系列数据。
字段:
是组成记录的基本数据单位。
记录:
是作为一个单位来处理有关数据的集合,是组成文档的基本数据单位。
文档:
按一定机构组织的相关记录的集合。
顺排文档:
记录按顺序存放,记录之间的逻辑顺序与物理顺序是一致的,相当于印刷型工具中文摘的排列顺序,是一种线形文档。
顺排文档是构成数据库的主体部分,但其主题词等特征的标识呈无序状态,直接检索时,必须以完整的记录作为检索单元,从头至尾查询,检索时间长,实用性较差。
倒排文档:
将顺排文档中各个记录中含有主体性质的字段(如主题词字段、标题字段等)和非主题性质字段(如作者字段、机构字段等)分别提取出来,按某种顺序重新组织得到的一种文档。
具有主题性质的倒排文档,称基本索引文档,非主题性质的倒排文档,称辅助索引文档。
顺排文档和倒排文档的主要区别顺排文档以完整的记录为处理和检索单元,是主文档;倒排文档以记录中的字段为处理和检索单元,是索引文档。
计算机进行检索时,先进入倒排文档查找有关信息的存取号,然后再进入顺牌文档按存取号查找记录。
信息检索语言,检索语言又称标引语言、索引语言、概念标识系统等,是信息检索系统存储和检索信息时共同使用的一种约定性语言,以达到信息存储和检索的一致性,提高检索效率。
信息检索语言的特点,
(1)具有必要的语义和语法规则,能准确地表达科学技术领域中的任何标引和提问的中心内容和主题;
(2)具有表达概念的唯一性,即同一概念不允许有多种表达方式,不能模棱两可;(3)具有检索标识和提问特征进行比较和识别的方便性;(4)既适用于手工检索系统,又适用于计算机检索系统。
信息检索语言的作用,
(1)信息检索语言可以表示文献内容、数据或其他信息形式,对文献的情报内容(及某些外部特征)加以标引
(2)对内容相同及相关的信息加以集中或揭示其相关性(3)对大量信息加以系统化或组织化(4)便于将标引用语和检索用语进行相符性比较,是概念上进行匹配(5)能够指示计算机执行查询与检索,检索语言种类,按表述信息内容特征划分:
分类语言:
体系分类语言组配分类语言混合分类语言主题语言:
标题词语言单元词语言叙词语言关键词语言目前应用得最广的是体系分类语言、叙词语言和关键词语言。
体系分类语言,体系分类语言是按照一定的观点,以学科分类为基础,用逻辑分类的原理,结合信息的内容特征,运用概念划分的方法,按知识门类从总到分,从上到下。
层层划分,逐级展开组成分类表,并以分类表来标引、存储信息和检索信息。
具有代表性的体系分类法有杜威十进分类法、美国国会图书馆分类法、中国图书馆分类法、中国人民大学图书馆图书分类法等。
体系分类语言的特点,优点:
按学科专业集中文献,能较好地体现学科的系统性,适合从学科或专业角度进行族性检索;采用等级列举式的概念标识系统来揭示概念间的相互关系,适合人们认识事物的习惯,方便用户掌握;采用分类号作为主题的标识,简明且不受语种的限制。
不足:
修订不便,体系分类表具有相对稳定性,不能随时增设反映新知识主题的类目;分类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科技 信息 检索 资料