检索的相关复习.docx
- 文档编号:23613261
- 上传时间:2023-05-19
- 格式:DOCX
- 页数:18
- 大小:99.50KB
检索的相关复习.docx
《检索的相关复习.docx》由会员分享,可在线阅读,更多相关《检索的相关复习.docx(18页珍藏版)》请在冰豆网上搜索。
检索的相关复习
第一章:
信息素养;主要包括四个方面:
信息意识、信息是知识、信息能力和信息道德。
这四个要素共同构成一个不可分割的统一整体,其中信息意识是先导,信息知识是基础,信息能力是核心,信息道德是保证。
十大文献信息源
图书期刊报纸
会议文献专利文献标准文献产品样本科技报告政府出版物
学位论文P6
加工层次(一次主要指作者以本人的研究成果为基本素材而创作或撰写的文献,例如:
图书专著、期刊论文、专利说明书等
,二次。
主要指文献工作者对一次文献进行加工、提炼和压缩之后得到的产物,是为了便于管理利用一次文献而编辑、出版和累积起来的工具性文献。
一般包括目录、题录、文摘、索引等
•。
一次文献是文献的基本形式,是检索的主要对象,是形成二次文献和三次文献的基础;
•二次文献是检索一次文献的工具;
)
图书的含义凡篇幅达49页以上并构一个书目单元的文献称为图书
图书的特征
图书一般分为两类:
阅读型:
教科书、专著等
工具型:
字典、百科全书、年鉴、手册。
*主题突出,内容系统,论述全面深入,
知识成熟稳定。
*出版的周期长,因而其内容一般就缺乏
最新的研究成果。
主要传授知识,而不是报
道最新情报。
第二章
检索语言分类(外部,内部)
1.按表述文献有关特征划分
(1)表述文献外部特征的检索语言它以文献信息上表明的、显而易见的外部特征,如题名、著者、专利号、出版者等作为文献的标识和检索依据,具体包括提名语言、著者语言、号码语言等。
(2)表述文献内容特征的检索语言
文献的内容特征通常指文献概念、文献所属的学科等。
这类语言主要包括分类语言和主题语言。
在揭示文献内容和表达检索概念提问方面,这类检索语言更具有深度。
2.按标识组配方式划分
(1)先组式检索语言
先组式检索语言是指描主题概念的标识在标引、检索之前就已经确定的标识系统,如体系分类语言、标题词语言等
(2)后组式检索语言
后组式检索语言是指表述文献的标识在标引、检索之前未固定组配,在实际标引、检索时根据检索的实际需要,按照组配规则临时进行组配的标识系统,如叙词语言、关键词语言等。
体系分类法特点直接体现知识分类的等级概念分成5个基本部类,基本部类是对人类全部知识作最概括的划分。
由基本部类划分出22个基本大类,基本大类是较为概括的大学科领域的划分,用由A到Z的22个字母表示。
中图法分类
A马列、毛泽东思想N自然科学总论
B哲学、宗教O数理科学和化学
C社会科学总论P天文学、地球科学
D政治、法律Q生物科学
E军事R医药、卫生
F经济S农业科学
G文化、科学、教育T工业技术
H语言、文字U交通运输
I文学V航空、航天
J艺术X环境科学、安全科学
K历史、地理Z综合性图书
表述文献外部特征(题名语言,著者语言号码语言)
、分类(题名著者专利号出版社等)
主题词语言概念:
P17
主题语言是采用表达某一事物或概念的名词术语来标引、存储、检索的一种检索语言。
关键词语言以关键词作为文献内容标识和检索入口的一种主题语言。
关键词是直接从文献中抽取的,未经规范化处理的自由词。
叙词语言叙词语言是以自然语言词汇为基础,把表示单元概念的规范化词汇进行组配为基本是使用原则,以能表达信息资源主题的最小概念的标引、存储、检索信息资源的一种检索语言。
叙词是一种后组式语言,表达文献主题概念的标识------叙词在检索是根据需要进行组配。
叙词语言是在分类语言,标题词语言,关键词语言和单元词语言基础上发展出来的P17
检索技术(3个)
(1)布尔检索逻辑与逻辑或逻辑非
(2)截词检索1.后截断有限后截断无限后截断2.中间截断(3)限制检索1.字段限制检索2.二次检索
位置检索P25
(1)邻位检索
(2)同句检索
限时间检索
W,N的区别邻位检索P25
P29检索途径和方法
检索策略、检索步骤、检索式的构造
第三章
搜索引擎的分类
Ø目录式搜索引擎
Ø全文搜索引擎
Ø元搜索引擎
综合类搜索引擎
专业类搜索引擎
XXP40
Ø①简单检索
Ø多个检索词之间支持逻辑组配检索,“空格”、“+”或“&”表示逻辑与的关系,用“∣”表示逻辑或的关系;用“-”表示逻辑非的关系
Ø在简单检索中,如果检索结果太多,还可以在检索结果中进行再次检索
语法字符
含义及用法
intitle:
限定在网页标题中搜索
site:
限定在特定站点搜索
inurl:
限定在URL链接中搜索
filetype:
文档类型(如:
doc、jpg、mpeg、…)限定
例:
“信息检索filetype:
all”表示结果中含有“信息检索”的所有文档类型的文件
双引号(“”)
检索结果的精确匹配
、谷歌的检索语法typeP36
4.1文件搜索之高级语法
ØSite:
在某一类站点中查找信息
ØFiletype:
在某一类文件中查找信息
ØInurl:
搜索的关键词包含在URL链接中
ØIntitle:
搜索的关键词包含在标题中
Site语法功能
“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“”等等
Filetype语法功能
Ø“filetype:
”是Google开发的非常强大实用的一个搜索语法。
也就是说,Google不仅能搜索一般的文字页面,还能对某些文档进行检索,如.xls、.ppt、.doc、.pdf、.swf等。
目前Google检索的PDF文档大约有2500万左右。
Inurl语法功能
Øinurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
Ø例如:
inurl:
毛人凤戴笠
Intitle语法功能
Ø“intitle”的用法类似于上面的inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。
网页标题,就是HTML标记语言title之间的部分。
网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。
因此,只查询标题栏,通常也可以找到高相关率的专题页面。
注意事项
ØSite、filetype、inurl、intitle后面的“:
”必须是英文符号;
Ø“:
”后面的关键词必须紧挨着冒号,不许加空格;
Ø各语法功能可以复合使用。
Ø不支持“通配符”(*)搜索
Ø添加英文双引号来搜索英文短语
Ø采用了停用词表技术,对可能被忽略的关键词进行强制搜索时,需要在该关键前加上英文“+”号
语法字符
含义及用法
intitle:
限定在网页标题中搜索
site:
限定在特定站点搜索
inurl:
限定在URL链接中搜索
filetype:
文档类型(如:
doc、jpg、mpeg、…)限定
例:
“信息检索filetype:
all”表示结果中含有“信息检索”的所有文档类型的文件
双引号(“”)
检索结果的精确匹配
国内外的检索途径P36
Ei/ebsco/全文数据、文摘的区别
第四,五章
四大索引数据库
第六章
专利文献概念广义:
指各国专利局的公开出版物,包括专利申请文件、专利说明书、专利分类资料、专利检索工具等狭义:
仅指专利说明书(在文献检索中使用狭义概念)
、类型
专利数据库
第七章
特种文学、中国学位论文、美国的学位论文、美国四大科技报告、特种文献
单项选择题每题2分,20道题;填空题每空1分,20个空;判断改错题8道题16分;简答题2道题12分;检索题4道题12分。
除了课堂上点的重点补充一下:
课件大家要认真看一下,特别是前两章补充的知识。
科技检索的
科技检索期末复习
一、第一章----概述
1.信息素养构成要素----主要包括:
信息意识,信息知识,信息能力和信息道德,这四个要素共同构成一个不可分割的统一整体,其中信息意识是先导,信息知识是基础,信息能力是核心,信息道德是保证。
2.文献要素----知识、载体、和记录
其中知识决定文献内容,载体决定文献的形态,记录则是构成文献的手段。
3.10大信息源----图书、期刊、报纸、会议文献、政府出版物、科技报告、学位论文、专利文献、标准文献、产品样本
4.信息资源按加工层次可划分:
一次信息(如著作,论文),二次信息(如书目,索引,文摘,网上搜索引擎),三次信息(如综述、述评、专题报告)
5.文献的加工深度划分:
零次检索:
主要指尚未经过系统整理形成一次文献的零散资料,例如未正式发表的书信、手稿、讨论稿,实验的原始数据,工程草图,人们在某些专业会议上口头交流的经验或某些论点等
一次检索:
主要指作者以本人的研究成果为基本素材而创作或撰写的文献,例如:
图书专著、期刊论文、专利说明书等
二次检索:
主要指文献工作者对一次文献进行加工、提炼和压缩之后得到的产物,是为了便于管理利用一次文献而编辑、出版和累积起来的工具性文献。
一般包括目录、题录、文摘、索引等
三次检索:
主要指对有关的一次文献和二次文献进行广泛深入的分析研究之后综合概括而成的产物,具体包括述评、综述、文献指南、手册、百科全书、年鉴等
第二章信息检索原理与检索技术
1.信息检索的基本原理:
信息按照一定的方式存储,并在存储的过程中对信息进行选择与匹配。
2.文献检索的类型:
(1)按检索内容划分:
文献信息检索、数据信息检索、事实信息检索
(2)按文件检索技术划分:
全文文本检索、超文本检索、多媒体检索、网络信息检索
3.文献检索系统的类型:
(1)按著录方式的划分:
目录、题录、文摘、参考工具、全文数据库和搜索引擎
(3)按照信息存储和检索的设备划分:
手工检索系统、计算机检索系统、穿孔卡片系统、缩微品检索系统
(4)按照检索手段划分:
脱机检索系统、联机检索系统、光盘检索系统和网络信息检索系统
(4)按照收录文献的范围划分:
综合性检索系统、专业性检索系统、单一性检索系统
(5)按照揭示文献的方式划分:
目录、索引(可分为:
篇目索引、内容索引)、文摘、全文
3.数据库的类型:
P11
(1)参考数据库:
书目数据库存储、事实型数据库存储
(2)源数据库:
全文数据库、数值数据库
4.数据库的结构:
文档—记录(最基本数据单位)—字段(最小单位)P13
字段是构成数据库的最小单位,一个记录包含若干个字段。
6.信息检索语言的分类P14
1)按规范化程度划分:
人工语言、自然语言(课件PPT)
2)按文献信息资源的特征划分:
(注意外部特征及内容特征)
3)按标识组配方式划分:
先组式检索语言、后组式检索语言
4)按检索语言的结构划分:
分类检索语言、主题词检索语言
7.分类语言P15
体系分类法(基础:
科学分类,对象:
文献内容的学科性质)----中图法(由类目表、辅助表和索引三部分组成)包括:
5大基本部类(马克思主义、列宁主义、毛泽东思想、邓小平理论,哲学,宗教,社会科学,自然科学,综合性图书)和22个基本大类
主题语言:
P17主题语言是采用表达某一事物或概念的名词术语来标引、存储、检索的一种检索语言。
8.信息检索技术:
1)布尔检索优先级:
P22
1)同级运算自左向右进行
2)遇有几种逻辑运算符混合使用,优先顺序为NOT(—),AND(*),OR(+)
3)当检索式同时含有截词符、位置算符及字段限制符时,布尔运算最后运行
4)括号可以改变运算执行顺序
2)截词检索:
P22
“*”表示无限截断,“?
”表示有限截断
(分为有限/无限后截断,中间截断)
限制检索{字段限制检索【1.菜单选择方式2.字段代码方式】二次检索}
位置检索{1.邻位检索}
W,N的区别邻位检索P25
●(W)或()——with
表示算符两侧的检索词之间只能是空格或标点符号,不得有其他字母或词,且词序不能颠倒。
例如:
double(W)digit
表示具有doubledigit和double-digit形式的文献记录为命中文献。
•(nW)——nwords
表示两个词之间可插入n个词,且词序不可颠倒
例如:
Laser(1W)printer
表示具有Laserprinter和Lasercolourprinter形式的文献记录为命中文献。
•(N)——Near
表示在此算符两侧的检索词相邻,且顺序可以颠倒,但两词之间不可插入任何词。
例:
intelligent(N)machine
可检出intelligentmachine及machineintelligent等方面的信息。
•(nN)——Near
表示两个词之间最多可插入n个词,词序任意。
例:
econom?
(2N)recovery
可检出表示“经济恢复”的以下词语:
economicrecovery,recoveryoftheeconomy,及recoveryfromtheeconomic
•区别相同:
不能有其它的字母或词。
(nW)表示两个词之间可插入n个词(nN)表示两个词之间最多可插入n个词不同(W)表示算符两侧的检索词之间只能是空格或标点符号且词序不能颠倒(nW)词序不可颠倒;(N)——Near
•表示在此算符两侧的检索词相邻,且顺序可以颠倒,但两词之间不可插入任何词。
(nN)——Near
表示两个词之间最多可插入n个词,词序任意。
3)位置运算符优先于逻辑算符P25
4)字段代码式检索(前缀式,后缀式):
如查找李明发表在清华大学学报上的文献:
AU=李明*JN=清华大学学报
9.信息检索方法:
P26
1)追溯法(向前追溯法是利用文献后所附的参考文献进行追溯查找相关文献的方法。
用这种方法检索到的文献针对性较强,在缺乏检索工具或检索工具不齐全的情况下,可以通过该方法检索到一些相关文献;和向后两种追溯法,向后追溯法又称为引文索引)
2)工具法(就是利用目录、索引、文摘等检索工具或计算机化的检索系统查找信息的方法,又称为常用法,分为顺查法、倒查法、抽查方式以及综合法)
10.信息检索的途径:
P27
(1)内容途径分为分类途径和主体途经
1)分类途径主要是以分类号或类目名称作为检索点,利用学科分类表、分类目录、分类索引等学科体系编排的检索工具(系统)来查找相关领域的文献信息。
2)主体途经是通过能表达文献信息内容的主题词来检索文献信息的一种途径(包括:
标题词索引、关键词索引、单元词索引、叙词索引)
(2)著者途径
(3)号码途径
(4)题名途径
11.信息检索的步骤:
提高检索效果的方法:
(1)提高检索系统的质量
(2)提高用户使用检索系统的能力,充分发挥检索系统的功能
第3章网络信息资源检索
1.搜索引擎的概念:
是指根据一定的检索策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统
2.搜索引擎的原理,可以看做三步:
从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
3.搜索引擎的类型:
(1)目录式:
具有搜索功能,严格意义上不是真正的搜索引擎,是靠分类目录检索,用户通过逐级层层点击浏览类目,寻找自己所需的信息
如:
Yahoo!
、OpenDirectory、Infoseek、Excite等
(2)全文:
是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
(如:
国内:
XX、有道、天网、悠游、OpenFind、搜狗、爱问、中搜等;国外:
AltaVista、FAST、Lycos、NorthernLight、Google、Bing等)
(3)元:
它是通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制(如:
中文元搜索引擎:
万纬搜索、北斗搜索、马虎聚搜、搜魅网someta;外文元搜索引擎:
Ask、Chubba、Cyber411、Infind、OneSeek、SavvySearch、SurfWax、InfoSpace、Dogpile、Vivisimo)
(4)综合类
(5)专业类
各个搜索引擎的对比:
4.文件检索的高级语法:
(1)Site:
在某一类站点中查找信息,表示搜索结果局限于某个网站或者网站频道(site:
站点域名)
如在天空网下载有关msn软件
检索提问式:
msnsite:
(2)Filetype:
在某一类文件中查找信息
(如假如你是一家企业的企划部负责人,老总突然要求你写一个本企业的网络营销策划方案,而你有没有这方面的资料怎么办?
检索提问式:
“网络营销策划方案+filetype:
doc或者filetype:
ppt)
(3)Inurl:
搜索的关键词包含在URL链接中
例如:
inurl:
毛人凤戴笠
(4)Intitle:
搜索的关键词包含在标题中
举例:
搜索关于obama的speech
检索提问式:
“intitle:
obamaspeech”
5.重要的搜索引擎简介及其使用技巧
(1)GoogleP40
1)加号(+)操作符:
Google会自动忽略“的”,“吧”,“呢”此类常用字词和字符
还会忽略其他一些降低搜索速度却不能改善搜索结果的数字和字母,可用“+”
操作符使其不会忽略该字词。
如“我的大学”,检索式:
我+大学
2)相似网页搜索:
要搜索与指定网站有相似内容的网页。
(related:
网址)
如:
related:
3)填空搜索:
在Google搜索框中键入句子的一部分,然后加入(*)即可
如:
李白是*人
4)同义词搜索(~):
如“~商标”
5)字典定义:
要查看某个字词或词组的定义,在此字词或词组前加上“define”
如:
define:
奥运会
(2)XX使用技巧P40
1)intitle:
网页标题中搜索。
如查找巩俐的写真检索式:
写真intitle:
巩俐
2)site:
在特定站点中搜索。
如在天空网下载有关msn软件
检索提问式:
msnsite:
3)inurl:
把搜索范围限定在url连接中。
(inurl:
需要在url中出现的关键词)←inurl后不要有空格
如查找关于photoshop的使用技巧检索式提问:
photoshopinurl:
jiqiao
4)“”精确匹配检索
5)“-”去除无关资料:
如搜寻关于“武侠小说”但不含“金庸”的资料
检索式:
武侠小说—金庸
6)二次检索:
在搜索结果页下方的搜索框中,重新输入一个查询词,然后单击“在结果中找”进行二次检索。
(3)YAHOO使用技巧
1)翻译网页
2)title:
页面标题搜索如搜索所有网页标题中包含“张学友”的网页
检索式:
title:
张学友
3)link:
查找所有链接到某个网址的网页
如搜索“姚明link:
http:
//国内期刊数据库检索(此部分内容比较琐碎和繁多,请按ppt去复习)
1.中国知识基础设施工程
2.重庆维普中文科技期刊
3.EiCompendexWeb的特点,基本及高级设置
4.ElsevierScienceDirect全文数据库的检索方式
5.EBSCO数据库系统中的ASP
第5章国外期刊数据库检索
1.ISI系列数据库的检索功能包括P87:
向后回溯检索功能、向前追溯检索功能、相关记录功能、ISILinks功能
向后回溯检索功能:
可以查询论文被引用次数,它提供论文与引用文献的链接,这样就可以由被引文献为检索点,查找全部来源文献。
该功能为用户提供了某研究成果出现之后最有价值的全部资料,一直可以检索到当前最新的引用文献,及时反映了学术动态信息。
向前追溯检索功能:
可通过主题词、作者、地名、刊名等途径检索相关领域的最新文献,单击其中的CitedReference链接,可以获得早期的被引用的文献
相关记录功能:
提供共引文数据,即可以列出与当前检索的记录共同引用同一篇或多篇文献的其他论文信息,这样便可以于用户进行扩展检索
ISILinks功能:
可在检索过程中将用户指引到ISI的其他数据库(如会议信息服务系列数据库等)以及与ISI友情链接的其他数据库生产商的数据库(如Derwent公司的DII专利数据库等)的网页中,继续查找相关文献信息,从而大大提高检索的效率。
2.INSPEC的相关知识点请复习课本P88以及课件的PPT
第6章专利基本知识与专利信息检索
1.专利的类型:
发明专利、实用新型专利、外观设计专利
2.时间性P101:
发明专利权的期限为20年,实用新型专利和外观设计专利的期限为
10年,均自申请日起计算
3.美国专利数据库P118
(1)美国专利数据库网址为:
http:
//patft.uspto.gov
(2)数据库包括:
授权专利数据库和申请专利数据库
(3)检索方法:
快速检索、高级检索、专利号检索
(4)美国专利说明书的全文有两种形式:
文本形式和图像形式
4.欧洲专利数据库P126
(1)欧洲专利数据库的网址为:
(2)数据库包括:
欧洲专利数据库、世界知识产权组织专利数据库、世界范围专利数据库
(3)检索方法:
快速检索、专利号检索、高级检索、分类检索
(4)获取全文:
专利说明书是以PDF格式存储
第7章特种文献网络信息检索
1.学位论文概述P136
(1)学位论文定义:
是高等院校或研究单位的毕业生在获取相应专业学位时提交的学术性研究论文
(2)类型:
理论研究型、调研综述性
(3)特点:
出版形式特殊、内容具有独创性、数量大
2.美国PQDD学位论文全文数据库
提供了:
基本检索、高级检索、论文分类浏览、二次检索、全文下载等功能
3.标准文献的概念
标准文献是按照规定程序编制并经过一个公认的权威机构批准的,供在一定范围内广泛而多次使用,包括一整套在特定活动领域必须执行的规格、定额、规划、要求的技术文件。
标准文献是一种重要的科技出版物
4.类型:
5.标准号
6.标准文献分类法
7.美国的四大科技报告
8.国家科技图书文献中心P177
(1)主要服务项目
1)目次浏览
2)目录查询
A.检索途径:
提供题名、责任者、主题词、ISSN号、ISBN号、出版者、订购号等多种检索途径,也可以用多个检索词进行布尔逻辑组配检索或者利用出版年号、分类号、会议届次、收藏单位等进一步限定检索范围
B.检索方法:
1.在所列字段名称后直接输入检索词进行检索
2.用布尔逻辑表达式组配检索
3.用其它选项中的条件限定范围检索
C.检索结果:
简明书目、详细书目以及期刊登到信息
3)全文文献包括:
全国开通数据库、全国开通回溯数据库、使用数据库、部分单位开通文献、免费获取期刊、NSTL研究报告六部分
4)热点门户
5)网络导航
6)预印本服务
(1)文献检索分为:
普通检索、高级检索、期刊检索、分类检索
普通检索的检索步骤:
a.数据库的选择
b.根据需要设置查询条件,包括查询范围、时间范围、查询
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检索 相关 复习
![提示](https://static.bdocx.com/images/bang_tan.gif)