《信息检索与利用》考点总结材料.docx
- 文档编号:5963210
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:15
- 大小:104.93KB
《信息检索与利用》考点总结材料.docx
《《信息检索与利用》考点总结材料.docx》由会员分享,可在线阅读,更多相关《《信息检索与利用》考点总结材料.docx(15页珍藏版)》请在冰豆网上搜索。
《信息检索与利用》考点总结材料
注:
考试时,务必带上2B铅笔、橡皮擦,签字笔。
考试题型:
填空、简答、单项选择、多项选择、判断
第一章 绪论
1、信息素养的概念、具体内容(内涵)
答:
概念:
具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。
具体内容(内涵):
信息意识:
敏感度
信息知识:
信息根本知识,检索技术等
信息能力:
选择能力、收集能力、判断能力、处理能力、利用能力
信息道德:
抵制不良信息、过滤粗糙信息、选择有利信息
2、搜商的概念
答:
第一:
搜商仅指人们运用搜索引擎的智力。
这是狭义的“搜商〞概念。
第二:
搜商是指运用物质性工具进展搜索的智力。
这是一种广义搜商的概念。
第三,搜商应指人们所有搜索行为的智力。
这是最广义的“搜商〞概念,我们不妨叫它“泛搜商〞。
3、信息检索的意义
答:
1〕信息检索是大学生必备的根本素质
2〕信息检索是科学研究的重要前提
3〕信息检索是培养创新型人才的重要根底
4〕信息检索是个人终身学习的根本保障
4、信息、知识、情报和文献的定义、关系;信息的根本特征;情报的属性;构成文献的根本要素。
答:
定义:
信息:
信息是自然界、人类社会和人类思维活动中一切事物的存在方式和运动状态的本质属性和客观反映。
知识:
知识是人们在改造客观世界的实践中所获得的认识和经验的总和。
情报:
人们为解决某一个特定的问题而搜索、传递且有特定效用的知识或信息。
文献:
记录有知识的一切载体。
关系:
1)包含关系:
知识包含于信息中,信息包含了情报,文献也包含于信息内。
2)转化关系:
文献是记录有信息或知识的载体,当文献中记录的信息或知识传递给用户,并为用户所利用时,就转化为情报。
例:
图书馆馆藏图书。
3)交叉关系:
情报虽大多来自文献,但也可能来自口头和实物,所以情报与文献存在交叉关系。
信息的根本特征:
客观性,时效性,价值型,传递性,共享性,开发性。
情报的属性〔3种〕:
知识性〔信息性〕、传递性和效用性〔被用户所利用〕。
构成文献的根本要素〔4个〕:
1〕知识内容:
信息或知识
2〕记录符号:
表达符号
3〕物质载体:
材料
4〕记录手段:
即将知识、信息固化到载体上的手段
5、一些文献类型的特征〔ISBN,ISSN,,GB2763-87,GB/T,ISO,IEC〕
答:
ISBN:
国际标准书号〔唯一性〕。
有ISBN号的一定是图书。
ISBN号组成中不包括作者代号。
ISSN:
国际标准刊号。
:
国内统一刊号
GB2763-87:
国家标准
GB/T:
推荐性国家标准
ISO:
除电子电工外的国际标准
IEC:
电子电工领域国际标准
6、文献的几种划分类型,按文献的载体形式划分〔手写型文献、印刷型文献、缩微型文献、声像型文献、机读型文献〕;按文献的加工深度划分〔零次文献、一次文献、二次文献、三次文献〕;按文献的出版形式划分11种、其中特种文献8种P15-26
答:
1〕手写型
印刷型
缩微型
声像型
机读型
2〕零次文献:
指未经或未进入社会交流的最原始的文献。
如私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。
一次文献:
是指以作者本人的生产实践、教学实践与科学研究成果为根本素材撰写并公开发表的文献。
主要包括期刊论文、科技报告、会议论文、专利说明书、技术标准以与局部学位论文等,通常也称之为原始文献、原文。
二次文献:
是对一次/三次文献进展整理、加工的产品。
即把大量的、分散的、无序的一次或三次文献按一定的方法进展加工、提炼、整理、简化,组织成为系统的便于查找的文献系统。
三次文献:
是指围绕某一领域、某一学科或某一专题,利用二次文献检索搜集的大量一次文献,对其内容进展分析、综合、提炼、重组、概括而成的文献,如各种述评、综述或进展性出版物,以与百科全书、字〔辞〕典等参考工具书
3〕特种文献包括〔8种〕:
科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案。
常见类型〔3种〕:
图书,期刊,报纸。
7、图书、期刊的类型与特点。
P18、P19
答:
图书类型:
按其用途可分为三种类型:
1〕阅读用书:
教科书、专著、文集等。
2〕参考工具书:
字典、词典、百科全书等。
3〕检索用书:
以图书形式刊行的书目、题录、文摘等。
图书特点:
优点:
图书的内容全面系统,根底理论性强,论点成熟可靠。
缺点:
图书的撰写、编辑、出版所需要的时间较长,传递信息速度慢,不能与时反映最新科技动态。
科研人员一般不把它列为首选的使用对象。
期刊类型:
期刊按其性质和用途不同,分为:
1〕学术性与技术性期刊
2〕检索性期刊:
如《社会科学文摘》
3〕其他期刊:
包括快报性刊物、资料性刊物、科普性刊物等。
按出版形式,分为:
1〕正式期刊:
由国家新闻出版署严格审批,既有国际标准刊号ISSN,也有国内统一刊号
2〕非正式期刊:
一般只限行业内部交流,不公开发行,其出版必须经过行政部门审核,并领取“内部报刊准印证〞。
期刊特点:
期刊反映的多是最新的科技成果,内容新颖,信息量大,品种多,通报速度快、出版周期短等特点。
是科研人员的首选信息源。
按期连续出版,便于研究者长期跟踪研究。
8、图书、期刊、报纸等8种文献在数据库中的字段与参考文献著录格式(各种类型文献的二次文献项目〔即指具体每种类型在数据库中的字段〕、有代表性的〔ISBN、ISSN和、ISO、GB等〕等 。
P15-P25
答:
图书形式特征〔即二次文献的项目〕
期刊的形式特征,即参考文献著录格式:
著者.题(篇)名[J].刊名,年,卷号(期号):
引文所在的起始或起止页码。
报纸参考文献著录格式:
责任者.题名[文献类型标志/文献载体标志].报纸名,出版日期〔版次〕
示列:
傅刚,赵承,李佳路.大风沙过后的思考[N].青年报,2000-04-12〔14〕.
科技报告著录的项目:
名称〔项目名称、成果名称〕,完成〔执行〕的单位与人员,起止时间,关键词,项目简介。
科技报告的著录内容依次是:
报告者.报告题名[R].地点:
报告机构,完成年。
学位论文著录格式:
作者,题名,导师,学位授予单位所在的城市,学位授予单位,学位授予时间。
会议论文参考文献格式:
论文作者.论文标题.见〔英文用in〕:
主编.论文集名[C].出版地:
出版者.出版年:
起止页码.
专利文献的著录格式:
专利所有者、题名[P]、专利国别、专利号。
标准文献形式特征:
中文标准名称、发布日期、发布单位、实施日期、英文标准名称等。
标准编号〔标准号〕是由“标准代号+顺序号+发布年号〞组成。
第二章检索根底知识
1、信息检索的含义P29
答:
广义的检索包括信息的存储和检索两个过程。
信息存储是将大量无序的信息集中起来,根据信息源的外部特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的数据库或检索系统,供人们检索和利用。
而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。
2、信息检索类型〔按检索手段划分,按检索对象划分〕P30-31
答:
按检索的手段划分:
1〕手工检索(Manualretrieval)
2〕计算机检索(puter—basedretrieval)
按照检索的对象(或检索结果)划分:
1〕文献检索〔相关性检索。
如兰思仁的期刊论文,莫言的小说,毕业论文、专利、科技报告等〕
2〕事实检索〔确定性检索。
如IBM总部、皖南事变〕
3〕数据检索〔确定性检索。
如08年汽车生产量、2014年GDP总量〕
4〕声频与视频检索〔确定性检索。
如奥巴马就职演说音频等〕
3、信息检索系统、计算机检索系统的构成P32、P34
答:
信息检索系统的构成:
1〕检索文档—-例:
维普的期刊,馆藏书目,我校学位论文等
2〕检索设备—-电脑、服务器、网络等
3〕系统规如此---根本检索、高级检索、检索式检索等
4〕操作人员---用户等
计算机检索系统构成:
硬件设备,软件局部,数据库。
4、数据库结构P35
答:
数据库结构组成:
字段,记录,文档,帮助文件。
5、信息标引P37
答:
标引的概念:
标引是指在文献信息的处理过程中,将文献的内容特征和外部特征分析转换成检索标识的过程,即对信息资源中具有检索价值的特征信息。
6、检索语言的概念,检索语言的类型〔按表达信息的特征划分有哪些类型,按标识的组配方式可分为先组式语言与后组式语言〕P39-P40
答:
检索语言作用:
是标引者和检索者之间沟通的桥梁。
〔常考哦~〕
检索语言的类型:
a)按规X化程度分:
自然语言/非规X化语言;
受控语言/规X化语言/人工语言
b)按标识的组配方法分:
先组式语言〔如分类号,标题词〕;
后组式语言〔如关键词〕
c)按表述信息的特征分:
描述外部特征语言【题名(书名、刊名等),责任者(著者、编者、译者等),(ISBN、报告号、专利号、标准号等〕,引文(参考文献)】
描述内容特征语言【分类语言,主题语言】
检索语言定义:
检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容的概念,能够显示概念之间的相互关系,并便于进展系统排列,便于将标引语言和检索用语进展相符性比拟的人工语言。
7、主题检索语言按照选词方式不同,可分为哪3种。
P40
答:
按选词方式不同分为:
1〕标题词语言〔先组式、规X化的检索语言〕
2〕叙词语言〔后组式、规X化〕
3〕关键词语言〔后组式、不规X〕
8、主题检索语言、分类检索语言的特点p42P44
答:
主题检索语言特点:
直观性强、专指性强、灵活性强。
分类检索语言的特点:
1〕分类语言是以文献信息内容所属的学科性质来划分和集中文献,能够较好的表现学科的系统性,便于人们从某学科或专业的方面来查找文献
2〕分类语言能够较好的反映各个类目间的纵向层次关系
3〕分类语言是图书馆图书组织排架的依据。
9、分类法有哪些?
掌握中图法体系结构、标记符号P43-44
答:
有代表性的分类法:
《中国图书馆分类法》〔中图法〕
《中国科学院图书馆图书分类法》〔科图法〕
《中国人民大学图书馆图书分类法》〔人大法〕
《杜威十进分类法》〔DDC〕
《国际十进分类法》〔UDC〕
《中国标准分类法》〔CCS〕
《国际标准分类法》〔ICS〕
《国际专利分类法》〔IPC〕
中图法的体系结构:
1〕5个大部,22个大类〔一级类目〕
2〕每一大类下〔拼音字母表示〕,层层划分,逐级展开为二级、三级、四级……类目,
3〕同位概念〔并列关系、平行关系〕P42
4〕上位概念、下位概念〔隶属关系、从属关系〕
P42、43
《中图法》的标记符号:
1〕《中图法》的分类号,采用汉语拼音字母与阿拉伯数字相结合的混合制
2〕大类〔一级类目〕由拼音字母表示,二级、三级…等,由数字表示,同位类根本是十进制。
3〕特例:
“工业技术〞大类〔T大类〕,所属的二级类目仍用字母表示,如TH、TP、TS…
4〕分类号中,从左往右,每三位数字,用“·〞隔开,例
S435.111.1 S156.4 S718
S571.1 TS272.52
第三章计算机检索根底知识
1、布尔逻辑算符类型与用法P48
答:
根本的布尔逻辑算符:
逻辑与、逻辑或、逻辑非。
逻辑与:
也叫逻辑乘,常用符号“and〞或“*〞表示。
作用:
增加限制因素,缩小检索X围,提高检索的专指性。
逻辑或:
常用符号“or〞或“+〞表示。
作用:
扩大检索X围,提高查全率。
逻辑非:
常用符号“not〞或“—〞表示。
作用:
缩小检索X围,提高查准率
2、截词检索〔概念、截词方式、作用〕;位置算符〔with、Near的用法——〔w〕、〔Nw〕、〔N〕、〔Nn〕〕;字段限定检索;短语检索算符P49-54
答:
截词检索(Truncation):
是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。
〔多用于外文数据库〕
用于词干一样、词义相近,词形多样的检索词截词符常用 ?
、* 、#、$表示。
截词的类型:
1〕按截词位置分4种:
前截词:
截去某个词的前部,是词的后方一致比拟,也称后方一致检索〔左截词〕。
例如:
*magnetic
后截词:
截去某个词的尾部,是词的前方一致比拟,也称前方一致检索〔右截词〕。
例如:
put*
中间截词:
截去某个词的中间局部,使词的两边一致,也称两边一致检索。
例如:
输入organi?
ation可以检出organization、organisation
前后截词:
指同时在词干的前后两局部进展截词的方式。
例如:
*chemi*
2〕按截词数量分2种:
有限截词:
一般用“?
〞表示,表示代替0或1个字或字符,例如:
work?
、work?
?
、work?
?
?
、20?
?
无限截词:
一般用“*〞表示,表示替代任意多个字符,即替代0~n个字符,例如:
work*
截词检索的作用:
A、截词符具有“or〞运算符功能,
B、能够扩大检索X围,提高查全率
C、减少了输入检索词的时间,节约了机时
D、精简检索式
位置检索算符:
1.〔W〕与(nW)算符:
a)(w)是with缩写,简写〔〕,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其它的词或字母,但允许有一空格或标点符号。
如:
CD(w)ROM相当于CDROM或CD-ROM
b)(nW)是nwords的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。
如:
Wear(1W)material相当于Wearmaterial、wearofmaterial
2.〔N〕,〔nN〕算符:
a)〔N〕是near的缩写,表示此算符两侧的检索词必须相邻,词序不限,词间不允许插入其它词或字母,但允许有一空格或标点符号。
如:
CD(N)ROM相当于CDROM或CD-ROM或ROMCD或ROM-CD
b)②(nN)表示两词间可插入最多n个词,词序不限。
如:
railway(2N)bridge可表示Railwaybridge、bridgeofrailway、bridgeoftherailway
字段限定算符是把检索词限定在记录中出现的某个或某些字段中。
字段有两种:
1〕根本字段:
能够揭示文献的主要内容特征。
如:
字段代码:
题名〔TI〕、摘要〔AB〕、主题词〔DE〕,分类号等。
2〕辅助字段:
表示文献的外部特征。
如:
著者〔AU〕、出版年〔PY〕、刊名〔JN〕、语种〔LA〕、文献类型〔DT〕、机构〔CS〕等。
字段检索:
对于在“根本索引字段〔TI、AB、DE、ID〕〞中的查找,用后缀方式常用符号有“/〞或“in〞;对于在“辅助索引字段〔AU、BN、SN、CC等〕〞中的查找,用前缀方式常用符号有“=〞“>=〞“<=〞“>〞“<〞等。
短语检索算符:
用双引号表示,主用于提高检索精度和准确度。
3、信息检索途径的定义,常用信息检索途径(主题、分类、著者、题名、等),重点掌握主题途径、分类途径的用法、优缺点、查全、查准效果比拟P60
答:
信息检索途径-检索入口〔字段〕:
1〕分类途径-分类号字段
2〕主题途径-题名、关键词、题名或关键词、摘要、主题、任意字段
3〕题名途径-题名〔标题、篇名〕、书名、刊名
4〕著者途径-作者、导师、专利权人、发明人
5〕途径-专利号、标准号、ISBN、ISSN
6〕其他途径-分子式、环系结构、属种名称、机构
分类途径的优缺点:
优点:
按学科、专业集中相关文献信息,具有族性检索的功能〔能够把同一学科的文献信息集中在一起检索出来〕,查全率较高。
以学科分类为根底,符合人们认识事物的习惯,一旦熟悉分类体系很容易被人承受和使用。
缺点:
不适用于特性检索〔复杂冗长的专题信息检索〕,查准率比主题词低。
对全面检索边缘、交叉学科资料造成较大的困难;分类表一般几年才修订一次,难以反映新学科和新名词术语。
主题途径的优缺点:
优点:
直观性、专指性、灵活性,适合特性检索,查准率高。
用词或词组作检索标识,表达概念灵活、准确、专指性强,能把同一主题内容的文献集中在一起同时检索出来。
如:
“C语言-程序设计〞比用分类号TP312表达更准确。
缺点:
不适合族性检索〔检索到的信息同属一类学科或者专业〕,查全率比分类号低。
由于很规X,非专业人士难以掌握。
如:
检索“大学教材〞应选择“高校〞为主题词。
4、计算机检索的主要步骤〔信息检索流程〕,主题概念的选词方法,同义词的扩展〔如:
学名或俗名,上位词和下位词,简称与全称,术语与代码等〕P60
答:
信息检索步骤;⑴分析检索需求,明确检索目标、内容和X围。
⑵选择检索字段⑶选择检索数据库和检索书刊⑷选择检索途径⑸选择检索词⑹构建检索式⑺实施检索并调整检索式⑻输出检索结果与获得原始信息。
5、检索表达式的构建P66〔参照课题分析P303〕
答:
检索表达式:
又称检索式,是指将选择出的检索词,用布尔逻辑算符、截词算符、字段代码与位置算符等,按课题的需要,合理组配,形成表达具体信息需求的逻辑表达式。
表达式构建的须知事项:
主题词的选取
1、课题名称 ≠ 主题词
2、检索词与字段的配合
3、相关概念〔隐性概念〕的分析
4、无关概念的排除〔如研究、方法、技术、作用、现状、近况、展望、开展趋势、应用、利用、建立、实施、影响、效率、结构等这些词都不要〕
第四章搜索引擎〔P54〕
1、搜索引擎关键词语法规如此〔布尔逻辑算符、截词算符、字段限定检索、邻近符等〕
答:
布尔逻辑算符:
(1)逻辑“与〞
逻辑“与〞一般用空格、“AND〞表示,有的搜索引擎还可以用“&〞表示。
使用逻辑“与〞是为了要求检索结果的Web页面中同时出现所有输入的检索词,提高查准率。
(2)逻辑“或〞
逻辑“或〞一般用“OR〞表示,有的搜索引擎还可以用“|〞、“,〞表示。
使用逻辑“或〞是为了允许检索结果的Web页面中出现输入检索词的任何一个,提高查全率。
(3)逻辑“非〞
逻辑“非〞一般用“NOT〞表示,有的搜索引擎还可用“!
〞“-〞表示。
使用逻辑“非〞是为了要求检索结果的Web页面中出现NOT前的检索词,但排除含有NOT后的检索词的页面信息,以缩小检索X围。
字段限定:
①intitle:
在标题中搜索,表示限定词后接的词必须出现在网页的标题内
②site:
将搜索X围限定在某类站点或某个内。
③filetype:
找特定类型的文件。
文件的类型:
word、excel、pdf、powerpoint、压缩文件、文本文件等
2、常用搜索引擎选介、如XX、谷歌检索规如此与技巧
3、谷歌的图书、学术搜索与XX的学术搜索、XX文库等。
第五章专利与专利文献
1、专利概念
答:
专利的根本概念:
专利法保护的发明创造;是指载有发明创造详细内容的专利说明书;是指专利权。
2、专利根本特性〔独占性、时间性、地域性〕
答:
专有性、时限性和地域性。
4、专利类型
答:
专利类型:
发明专利、实用新型专利、外观设计专利
5、我国授予专利权的根本条件〔新颖性、创造性、实用性〕
答:
专利三性:
新颖性、创造性、实用性
6、专利号〔申请号〕组成
答:
申请号:
2003年10月起中国专利申请号扩编,9位变13位。
专利申请号:
外观设计专利。
例201430011757、97305103
7、可供检索专利的数据库或
答:
检索专利的数据库:
万方数据库、清华同方〔KI〕、超星读秀学术搜索、中国知识产权局、Fulink平台
第六章检索通用规如此〔P77〕、毕业论文与学术论文集P341
1、检索平台通用规如此〔掌握一个检索平台〔或数据库〕,可从哪几个方面入手〕P80
答:
1〕了解数据库概况,重点掌握各数据库收录文献情况
2〕了解数据库平台的资源组织方式,提供的检索方式〔如快速检索、高级检索、分类检索、专业检索等〕
3〕掌握检索系统的具体运算符号〔布尔逻辑符号、截词算符、位置算符、字段限定符等〕
4〕掌握检索结果的输出
5〕了解个性化服务功能
2、三大中文数据库平台运算符配备情况P83
答:
3、运算符在维普数据库平台不同检索方式中表现形式P83
答:
4、学位论文的结构:
P347
答:
前置局部〔包括封面,摘要,关键词,目录〕
主体局部〔包括引言,正文,结论,致谢,参考文献〕
附录局部〔必要时〕
结尾局部〔必要时〕
5、学术规X〔定义、内容〕P350
答:
看书
6、学术不端论文检索系统〔AMLC〕P356
答:
看书
第七章检索效率P295
1、检索效率
答:
2、检索效率评价指标〔查全率、查准率〕
答:
查全率〔Recallratio,R〕:
又称检全率、召回率,是指检出的相关信息数量与检索系统中全部相关信息总量的比率。
查准率〔Precisionratio,P〕:
也称检准率、准确率,是指检出的相关信息数量与检出的全部信息总量的比率。
3、查全率、查准率的计算公式
答:
4、影响信息检索效率的因素
答:
1〕检索词的选取存在问题
2〕检索限制过于严格或宽松
3〕检索关系的组配不准确
4〕检索词与字段检索配合不当
5〕截词使用不当
6〕未能充分掌握数据库的检索特点
5、提高信息检索效果的主要措施
答:
1〕提高查全率的方法
2〕提高查准率的方法
3〕同时兼顾查全率和查准率的措施
实习:
数据库:
维普数据库中国知网系列数据库(ki)、万方数据、fulink平台,馆藏书目数据库,数字图书馆〔超星汇雅电子书、方正电子书等、〕,超星读秀学术搜索,Webofscience,ScienceDierct数据库、Springerlink全文数据库,搜索引擎使用技巧,google学术搜索、文献管理软件〔国外ENDNOTE,国产NoteExpress等〕。
掌握以上数据库可检索的文献类型、可检索字段与检索方法、,具体数据库的检索策略〔查全与查准〕的调整。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索与利用 信息 检索 利用 考点 总结 材料