信息检索知识点.docx
- 文档编号:22814443
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:11
- 大小:21.63KB
信息检索知识点.docx
《信息检索知识点.docx》由会员分享,可在线阅读,更多相关《信息检索知识点.docx(11页珍藏版)》请在冰豆网上搜索。
信息检索知识点
计算机检索
1.信息素养(信息素质、信息能力):
作为具有IL(informationliteracy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索
广义:
指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程。
狭义:
从信息集合中找出所需信息的过程。
信息查找(InformationSearch,InformationSeeking)
2.1信息现状分析
1)信息爆炸
导致文献量急剧增加,容相互渗透,语种增多;
文献分布异常分散;
文献寿命愈来愈段;
2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用
1)促进智力资源的开发;
2)协助管理者做出正确的决策;
3)帮助科研人员借鉴前人的研究成果,避免重复劳动;
4)信息检索是知识更新的手段。
4.数据库类型
(1):
作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:
馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:
数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:
开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型
(2)
从收录文献的容分,有综合性数据库和专业性数据库之分;
从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;
从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;
各数据库举例:
专业数据库:
PetroleumAbstract(PA)、EnCSciFinderSchoiar(CA)
综合性数据库:
读秀、Scopus、EI、SCI
特定文献类型,如图书、期刊、学位论文等:
超星、EIsevierScienceDirect、PQDT
全文数据库:
CNKI、维普、SPE
摘要性数据库:
EI、PA
引文数据库:
WebofScience、CSSCI(中文社会科学引文索引)
6.ScienceCitationIndexExpanded(SCI-E)是个什么样的数据库?
它是ISI检索平台中WebofScience核心合集中的一个子库
它是一个摘要型数据库
它是一个引文数据库
它是一个期刊数据库
它收录的学科围包括科学、技术的各学科
7.查文献应该如何选择数据库?
学科专业:
有专业型数据库时,首选专业型数据库;
数据量:
选择数据量大的;
文献类型:
根据研究的需要。
如果仅需要某种文献,最好选择该类型的子库;
检索功能:
准确性高、易用、检索结果的处理能力;
分析功能
第三章信息资源的分类
8.信息存贮载体:
印刷型、缩微型、声像型、机读型
9.根据加工程度划分
零次文献:
口头信息、未公开发表的文字资料(手稿、书信、笔记等);时效性强;大量而无序;
一次文献:
期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献;
二次文献:
检索工具:
如SCI、EI、CA、PubMed/Medline
三次文献:
选用大量有关的文章,经过综合、分析、研究而编写出来的文献;如:
综述、评论、评述、进展、动态等;研究人员最终需要的文献。
科研人员与科学信息的获取和利用:
研究人员的文献平台可以由二次文献作为入口,满足整体的需求;然后,通过这个入口来获取有用的高质量的全文期刊(一、三次文献)来满足纵深对的研究需要。
10.根据文献编辑出版的特征和围划分
(1)
1)科技图书Books(Monograph,Anthology,Textbook,Referencebook):
容系统成熟可靠,新颖性较差;学习,教育之用。
2)科技期刊Periodical(Journal,magazine,serial):
数量大,覆盖面广,容新颖,及时;交流,影响广泛,信息价值高。
3)报纸(Newspaper):
出版周期更短;获取实事性、政策性信息。
4)政府出版物(GovernmentPublications):
源自官方、权威、可靠、价廉;可获取政策性、法规性及科技信息。
5)科技报告(Sci/TechReport):
反映前沿科技、容新颖、有密级控制。
如:
美国政府四大科技报告:
PB,AD,NASA,DOE报告。
6)专利文献(PatentDocument,Patentspecification/bulletin/aids):
类型有:
专利说明书、专利公报、专利分类表、专利文摘等检索工具。
反映新的技术发明,是重要的技术、经济信息源。
7)会议文献(Conferencepaper,Proceedings):
会议论文集,回忆录,会议资料等;反映最新成果,最新动向,高水平,前沿发展动态。
8)学位论文(Dissertations\Thesis);容专深,非卖品,有较高学术参考价值。
9)标准文献(Standards):
反映成熟技术,掌握技术政策,技术水平,可供研究新产品,改造老产品,改进工艺和操作水平是借鉴。
10)产品资料:
形象、直观、新颖、可了解工业水平、产品发展、市场动态等。
11)广告(Advertisement):
可及时把握竞争对手最新推出的产品品种,市场卖点。
准确掌握个地区市场的广告竞争态势。
12)技术档案和图纸:
技术性,适用性,性。
11.检索语言:
根据检索需求而编制的检索系统存储与检索共同使用的人工约定语言。
分类:
体系分类语言、标题词语言、关键词语言、叙词语言。
12.检索途径:
又称检索点,指利用信息的各种外特征,作为检索出发点,从不同角度来检索信息。
有:
分类(Classified):
所属学科分类
主题(Subject):
所属主题容、关键词
著者(Author):
团体著者(CorporateAuthor)
名称,题目(Title)
代码(Code)
13.基本运算符
(1)
逻辑算符“与”:
and或*
例:
telecommut?
andproductiv?
逻辑算符“或”:
or或+
例:
computerormicrocomputer
逻辑算符“非”:
not或—
例:
aspartamenotbeverage
14.基本运算符
(2):
截词符
用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词(如有同一词根派生出的名词、动名词、动词、形容词、副词等),或名词的单、复数形式,或痛一次的英美不同拼写形式等词的一次输入。
PQD平台的截词符用?
、*和$表示。
截词符?
Nurse?
—nursed/nursesad?
?
?
—added/adult/adopt用于替换某个字词中间或结尾的任何一个字符,不能代表没有字符。
截词符*control*—control/controlled/controlling代替0-10个字符
截词符$$5beat—Upbeat/offbeat/heartbeat限定截词符用$n表示,代替0-n个字符。
15.基本运算符(3):
位置算符(P/n、N/n)
用于限定词与词之间的位置关系,以提高查准率。
当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号隔开时,均应使用位置算符。
P/0两个单词中间有一个空格或一个字符,在文献中出现的前后位置不能互换。
PolarP/0embedded可检索到:
polar-embedded或polarembedded
P/1两个单词中间可能有0-1个单词,在文献中出现的前后位置不能互换。
位置算符P/n与位置算符N/n的用法近似,区别在于前后单词是可以互换的。
16.PQD检索词自动匹配
在PQD中检索时,系统会自动匹配单词的单复数,英美拼写变体,形容词比较级最高级等形式。
17.短语检索:
“”(双引号检索短语)
在PQD中可把短语放在引号进行精确短语检索,但这种检索方式不能自动匹配。
在PQD中,空格默认为逻辑算符and。
18.字段检索
格式:
字段名(检索词或检索式)
AU(smith)andTI(food):
检索标题含有food,作者含有smith的文章。
多个字段检索时,字段与字段之间用逗号隔开
AB,TI(food):
检索标题含有food或者摘要含有food的文档。
PQD中,检索式常用限制字段为TI,AB,SU,IF。
PQD中的主题词(SU)字段是系统标引的独立字段。
19.检索策略:
指为实现检索目标而制定的检索计划和方案。
检索式是检索策略的具体体现,是指计算机检索中用来表达用户检索提问的逻辑表达式,通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成。
20.检索的基本步骤
1)分析检索课题,明确检索要求,确定检索的主题容、围等
2)确定检索概念
3)选择表达概念的检索词
选择所有不同的能够表达检索概念的词
使用截词检索各种词尾变化的词
使用位置算符指定词组或词间的相对位置关系
4)使用逻辑算符组配检索概念,拟定检索表达式
5)选择恰当的数据库
6)上机检索
21.获取全文的方法
全文按钮、全文数据库、馆际互借、图书馆文献传递、免费全文、提供免费全文的期刊,作者E-mail联系或作者主页。
22.检索策略的优化方法
(1)
扩大命中文献量的方法
1)选择其他同义词、相关词、上位词
2)去掉一个不太重要的检索信息
3)将限制严谨的位置算符改为较宽松的位置算符,或通过and算符代替位置算符
4)取消某些限制过严的后缀符、限制符等
5)增加检索途径,将主题途径与非主题途径结合起来使用
6)利用截词技术,检索所有相同词干的词
7)用E指令扩词以核实拼写
8)选择其他数据库进行检索
23.检索策略的优化方法
(2)
缩小命中文献量的方法
1)提高检索式的专指度,增加或换用下位词和专指度较强的词
2)增加一个检索概念
3)将检索式中的and算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符
4)使用后缀限制,将检索词限制在基本索引的“重要”字段中,如规词字段或题目字段
5)用辅助索引的某些字段与主题索引组结合限制检索围
6)截词使用不当
24.三大检索系统概况
SCI(ScienceCitationIndex)
SCI-E(ScienceCitationIndexExpanded)科学引文索引
SSCI(SocialScienceCitationIndex)社会科学引文索引
A&HCI(Arts&HumanitiesCitationIndex)艺术与人文引文索引
CPCI(ConferenceProceedingsCitationIndex)
CPCI-S(ConferenceProceedingsCitationIndex-Science)科学会议
CPCI-SSH(ConferenceProceedingsCitationIndex-SocialScienceCitationIndex)社会科学与人文艺术会议
EI(TheEngineeringIndex)工程索引
25.三大检索系统收录质量区别
SCI最能反映基础学科研究水平和论文质量
检索系统收录的科技期刊比较全面
集中各学科高质量优秀论文的精粹
成为世界科技密切注视的中心和焦点
CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相对要宽松
CPCI是一种综合性的科技会议文献检索刊物,该检索工具收录包括自然科学、技术科学以及历史与哲学等,覆盖的学科围广,收录会议文献齐全,而且检索途径多,出版速度快。
易成为了检索全世界正式出版的会议文献的主要的和权威的工具。
26.临近算符
NEAR/x:
NEAR代表所的两个词之间的词语数量小于等于N,默认的使用Near的缺省值是15。
SAME:
要求两个检索词是在一个检索字段中。
YaleSAMEhosp
27.利用WOS强大的分析功能
WebofScience数据库中可以对检索结果按照以下方式进行研究:
按照作者分析:
了解某个研究的核心研究人员是谁;
按照国际和地区分析:
了解核心研究国是哪里;
按照文件类型分析:
了解该研究通常以什么途径发表;
按照机构名称分析:
了解有哪些机构在从事这项研究;
按照语种分析:
了解该研究是以什么语种发表的;
按照出版年分析:
了解该研究的发展趋势;
按照期刊标题分析:
了解该研究通常发表在哪些期刊上;
按照学科分类分析:
了解该研究设计了哪些研究领域。
28.检索方式选择
EICompendexWeb的主要检索方式有三种:
快速检索(QuickSearch——系统默认界面)
专家检索(ExpertSearch)
词表检索(ThesaurusSearch)
此外,还有浏览检索(BrowseIndexes)等其它辅助检索工具。
29.检索表达式的构造
逻辑运算符(AND,OR,NOT):
逻辑运算符的运算优先级别相同,自左向右。
字段限制符(wn字段码):
windowwnTIANDsapphirewnTI
短语检索(“检索短语”或者{检索短语})
截词运算符
词根检索($):
$management可查manage,managed,manager,
Managers,managing等。
30.浏览索引
浏览索引可帮助用户选择合适的检索词;
在快速检索和专家检索中都提供浏览索引功能;
在快速检索中有作者、作者单位、刊名、和Ei受控次的浏览索引;
在专家检索中还增加了论文类型、文献类型和语言的浏览索引。
由于EiCompendex以不同的格式引用作者的,所以特别建议用户在检索时使用作者浏览索引。
31.结果浏览
可以在结果浏览中浏览命中记录的文摘信息(Abstract—系统默认格式)和详细信息(DetailedRecord)
可以改变记录的排列顺序
可以获取记录的全文和图书馆馆藏
可以进行组合检索
可以回顾检索历史、保存检索策略、保存检索结果、通过E-mail发送最新文献的点子通告等
32.小结
EiConpendex使用的平台是EngineeringVillage,uong检索收录或文献时,注意选库。
Ei用于检索工程领域的二次文献。
检索方法有快速检索、专家检索和词表检索,建议初学者采用快速检索的方法。
注意采用该数据库特有的浏览器索引功能,可使检索结果更准、更全。
33.专利类型
发明专利:
是指对产品、方法或其改进所提出的新的技术方案。
实用新型专利:
是指对产品的形状、构造或其结合多提出的适于使用的新技术方案。
外观设计专利:
是指对产品的形状、团或者其结合以及色彩与形状、图案的结合所做出的富有美感并适于工业应用的新设计。
34.专利的特点
专有性:
是指专利权人对其发明创造所享有的独占的制造、使用、销售和进口的权利。
地域性:
一个人/国家依照其本国专利法授予的专利,在该国法律管辖的围有效,对其他国家没有任何约束力,外国对其专利权不承担保护义务。
时效性:
对于专利的保护期限,各国的规定不尽相同。
我国专利法规定:
发明专利、实用新型专利以及外观设计专利的保护期限自申请日起分别为20年、10年、10年。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 知识点