档案文献检索系统.docx
- 文档编号:5551106
- 上传时间:2022-12-19
- 格式:DOCX
- 页数:18
- 大小:33.92KB
档案文献检索系统.docx
《档案文献检索系统.docx》由会员分享,可在线阅读,更多相关《档案文献检索系统.docx(18页珍藏版)》请在冰豆网上搜索。
档案文献检索系统
第一章档案文献检索系统概述
1.广义的档案文献检索包括存储和查找两个具体过程。
前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。
2.简答档案文献检索的基本原理:
是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。
匹配的实现是存储和查找互相作用的结果。
3.存储阶段的目的是:
使档案信息达到高度的组织化。
主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。
4.查找阶段的目的:
是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。
(3、4题可合并一题)
5.档案文献检索同其他文献检索一样,可以采取三种形式:
(1)数据检索。
这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。
(2)事实检索。
这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。
(3)文献检索。
这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。
6.试述档案文献检索系统的构成与功能?
从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。
档案文献检索系统包括两大部分:
存储部分和检索部分。
存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。
在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。
在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。
7.档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。
8.文献单元方式:
在计算机检索中又称为顺检方式、顺序文档。
它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。
9.标识单元方式:
在计算机检索中又称为逆检方式、倒排文档。
它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。
10.检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。
检索效率通常采用查全率和查准率两个指标来衡量和表示。
11.查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。
12.查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
13.简答查全率和查准率的关系
查全率和查准率之间存在着互逆关系的结论。
也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。
当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。
14.论述影响检索效率的因素:
(1)检索语言的性能。
检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。
(2)检索途径的数量。
从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。
(3)著录标引的质量。
检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。
(4)检索策略的优劣。
档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。
(5)检索人员的素质。
不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。
15.简档案文献检索系统评价的目的和作用
系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。
主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。
作用主要有三个方面:
(1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。
(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。
(3)为设计和建立新的档案文献检索系统提供参考。
16.试述系统评价的指标体系:
档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。
(1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。
(2)查全率和查准率。
二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。
需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:
①对文献相关性的判断不可避免地带有主观性和模糊性。
②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。
③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。
(3)响应时间。
它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。
(4)可存取性。
是指一个档案文献检索系统的易用程度。
(5)费用。
构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。
17.简系统评价步骤
(1)制订评价方案。
包括确定对该系统进行评价时采用哪些评价指标。
(2)评价对象调查。
可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。
(3)测试。
根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。
(4)数据处理与分析。
对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。
(5)对评价结果进行分析,提出改进意见。
第二章检索语言
1.检索语言:
是根据检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献信息检索系统,表达文献主题概念和检索课题概念。
2.简答检索语言的基本功能
主要有以下四个方面:
①对文献的主题加以标引的功能;
②对内容相同及相关的文献主题加以集中或揭示其相关性的功能;
③对大量文献信息加以系统化或组织化;
④便于将标引用语和检索用语进行相符性比较。
3.产生检索语言第一项基本功能的结构:
(1)编码型标识结构。
(2)组配型标识结构。
(3)层次型结构标识。
4.产生检索语言第二项基本功能的结构:
(1)等级结构
(2)参照系统结构
(3)轮排聚类结构。
5.按构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。
6.简答构成原理
(1)分类检索语言。
其特点是用分类号来表达各种概念,把各种概念按知识分类进行系统组织和排列,有很好的系统性。
(2)主题检索语言。
其特点是用取自自然语言的语词来表达各种概念,把各种概念完全按字顺排列而不管其相互关系如何,其标识有很好的直接性。
(3)代码检索语言。
它一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。
(4)引证关系追溯法。
即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。
7.主题检索语言包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法),它们可统称为主题法系统。
8.简答先组式语言与后组式语言有何区别
先组式语言就是文献标识在编表时就已固定组配好,或绝大部分已固定组配好,如体系分类法和标题词法。
后组式语言就是文献标识到标引和检索时才组配起来,如单元词法和叙词法。
第三章、分类检索语言及<<中国档案分类法>>
单选:
1、一个类在分类表中被称为(类目)。
2、表示类目概念的名称称为(类名)。
3、(分类标准)的选择决定着提供什么检索途径。
4、分类标准使用次序的选择,决定着形成什么样的(分类体系结构)。
5、类目的排列包括纵向排列和横向排列,纵向排列决定着类目之间与(隶属关系)。
横向排烈决定的(同位类目)的排列次序。
6、(归附列类法)即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。
7、(合并列类法)即将若干相近的并列概念合并设立一个类目,或构成一个类目。
8、(交替烈类目)即对可以隶属于两个的学科、专业\职能的事物在各有关类下都设立子目,并视需要选择其中一个作正式类目,在另一处引见正式类目。
9、类目名称限定着类目所表达的事物概念的(内涵)和(外延)。
10、体系分类法是直接体现(知识分类)的概念标识系统。
11、使用数字或使用字母的分类号称为(单纯标记),同时使用字母和数字的分类号称为(混合标记)。
12、(顺序制)即用若干个数字或字母编成(固定长度)的连贯的号码。
13、(八分法)这是解决同位类超过十个阿拉伯数字限度进的一种标记方法。
14、双位法即在展开时一下就用两位数字。
这是解决同位类个数很多的一种标记方法,双位法也称(百分法),便不用00_09以及10\20\90等号码,所以实际上只能标识(81个)子目。
15、(中国档案法)于(1987年)12月由档案出版社正式出版。
16、1989年<<中国档案法>>又开始了第二版的编制工作,并于1995年通过专家鉴定,中国档案出版式(1997)年出彼。
17、<<中国档案法>>主要适用于档案文献(检索系统)的建立,但某些专业部门也可用以组织档案实体的分类排架。
18、<<中国档案分类法>>是以不同历史时期的国家机构,社会组织,从事社会实践活动的(职能分工)为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。
19、详表,也称(主表),是分类表的(正文)。
多选:
1、分类检索语言可分为(体系分类法)和(组配分类法)两大类。
2、体系分类法包括<<中国档案分类法>>、<<中国图书馆图书分类法>>、<<国际十进分类法>>.
3、组配分类法<<冒号分类法>>.
4、分类检索语言从其结构而言,都具有三种构成要素:
即(类目)、(类号)和(注释)。
5、类号即(分类号)也称(分类标记)。
6、体系分类法的主要特点是按(学科)、(专业)或(职能集中文献),并(揭示各类文献在内容上的区别和联系)、(提供从科学、专业或职能分类检索文献信息的途径)。
7、分类应*守下列几条规则:
A在每一次划分时,只使用一个划分标准主B划分位子数的外延之和等于其母类的外延C要选择反映事物的本质的符合分类的属性作为划分标准。
8、类目的划分包括(分类标准的选择)和分类标准使用次序的选择)两个问题。
9、列类是体系分类法编制中的主要环节,实际上就是(类目的划分)和(类目的排列)的过程。
10、列类应遵循(文献保证原则)和(用户保证原则)。
11、列类方法(设置类目的方法)大体可归纳如下:
A正规列类法B列举列类法C重点列类法D罗列列类法E对应列类法F集中列类法H突出列类法、归附列类法、归附列类法、合并列类法、交替类法、专表列类法。
12、类目名称必须符合(确切)(科学)(简洁)的要求。
13、注释方式可以分为以下几种:
A简单的注释与带实列的注释B笼统注释与具体的注释C指示性的注释与参考性注释D对一个类目的注释与具体的注释,
14、标记制度是指分类号的构成方法,可分为(顺序制)(层累制)和混合制)三种。
15、混合制:
一般是指分类号分成两部分,一部分用(层累制),一部分用(顺序制)
16、<<中国档案分类法>>把全表分为(政治)(科学文化)和(经济)三个部分。
(19)个大类。
17、<<中国档案分类法>>是一部完整的体系分类表,它主要由(编制说明)(大纲)(简表)(详表)(类目表)(辅助表)(复分表)。
18、复分表分为(通用复分表)和(专类复分表)。
19、<<中国档案分类法>>编有(综合复分表)(世界各国和地区表)(中国地区表)(中国民族表)等四个通用复分表和一个科技档案专用的综合复分表。
20、<<中国档案分类法>>包含四种分类表:
<<中华人民共和国档案分类表>>、<<新民主主义档案分类表>>、<<民国档案分类表>>、<<请代档案分类表>>.
21、<<中国档案分类表>>中设置了交替类目,即在不同的位均*列出,以便从不同角度均可查到有关档案,同时规定其中一个类目为实际归属类目,称为:
“使用类目”,其他类目并不集中有关文献,仅起指引查找的作用,称为:
“选择类目”或交替类目。
22、<<中国档案分类法>>中的标记符号,采用字母与数字的混合标记,严格采用(层累制),当同位类超过9个时采用(八分法)或(双位法)。
23、<<中国档案分类法>>中的注释,按其性质大体可归纳为(范围注释)和(方法注释)两类。
24、分面组配分类法是根据概念的分析和综合原理编制的文献分类法,又称(分面分类法)(组配分类法)(分析_综合分类法)。
25、分面组配式分类法可分为(全分面分类法)和(半分面分类法)两种。
简答
一、简述类目注释的作用?
答
(1)、当类目的含义不够明确时,用注释来明确。
(2)、当类目之间的关系不可能用等级结构来显示时,用注释来显示。
(3)、当在分类方法上有某些需要说明的地方时,用注释来加以说明。
二、简述同位类目排列次序的主要方法和要求?
答
(1)自然序列,其要求是:
连续性、规律性、稳定性、重要类目的突发性。
其中最重要的是连续性。
(2)、人为序列,就是按照事物的重要程序排列。
人为序列包括:
1)、从重要物类目到次要事物类目的排列次序。
2)、从有较多文献论述的事物类目到只有很少文献论述的事物类目睥排列次序。
3)、从抽象的、理论的、一般性问题的类目到具体的、应用的、个别性问题的类目排列次序。
三、简述确定类目名称的基本要求?
答:
类目名称必须符合确切、科学、简洁的要求:
(1)、确切。
即所用的语或词组要能准确、恰当地反映类目的实际内容范围。
(2)、科学了。
即采用比较通行的科学名词术语作类目名称,而不要采用不通行的表达方式。
(3)、简洁。
即所用的词或词组要概括简练,并能准确表达原义。
四、简述分类标记(分类号)的作用?
答:
(1)可以明确类目次序,便于排列目录和组织馆藏。
(2)用分类号标引文献比较简单。
(3)在检索时可作相符性比较。
(4)层累制分类号在一定程序上可以表达各个类目的从属关系和并列关系。
(5)可以帮助分辨一个类目的涵义。
五、简述理想的分类标记应符合哪几个条件?
答:
(1)有较大的容纳性。
(2)有较好的表达性。
(3)易排易检。
(4)号码简短。
(5)有伸缩性。
(6)有助记性。
六、简述复分与仿分的异同?
答:
(1)、仿分和复分的道理是一样的、区别在于,对于普通的和大量的共同类目采用复分的方法,按专门编制的复分表进行细分,而对于少量的共同类目则采用仿分的方法
(2)、仿分即在细分类目时仿照某一类目的下位类来设类,不必专门编表。
七、简述分面分类法的特点?
答:
(1)、它虽然类目较少,但能通过类目的组配表示众多的主题概念,标引能力强于体系分类法。
(2)可以较自由地扩大或缩小检索范围,能从多途经检索文献,在检索性能和效率方面都优于体系分类法。
(3)采用分段标记制度,便于分类标记,检索较为灵活。
(4)可用于组织分类目录以及建立分类检索系统等。
(5)半分面分类法还可用于文献的分类排架和分类统计等。
(6)分面分类法的类目体系不够直观,编制和使用都比较复杂项推广难度大。
论述:
一、试述分类检索语言的特点与作用?
答:
(1)、分类检索语言的特点主要表现在:
1)、它是一部类目的汇编,对表达事物概念的类目起登录作用,只有分类检索语言中有的类目或能够组配而成的类目,才能用于类分文献。
2)、它是一个类目的体系,有关角度提示类目之间的关系。
3)、它是一部目的“词典”,对类目起定义作用,限定和说明类目的内涵和外延。
4)、它是一种类目的排列表,通过线性排列,明确各个类目在分类体系中的位置和次序。
(2)、分类检索语言的作用主要表现在:
1)、这是进行分类标引和组织分类检索工具的规范。
2)、它能作为对文献资料进行分类排架的依据。
但在档案机构一般要采用另一种类型的分类体系来组织分类排架。
3)、它是检索者从分类途径检索文献资料的指南。
4)、它是文献工作者工作中常用的参考手册。
二、试述体系分类法的局限性及其在<<中国档案分类法>>中的体现?
答:
(1)、体系分类法自身存在着一个难以克服的矛盾___集中与分散的矛盾。
它一方面按学科\按专业或职能分工,系统地集中了文献内容,另一方面又从其他角度使其具有同类性质的文献分散。
(2)、这一矛盾在<<中国档案分类法>>中的主要表现是:
1)党政职能的交*问题。
在分类表中党务和政务是分别设类目的,但实际上在党务活动中往往涉及各种政务问题。
2)各项职能范围中的相同职能手段问题。
当我们按职能的范围集中某类档案时,全国各职能范围中相同职能手段的档案便被分散了。
3)会议文件问题,分类表在许多体类中都设置了会议类,这样一方面使有关会议的档案得到了集中,另一方面又使会议所讨论的专门问题脱离了有关志类。
4)同一类问题的部分档案入有关专类而造成的分散。
5)一事物概念由若干概念因素构成,造成该类档案在一种概念因素上集中,而在其他概念因素上分散。
(3)体系分类法主要采用列举式的列类方法。
一方面列举式很难获得十分完整的类目,另一方面列举式还会膨胀分类法的篇幅。
(4)体系分类法严格的逻辑体系给增加,删减类目造成困难。
第四章主题检索语言及《中国档案主题词表》
1.简答主题检索语言的特点和性能
它的特点是:
语词标识几乎都是事物的名称,关于同一事物的文献全部被集中标引在同一语词标识下,所以要在主题检索系统中查全同一事物的档案就比较容易。
它的性能有:
(1)控制主题检索系统所用的语词标识,以保证其具有较高的检索效率。
(2)引导使用者周密选用检索词,以便准确、全面地标引和检索文献。
(3)方便标引人员和检索人员查找所需检索词。
2.简叙词的优点有哪些
叙词法就其基本性质而言,是一种采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇型概念标识系统。
叙词法比其他主题检索语言具有更好的性能,体现了检索语言的发展趋势。
绝大部分计算机检索系统都采用叙词法。
3.简叙词法的构成原理
(1)按主题集中文献;
(2)用规范化的、可以通过组配来表达复杂概念的语词直接标引文献主题;
(3)用参照系统、分类索引、等级索引、轮排索引和主题词关系图等多种方式来显示主题概念之间的相互关系;
(4)用字顺序列直接提供主题检索途径;
(5)用于标识单元方式手工检索系统或用于计算机检索系统时,具有标引深度大,能够实现多途径检索,扩大、缩小或改变检索范围灵活,适应多种检索要求等优点。
4.简答主题词的组配
概念组配是决定其特点的基本原理。
概念组配即概念的分析与综合。
概念组配与字面组配在形式上有时相同,有时不同;从性质上说,两者有着原则性的区别。
字面组配,其实质是词的分拆与组合;概念组配,其实质是词义的分析与综合。
两者检索效果有很大差异。
5.简主题词组配的作用
(1)可以控制词汇量。
(2)可以对同一项情报进行多途径检索。
(3)可以自由扩大、缩小或改变检索范围。
(4)可以及时地反映新事物、新学科。
6.简《中国档案主题词表》特点
其特点仅在于:
(1)在文书档案用词方面,为体现文献保证原则,因而所选的词与一般主题词表有较大区别。
而就科技档案和某些专门档案的主题词表而言,其区别不大。
(2)其范畴索引也如档案分类表一样,以国家机构和社会组织从事社会实践活动的职能分工为基础来建立分类体系和对主题词进行归类。
(3)为保持历史原貌,便于标引和检索,对古代档案用词也予收录。
(4)档案主题词表除个别的以外一般不需要标注外文同义词和设置双语种对照索引。
7.简《中国档案主题词表》的结构体系
(1)主题词字顺表;
(2)主题词分类索引;
(3)主题词等级索引;
(4)主题词轮排索引;
(5)词双语种对照索引;
(6)专有主题词索引;
(7)正式主题词索引和款目词索引;
(8)主题词关系图。
8.每条词款目大体可分为款目词、标注项和参照项三部分。
9.简字顺表的功用
一是提供从字顺查词的途径;
二是可通过参照系统,获知与所查词有密切联系的词,既可提高选用主题词的准确性,又有助于检索中扩大、缩小、改变检索范围;
三是可以通过其标注的范畴类号和族首词,比较容易地进入范畴索引和词族索引;四是还可获得主题词的其他信息。
10.范畴索引:
是将主题词按其概念所属学科、专业或职能性质划分成大类,在大类之下再分若干小类,在小类下则将主题词和非主题词按字顺排列的一种索引。
11.简词族索引的功能
词族索引是把主表中具有属分关系、包含关系和整体部分关系的正式主题词,按规定属分级别展开全显示的一种词族系统。
词族索引的功能是可以从一族中外延最广的主题词出发,找到其全部同族词,并且可以明确它们之间的层层隶属关系,从而弥补主题词字顺表族性检索功能差的缺点。
在机检系统中是实现自动扩检、缩检及上位词登录的重要手段。
第五章检索语言的发展与应用
1.检索语言基本上可分为分类检索语言和主题检索语言两大类。
2.简等级体系分类检索语言的主要特点
按照不同的学科和专业集中文献,用等级结构直接显示主题概念之间的关系,用分类符号作为标引和检索的依据,它便于从事物的有序性和知识的系统性方面来认识和查找文献。
而《中国档案主题词表》属于叙词型主题检索
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 档案 文献 检索系统