5 主题组织.docx
- 文档编号:2775707
- 上传时间:2022-11-15
- 格式:DOCX
- 页数:13
- 大小:29.31KB
5 主题组织.docx
《5 主题组织.docx》由会员分享,可在线阅读,更多相关《5 主题组织.docx(13页珍藏版)》请在冰豆网上搜索。
5主题组织
第5章主题组织
5.1主题组织概述
5.1.1主题组织内涵
主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。
它是信息组织两大方法之一,在现代信息组织活动中占有十分突出的地位。
主题表是主题组织法的运用结果,主题表习惯上也称为主题法,它与我们所说的主题组织法是不同的概念。
5.1.2主题语言
1.主题、主题词、主题表
主题指信息对象所表达或反映的主要内容、问题或事物。
按信息所表达的中心问题数量的多少,主题可分为单主题和多主题两种类型。
单主题只含有一个中心问题,即只有一个主题;多主题指含有两个以上的中心问题,即有两个以上主题。
主题词是用于描述、存贮、检索信息主题的受控词汇,是主题表中能表达一定意义的最基本词汇单元。
主题词是以众多的事物概念为基础的,它是事物本质属性的概括,是一个类称概念。
主题词的选用主要依据三方面,即出现频率、标引频率、查找频率。
具体来讲是应具有实际检索意义,主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。
主题词具有概念性、控制性、组配性、语义性、动态性等特征。
将主题词按一定方式、规则组织成的词汇表称为主题词表,主题词表按主题词的类型可划分为标题词表、单元词表和叙词表,按主题检索标识的不同组配程序,分为先组式主题表和后组式主题表。
二者的含义差别体现在主题词表在标引前是否已经组配好。
2.主题语言要素
主题语言的要素,包括以下四个方面:
1语词标识:
标识有两类即号码标识和语词表示,语词表示是采用自然语言中的但经过控制的名词术语,作为描述文献主题的标识。
2字顺系统:
汉字字顺系统主要有音序和形序。
3参照系统:
是主题词表显示主题词语义关系的语义词网络。
4主题检索工具:
是根据主题语言原理编制的各种主题检索工具,主要是主题目录、主题索引、计算机中的主题词倒排档等。
5.2标题词语言
5.2.1标题词的内涵和词汇控制
标题词(SubjectHeading)是指经过规范化和标准化处理的简略表达信息对象论及或涉及的事物即主题的语词,是完全受控的一种主题标识,通常是比较定型的事物的名称。
标题语言,是主题语言系统中最早的一种,它以选自自然语言中经过控制的语词术语作为标识,从语词控制角度看,它是一种先组式的。
标题语言基本构成要素是主标题、副标题和说明语。
例:
Books(主)
——Reviews(Indirect)(副)
Hereareenteredcollectionsofreview,worksonthetechniqueofwritingreviewareenteredundertheheadingBookreviewing.
见《美国国会图书馆标题表》第九版
5.2.2标题词的语义参照
标题的语义参照是标题法揭示标题之间的语义关系的一种重要手段。
主有单纯参照、相关参照和一般参照。
单纯参照是反映同义关系的参照,一般用“见(see)”、“见自(seefrom)”来显示等同关系。
相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用“参见(seealso)”、“参见自(seealsofrom)”来显示。
一般参照是一种概括性的举例性参照。
例:
电脑(非正式标题词)
见电子计算机见(正式标题词)
电子计算机(正式标题词)
见自电脑见自(非正式标题词)
海洋学(上位标题词)
参见海洋地质学参见(下位标题词)
作为一种传统的的主题法,标题词表的特点有:
(1)采用列举式词表,
(2)定组式标题结构,(3)操作简便。
5.3元词语言
5.3.1元词的内涵
单元词(uniterm)又称元词,它是从文献中抽取出来并经过控制处理的、能表达文献主题最小、最基本的在概念上不能再分解的的,并能独立地描述文献所论及或涉及的事物——主题的词汇单位。
比较系统地建立起单元词法理论和体系地是1951年陶伯的单元词卡系统。
单元词可以是一个单纯词,如“山”、“水”、“氧”、“玻璃”、“逻辑”、“火车”、“资料”、“马克思”、“乌鲁木齐”等,也可以是一个合成词,如“文字”、“图书馆”、“车床”、“隔音”、“公路”等。
任何复杂的概念都可由单元词的组合(配)而成。
在实际使用过程中,单元词法使用的单元词并非都是任意的,实际上它只选用经过规范化处理够的单元词来表示文献的主题。
组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。
组配时主要使用比号组配法和比孔组配法两种方法。
5.3.2元词的特点
单元词法的主要特点是:
标题是组配构成的,而且是“后组式的”,
具体地说,单元词法的主要特点是:
(1)摆脱了标题法中每个标题只能选择一种标题形式作为正式标题的局限性,也就是可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引;
(2)单元词之间不存在次序问题。
但是这有可能会产生误检,例如在查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学
(3)校图书馆”的额外内线都检索出来。
(4)组成“标题“的每一个单元词都是排检词,都可以作为检索入口,因而与标题法相比,单元词的检索途径较多。
(5)利用对单元词的增加或减少,可以进行扩检或缩检。
(6)标引深度较高。
单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。
每张单元词卡片一般可以记录200个文献号码,而且还可以继续使用第2、3张卡片。
如果采用比孔卡片,则可以记录更多的文献号码,因而可以大大提高文献的标引深度。
例如,美国杜邦公司的几个检索系统,有许多文献标引了400多个单元词。
(7)有利于向计算机检索方向发展。
单元词法最初不编制词表,因而对词义的控制和词义的规范都不作要求,但是后来也编制了词表并使用语义参照系统。
5.4叙词语言
5.4.1叙词的涵义和特点
为了避免单元词法的上述缺陷,人们又研制了一种新的信息组织方法——叙词法。
叙词(descriptor,Subjectterms),它是经过词汇控制后,在信息组织中用来显示文献主题,在检索中用来构造提问式的一种检索词汇。
它是以受控的自然语言为语词基础,以字顺和分类系统为词汇显示的基本手段,以语词的概念组配而不是字面组配为重要特征的一种标引和检索文献的理论方法,又称其为描述词、叙述词,在国内也叫主题词。
叙词法就是以叙词作为标识符号,标引和检索文献信息的一种检索方法。
1959年美国杜邦公司编制了第一部叙词表,其后,随着计算机的应用,叙词表的编制迅速发展,叙词语言成为受控信息组织和检索的主要语言。
叙词法的主要特点是:
(1)直接以规范化了的自然语言——叙词作为标识符号,直观性强;
(2)直接从论述和研究的具体对象和问题出发进行选词,并采用叙词组配来描述主题,专指性强;(3)叙词法能随时加以增设修改,适应性强;(4)对叙词主要采用字顺排列方式,查找迅速;(5)主要采用后组式概念组配方法,灵活性强;(6)对同一主题的文献,可以作多维检索(多途径检索);(7)叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用。
5.4.2字面组配与概念组配的区别
实际上,字面组配与概念组配有时候相同,有时候则不同。
例如“农用钢挖泥船”就可以用“农用船”、“钢船”和“挖泥船”三个概念进行组配。
5.4.3叙词组配应注意的问题
组配时需要注意这几个问题:
(1)要尽量使用词表中给出的主题词,只有词表中单个主题词不能够表达主题,才进行组配;
(2)要防止单纯字面组配,组配必须是概念组配;
(3)要防止多标识组配,必须选用与所表达的主题关系最密切、最邻近的主题词进行组
配。
(3)要防止越级组配,也就是在标引时不能以粗(大概念——泛指词)代细(小概念——泛指词)或以细代粗。
比如,在词表中有“美国”、“政策”、“对华政策”、“对外政策”几个主题词时,只能用“美国”与“对华政策”组配成“对华政策-美国”来标引“美国对华政策”。
(4)要防止虚假组配。
(5)要防止二义性组配。
5.4.4叙词的参照系统
叙词法也使用参照系统来显示概念之间的相互联系,其方法与标题法中的基本相似。
叙词表参照系统所用的符号主要有:
5.5关键词语言
5.5.1关键词的涵义
关键词是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。
关键词选取简单,语词基本不作控制。
标引检索不需词表,因而特别适合于在信息量猛增现实情况下的信息组织和信息检索的需要。
而且,关键词在关键词系统中彼此独立,对概念之间的关系不予显示。
因而为按关键词进行信息组织提供了极大的便利,随着计算机在信息组织活动中应用的范围的扩大和应用力度的加强,关键词在信息组织、信息揭示和信息检索中必将发挥越来越大的作用。
目前,完全自然语言处理技术还有待提高,关键词作为一种近似的自然语言,能够在人工语言和自然语言中间起到沟通桥梁的作用。
5.5.2关键词的三大类型
关键词法原理的应用,常有三种形式,即题外关键词索引、题内关键词索引和单纯关键词索引。
单纯关键词索引是将从文献的正文、摘要和题目中抽出的关键词按照字顺轮流领头进行排列、没有上下文修饰的一种索引。
每一组关键词后著录文献号码,组成一个款目。
其索引款目格式是:
表55索引款目格式
关键词1
关键词2
………………
关键词n
地址
题内部关键词索引(Keywordincontextindex,KWIC)又称为上下文关键词索引,就是把关键词保留在文献的题目之内,关键词的上下文和词序都不变。
在编制索引款目时将每一个关键词按照字顺轮流做检索标目,排在版面的固定位置,并用黑体字表示作为标目的关键词,其上下文(即前后文)均随之移动位置。
其主要特点是在列出关键词时,保留了题目中的非关键词,而且词序不变。
这样关键词与非关键词组成了一条短语,即一条上下文,因而便于明确关键词在题目中的含义。
这种形式特别便于用计算机来编排处理。
其索引款目构成形式是:
表56KWIC索引款目格式
上文
关键词
下文
地址
例:
联机计算机在核反应堆中的应用0001
计算机与信息系统引论0002
以计算机为基础的信息系统导论0003
计算机在神经生物和行为学中的应用0004
图书馆与计算机0005
教育与计算机0006
题外关键词索引(Keywordoutofcontextindex,KWOC),也称上下文索引,是单纯关键词索引的一种变体,是针对KWIC索引提出的改进形式。
其编制原理与单纯关键词索引基本相同。
不同的地方是把文献中抽出的一组关键词同时放在题目、号码上面,轮流领头进行排列,或者是单个关键词轮流放在题目、号码前面。
在这种索引款目下,不仅著录文献号,还要著录文献的题目,以便读者选择文献时参考。
其索引款目构成形式是:
表2.4KWOC索引款目格式
关键词
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 主题组织 主题 组织