CALIS元数据命名规范.docx
- 文档编号:24331780
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:13
- 大小:20.22KB
CALIS元数据命名规范.docx
《CALIS元数据命名规范.docx》由会员分享,可在线阅读,更多相关《CALIS元数据命名规范.docx(13页珍藏版)》请在冰豆网上搜索。
CALIS元数据命名规范
CALIS元数据命名规范
CALIS元数据命名规范
1编写背景3
2设计原则3
2」元数据命名规则3
2.2元数据格式命名规则3
2.3元数据名称空间(namespace)命名规则3
2.4元数据仓储的命名规则5
3具体实例6
4OAI元数据记录存储规范9
4」元数据唯一标识符Identifier9
4.2元数据记录表:
TabMeta.XXXX10
4.3元数据Set定义表:
TabSetDefine10
4.4元数据记录Set内容表:
TabSetRccords11
1编写背景
编写本文档的目的在于规范CALIS顷目所涉及的元数据相关内容,原因为:
1.在OAI-PMH协议中,涉及到仓储实体、元数据格式以及集合Set等的内容。
此外,CALIS的各种项目也涉及各种仓储和元数据类型,因此有必要制定有关元数据仓储和格式的命名规则。
2.在METS中,涉及到元数据的Schema地址,因此有必要制定Schema地址的命名规则。
2设计原则
2.1元数据命名规则
元数据中英文名称的命名请参照《信息资源名称规范列表》,其中中文名称沿用资源的中文名称,英文名称的命名格式为:
metadataof资源英文全称。
2.2元数据格式命名规则
1)元数据格式表:
TabMetaFormat
字段名
字段类型
中文名称
说明
MetaPrefix
varchar2(100)
元数据前缀
元数据格式的前缀
XMl_Namespace
varchar2(15O)
命名牢间
元数据格式的命名空间URL地址
XML_Schema
varchar2(15O)
XML模式
元数据格式的模式定义URL地址
MetaFormatlD
varchar2(40)
格式ID
元数据格式的标识
RID
varchar2(100)
仓储ID
若当前表空间只有一个仓库.则可以省略为空。
RecordsTableName
varchar2(30)
记录表名
元数据记录所在的数据库表名
HasSet
Number
(1)
支持Set
是否支持set
Harvestable
Number
(1)
是否可收割
LocalPrefix
varchar2(20)
Local前缀
用于拼接元数据记录的完整
OAI-Identifier
该刖缀可以是一级•也可以是多级.各级之间用分割。
[注]:
安全访冋机制可以对囹种元数据格式进行访冋控制。
具体方案也分两种:
/方案一:
STXML配置文件(暂略)
/方案二:
基于用户管理系统(暂略)
2)元数据格式命名规则
说明:
下表“格式前缀的命名规则”栏目中的“元数据名”采用《信息资源名称规范列表》中资源名称的英文简称。
通常.一种元数据可以支持5种元数据格式.命名规则如下:
格式类型
格式前缀的命名规则
说明
完整元数据格式名称
国际标准元数据名CALIS_te数据名单位简名卫数据名
格式的版本号体现在其命名空间和模式定义中
简要元数据格式名称
国阪标准元数据名-SIMPLECALIS_te数据名—SIMPLE单位简名卫数据名.SIMPLE
上述格式中的部分元数据顷
限定的DC格式名
国阪标准元数据名_DCCALIS_元数据包DC单位简名卫数据名DC
采用限定的DublinCore标准
标准DC格式名
DC
采用UnqualifiedDC
标准OAI_DC格式名
OAI_DC
采用UnqualifiedDC,用于OAI-PMH
例:
北大古籍元数据前缀:
♦PKU_RAREBOOK_MARC
♦PKU_RAREBOOK_MARC_SIMPLE
♦PKU.RAREBOOK(XML格式)
♦PKU_RAREBOOK_SIMPLE(XML格式)
♦PKU_RAREBOOK_DC(XML格式)
2.3元数据名称空间(namespace)命名规则
格式:
主机/mctadata_ns/版本/schema文件名
主机:
hg:
//www・calis・cdu・cn
路径:
metadata_ns
例:
学位论文元数据Schema地址:
hUp:
//w\vw・calis.cdu・cn/mctada(a_ns/l・O/ctd・xsd
2.4元数据仓储的命名规则
1)仓储定义表:
TabRcpositoryldentity
字段名
字段类型
中文名称
说明
Protocolversion
char(30)
协议版本
仓储支持的OAI协议的版本。
如:
OAI-PMH2.0
RepositoryName
varchar2(250)
仓储名
英文名称
RepositoryCnName
varchar2(100)
仓储中文名
中文名称
AdminEmail
varchar2(50)
仓储管理员EMail地址
Description
varchar2(250)
仓储描述
仓储详细描述
BaseURL
varchar2(250)
仓储URL
仓储BaseURL地址
RID
varchar2(100)
仓储ID
仓储唯一标识符
dcletedRecord
varchar2(10)
删除类型
三种值:
no:
系统不维护删除状态persistent:
长期保存删除状态transient:
不确定
granularity
varchar2(25)
肘间粒度
YYYY-MM-DD或
YYYY-MM-DDThh:
mm:
ssZ
charcode
varchar2(25)
Unicode2
GBK10646
注:
通常.一个数据库表空间中只存放一个仓库.这种情况下.上述表只含一条记录。
2)元数据仓储唯一标识符的命名规则
CALIS有关的仓储唯一标识符定义规则:
oai-identifier=schemenamespace-identifierM:
Hlocal-identifier
scheme=HoaiM
namespace-identifier=DomainName-wordn.MDomainName
DomainName=DomainName-word[”・”DomainName]
DomainName-word=alpha*(alphanumI)
local-identifier=1*uric
按上述规则,对于高校图书馆中的资源仓库的唯一标识符.其命名规范如下:
♦oai:
lib.高校域名:
仓库简名(推荐)
♦oai:
馆代码:
仓库简名(推荐)
说明:
对于高校图书馆,若采用馆代码,则应区分高校内外以及不同部门的代码。
仓库命名应具有全国乃至全球范围内的唯一性,为多个仓库的联合奠定基础°
例:
北大学位论文仓库唯一标识符:
/oai:
:
etd,或者
/oai:
:
etd
/oai:
:
etd
3)安全访问机制
/方法一:
采用XML配置文件.定义一组叹割方的IP地址以及帐号、密码。
/方法二:
采用通用的用户管理系统对收割方进行身份认证。
(暂略)
3具体实例
卜面给出CALIS推荐使用的11种元数据的相关命名实例。
学位论文元数据:
以CALIS高校学位论文数据库为例
元数据英文名称
metadataofthesis&dissertation
元数据前缀
CALIS.ETD
Schema地址
http:
//www.caI
对应集合名称
ETD
对应仓储的中文名称
CALIS高校学位论文数据库
对应仓储的英文名称
CALISsElectronicThesis&DissertationDatabase
仓储URL
仓储唯一标识符
oai:
:
etd
网络资源兀数据:
以CALIS重点学科导航库为例
元数据英文名称
metadataofwebsites&pages
元数据前缀
CALISResoureNav
Schema地址
ns/1.0/ResourceNav.xsd
对应集合名称
ResourceNav
对应仓储的中文名称
CALIS重点学科导航库
对应仓储的英文名称
CALISsResourceNavigationDatabaseofKeyDisciplines
仓储URL
仓储唯一标识符
oai:
:
resourcenav
期刊论文元数据:
以CALIS外文期刊目次数据库(CCC)为例
元数据英文名称
metadataofjournalarticles
元数据前缀
CALISJNArt
Schema地址
ns/l.O/JNArt.xsd
对应集合名称
CCC
对应仓储的中文名称
CALIS外文期刊目次数据库
对应仓储的英文名称
CALISsCurrentContentsofwesternjournals
仓储URL
仓储唯一标识符
oai:
:
ccc
古籍元数据:
以北大古籍资源库为例
元数据英文名称
metadataofrarebooks
元数据前缀
CALISRAREBOOK
Schema地址
ns/l.O/rarebook.xsd
对应集合名称
Rarebook
对应仓储的中文名称
北京大学古籍资源数据库
对应仓储的英文名称
DigitallibraryofRarcbooksofPekingUniversity
仓储URL
仓储唯一标识符
oai:
:
rarebook
舆图元数据:
以北大舆图资源库为例
元数据英文名称
metadataofancientatlas
元数据前缀
CALISATLAS
Schema地址
http:
//www.calis.edu.en/nietadata_ns/l.0/altas.xsd
对应集合名称
Atlas
对应仓储的中文名称
北京大学舆图资源数据库
对应仓储的英文名称
DigitalLibraryofAncientAtlasofPekingUniversity
仓储URL
仓储唯一标识符
oai:
:
atlas
拓片元数据:
以北大拓片资源库为例
元数据英文名称
metadataofnibbings
元数据前缀
CALISRUBBING
Schema地址
ns/l.O/nibbina.xsd
对应集合名称
Rubbine
对应仓储的中文名称
北京大学拓片资源数据库
对应仓储的英文名称
DigitalLibraryofRubbingsofPekingUniversity
仓储URL
仓储唯一标识符
oai:
:
nibbing
会议论文元数据:
以CALIS联合目录中的会议论文库为例
元数据英文名称
metadataofconferencepapers
元数据前缀
CALISCONFPAPER
Schema地址
ns/l.O/confpapc匚xsd
对应集合名称
ConfPaper
对应仓储的中文名称
CALIS联合目录会议论文库
对应仓储的英文名称
CALISUnionCatalogofConferencePapers&Proceedings
仓储URL
仓储唯一标识符
oai:
:
cucc:
confpaper
家谱元数据
元数据英文名称
metadataofgenealogy
元数据前缀
CALIS.GENEALOGY
Schema地址
ns/l./aencalogv.xsd
对应集合名称
Genealogy
对应仓储的中文名称
对应仓储的英文名称
仓储URL
仓储唯一标识符
oai:
:
genealogy
地方志元数摇
元数据英文名称
metadataofchorography
元数据前缀
CALISCHOROGRAPHY
Schema地址
http:
//www.calis.edu.en/metadata_ns/l.0/chorography.xsd
对应集合名称
Chorography
对应仓储的中文名称
对应仓储的英文名称
仓储URL
仓储唯一标识符
oai:
:
chorography
电子图书元数据
元数据英文名称
metadataofe-books
元数据前缀
CALIS.EBOOK
Schema地址
ns/l.O/ebook.xsd
对应集合名称
Ebook
对应仓储的中文名称
对应仓储的英文名称
仓储URL
仓储唯一标识符
oai:
:
ebook
音频元数据
元数据英文名称
metadataofaudio
元数据前缀
CALISAUDIO
Schema地址
ns/l.O/audio.xsd
对应集合名称
Audio
对应仓储的中文名称
对应仓储的英文名称
仓储URL
仓储唯一标识符
oai:
:
audio
4OAI元数据记录存储规范
4.1元数据唯一标识符Identifier
用于在仓库中表示元数据记录的唯一性IDo
字段名
字段类型
中文名称
说明
RecID
NUMBERS)
记录ID
元数据记录的内部ID。
主键
MetalD
varchar2(20)
记录标识符
用于外部表示的元数据记录唯一标识符ID
3)MetalD定义规则:
♦方案一:
前缀(4)+年份(4)+月份
(2)+流水(6)
♦方案二:
前缀(6)+流水(8)
•方案三:
学号(若干位),可用于学位论文。
4)完整的元数据记录的OAI-Identifier为:
仓库0Al-Identifier++LocalPrefix+“厂+应用系统内部元数据标识
其中LocalPrefix为应用系统本地前缀
例:
“北大学位论文仓库唯一标识符:
oai:
:
etd
♦某条学位论文记录:
oai:
:
etd-ETD/innerMetaId
♦其中innerMetald可以是学号。
/北大古文献仓库唯一标识符:
oai:
:
ancicnt
♦古籍类的某条记录:
oai:
:
ancient-rarebook/innerMetaId
♦拓片类的某条记录:
oai:
:
ancient-rubbings/innerMetaId
♦舆图类的某条记录:
oai:
:
ancient-altas/innerMetald
4.2元数据记录表:
TabMeta_XXXX
其中:
XXXX为完整的元数据格式名称。
说明:
为提高存储效率.不同元数据存放在不同的表中。
字段名
字段类型
中文名称
说明
RecID
NUMBER(8)
记录ID
NOTNULL
RecordValue
BLOB
记录值
春放元数据记录的详细内容
DATESTAMP
Date
更新时间
元数据记录的最新更新时间
RccordTypc
NUMBER
(2)
记录类型
记录的类型(可选)
Usable
NUMBER(l)
是凸q用
1-OJ用.0—个RJ用
Recordstatus
NUMBER(l)
操作状态
1—created;2—updated;0—deleted支持deletion操作。
4.3元数据Set定义表:
TabSetDefine
字段名
字段类型
中文名称
说明
SetID
NUMBER(8)
SetID
可采用SEQUENCE分配,表内唯一性
SetName
varchar2(20)
Set
Set唯一名称(英文)
Description
varchar2(250)
Set描述
ParcntSetID
NUMBER(8)
父SetID
ChildrenSetIDs
varchar2(1024)
子SetID组
SetSpec
varchar2(1024)
说明:
set可以表示对记录的单级或多级分类。
SetSpec:
表示仓库中set的唯一标识符.它由一组用冒号[:
]分隔的字符串组成.这代表set的路径。
该路径中的囹个字符串不应再包含冒号。
若set路径只包含一级(即单级分类),则setSpec不包含任何冒号[:
]。
4-4元数据记录Set内容表:
TabSetRecords
说明:
某个set内
字段名
字段类型
中文名称
说明
SetID
NUMBER(8)
SetID
该记录所属Set之SetID
RecID
NUMBER(8)
RecID
元数据记录的内部ID
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CALIS 数据 命名 规范