医药卫生数据元标准药学数据中心.docx
- 文档编号:262515
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:38
- 大小:133.86KB
医药卫生数据元标准药学数据中心.docx
《医药卫生数据元标准药学数据中心.docx》由会员分享,可在线阅读,更多相关《医药卫生数据元标准药学数据中心.docx(38页珍藏版)》请在冰豆网上搜索。
医药卫生数据元标准药学数据中心
目录
前言4
1范围5
2规范性引用文件5
3术语与缩略语6
3.1术语6
3.2缩略语8
4医药卫生科学数据共享数据元标准研究概述8
4.1数据元概述8
4.1.1数据元简介8
4.1.2数据元与其它数据概念的关系9
4.1.3科学数据共享工程中的数据元10
4.2医药卫生科学数据共享数据元标准研究概述11
4.2.1数据元标准研究的内容11
4.2.2数据元标准研究的目的11
5数据元的表达格式12
5.1数据元基本属性12
5.1.1基本属性模型12
5.1.2必选属性与其他选择属性13
5.2基本属性规范14
5.2.1标识类属性14
5.2.2定义类属性15
5.2.3关系类属性15
5.2.4表示类属性17
5.2.5管理类属性19
5.3基本属性描述20
5.3.1常规描述符20
5.3.2属性描述规则20
6数据元的值域规范22
6.1穷举域22
6.2可重复利用域与通配数据元22
6.3数据元值域的规范定义和来源22
7数据元的提取23
7.1自上而下的数据元提取法23
7.2自下而上的数据元提取法23
8数据元的命名规则24
8.1名称语义内容的规则24
8.1.1语义规则24
8.1.2名称成分语义24
8.1.3分隔符语义26
8.2名称格式的规则26
8.2.1句法规则26
8.2.2词法规则27
8.3唯一性规则27
9数据元的定义27
9.1数据元定义规则27
9.2数据元定义指南28
9.3数据元定义要求28
9.3.1前提28
9.3.2规则28
9.3.3指导原则31
10数据元的分类34
10.1数据元分类模式34
10.1.1关键字34
10.1.2主题词表术语34
10.1.3分类法和本体论分类单元35
10.2数据元的分类属性35
10.3分类属性描述36
10.3.1分类组分标识符36
10.3.2分类组分名称36
10.3.3分类模式类型37
10.3.4分类模式标识符37
10.3.5分类模式名称37
10.3.6分类模式版本37
10.3.7分类模式项类型37
10.3.8分类模式项值38
11数据元的注册与管理38
附录(资料性附录)39
A.1什么是元数据39
A.2数据元、元数据、元模型40
前言
医药卫生科学数据共享网是跨基础医学、临床医学、公共卫生、中医药学四个数据中心和药学、特种医学主体数据库,“物理上合理分布,逻辑上高度统一”的资源共享服务系统,数据元则是共享资源在共享网层面上实现数据的一致性表达、交换和共享的基础。
为此,研究建立医药卫生领域数据元标准,是提高医药卫生共享数据采集、加工和处理以及数据生产、汇交与共享效率和质量,确保共享目标实现的前提,也是医药卫生科学数据共享工程标准规范建设重要的基础工作之一。
本标准是基于上述目的提出和制定的,旨在指导和规范医药卫生科学数据共享工程各建设单位建立科学数据采集、加工、处理、汇集、分发、服务和应用全过程中各种通用或专用数据元目录(又称字典)标准,促进医药卫生共享数据的规范化整合与无歧义理解。
本标准是按照向上积极采用适宜的国家标准或国际标准,向下突出科学数据共享活动的特点和需求,遵循科技部科学数据共享工程技术标准—数据元标准化基本原则与方法,参考了包括GB/T18391《数据元的规范与标准化》在内的大量国家标准,结合本领域各种类型科学数据资源建设和整合以及数据交换、共享、服务和应用对数据元标准化工作的特定需求,提出的医药卫生领域数据元标准化的具体方法和要求。
本标准为第一次制定。
本标准由医药卫生科学数据共享网标准体系建设项目组提出。
本标准主要起草单位:
解放军总医院、中国疾病预防控制中心、北京协和医院
本标准主要起草人:
刘丽华金水高李包罗王骏胡凯张黎黎郭赟
1范围
本标准围绕医药卫生领域各种类型科学数据库的建设和整合以及科学数据交换、共享、服务和应用对数据元标准化的需要,规定了数据元的提取、命名、标识、描述、分类、值域范围确立的基本原则与方法,数据元目录的格式规范,以及医药卫生科学数据共享工程中数据元的维护与管理的级别与机制。
本标准适用于医药卫生领域科学数据共享工程各建设单位研究和制定通用和专用的数据元目录(又称数据元字典)使用。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本部分的的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。
然而,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T5271.4—2000信息技术词汇第4部分:
数据的组织(idtISO/IEC2382-4:
1987)
GB/T10112—1999术语工作原则与方法(neqISO/DIS704:
1997)
GB/T15237.1—2000术语工作词汇第1部分:
理论与应用(eqvISO1087:
1-2000)
GB/T18391.1──信息技术数据元的规范与标准化第1部分:
数据元的规范与标准化框架(idtISO/IEC11179-1:
1999)
GB/T18391.2──信息技术数据元的规范与标准化第2部分:
数据元的分类(idtISO/IEC11179-2:
2000)
GB/T18391.3—2001信息技术数据元的规范与标准化第3部分:
数据元的基本属性(idtISO/IEC11179-3:
1994)
GB/T18391.4—2001信息技术数据元的规范与标准化第4部分:
数据元定义的编写规则与指南(idtISO/IEC11179-4:
1995)
GB/T18391.5—2001信息技术数据元的规范与标准化第5部分:
数据元的命名和标识原则(idtISO/IEC11179-5:
1995)
GB/T18391.6—2001信息技术数据元的规范与标准化第6部分:
数据元的注册(ISO/IEC11179-6:
1997)
GB/T20001.1—2001标准编写规则第1部分:
术语(ISO10241:
1992,Internationalterminal-ogystandards—Preparationandlayout,NEQ)
SDS/T2132—2004科学数据共享数据元标准化的基本原则与方法
SDS/T2131—2004科学数据共享公用数据元目录
SDS/T1003—2004科学数据共享概念与术语_概念
SDS/T1003.2—2004科学数据共享概念与术语_术语
3术语与缩略语
3.1术语
下列术语和定义适用于本标准
3.1.1
数据元dataelement
用一组属性描述其定义、标识、表示和允许值的数据单元,在一定语境下,通常用于构建一个语义正确、独立且无歧义的特定概念语义的信息单元。
3.1.2数据元概念dataelementconcept
能以数据元的形式表示,且与任何特定的表示法无关的概念。
3.1.3数据元目录dataelementdictionary
列出并定义了所有相关数据元的一种信息资源。
3.1.4数据元名称dataelementname
用于标识数据元的主要手段,由一个或多个词构成的命名。
3.1.5标识符identifier
注册机构内与语言无关的唯一标识符。
同数据标识符。
给定相关环境的对象的无歧义的名称。
3.1.6版本version
注册机构内,一套数据元规范中的一个数据元发布的标识。
3.1.7数据元注册系统dataelementregistry
由注册机构保存的用于描述数据元含义和表示形式的信息资源,包括注册标识符、定义、名称、值域、元数据和管理属性等。
3.1.8实体entity
任何具体或抽象的事物,包括事物间的联系。
3.1.9对象object
可以想象或感觉的世界的任一部分。
3.1.10对象类objectclass
现实世界中有清楚的边界和含义、其特性和其行为遵循同样的规则而能够加以标识的想法、抽象概念或事物的集合。
3.1.11属性attribute
某个对象或实体的特征。
3.1.12属性值attributevalue
某种属性的一个实例表示。
3.1.13定义definition
表述人和事物的基本特性、或其类别的词或短语。
3.1.14相关环境context
对使用名称或产生名称的应用环境或应用规程的指明或描述。
3.1.15特性property
对象类的所有个体所共有的某种性质。
3.1.16特性术语propertyterm
用于表述对象类特性的术语,它是数据元名称的一个部分。
3.1.17限定术语qualifierterm
用于定义和区分数据库中某个名称的词或词组。
3.1.18表示术语representationterm
数据元中用于描述数据元表示的术语,它也是数据元名称的一个部分。
3.1.19表示representation
值域、数据类型的组合,必要时也包括度量单位或字符集。
3.1.20注册机构标识符(RAI)registrationauthorityidentifier
赋予注册机构的标识符。
3.1.21版本标识符versionidentifier
赋予版本的一个标识符(用于提交或修改数据元注册)。
3.1.22分类模式classificationscheme
依据对象所具有的共同特征,如:
起源、组成、结构、应用和功能,而对其进行排列或划分的模式。
3.1.23分类的组分classifiedcomponent
依据一个或多个分类模式可对其进行分类的一个数据元的任何组分。
注:
组分包括对象类、特性、表示类、数据元概念、值域和数据元。
3.1.24结构设置structureset
在相关环境中放置对象的方法,用以展示与其他对象的关系,如各种实体关系模型、分类法(tax-onomies)和本体论法(ontologies)。
3.1.25关键字keyword
用于数据元检索的一个或多个有意义的字、词。
3.1.26分类法taxonomy
依据类及子类间的固有关系进行分类的方法。
3.1.27主题词表thesaurus
按给定顺序排列参照词汇,其中显示和标识了词汇间的关系。
3.1.28语义学semantics
有关词义注释的语言学分支学科(韦氏词典)。
3.2缩略语
IEC──国际电工委员会(InternationalElectrotechnicalCommission)
ISO──国际标准化组织(InternationalOrganizationForStandardizarion)
RA──注册机构(RegidtratrinAuthirity)
ERD──实体关系图(Entity-Relationship-Diagram)
4医药卫生科学数据共享数据元标准研究概述
4.1数据元概述
4.1.1数据元简介
数据元是可以用一组属性描述其定义、标识、表示和允许值的数据单元。
在特定的语
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医药卫生 数据 标准 药学 数据中心