数据元为中心的数据标准体系研究-袁满.ppt
- 文档编号:871020
- 上传时间:2022-10-13
- 格式:PPT
- 页数:63
- 大小:17.02MB
数据元为中心的数据标准体系研究-袁满.ppt
《数据元为中心的数据标准体系研究-袁满.ppt》由会员分享,可在线阅读,更多相关《数据元为中心的数据标准体系研究-袁满.ppt(63页珍藏版)》请在冰豆网上搜索。
主讲人:
袁满(教授)东北石油大学(Y),三个世界的定义数据与元数据什么是标准化和数据标准化数据元素方法论数据体系与数据标准体系体系架构中各个标准维度功能自标准数据技术架构数据元在数据交换中应用的案例总结,三者之间交互的核心是各种各样的概念(术语)以及它们之间的关系。
人类希望将现实世界中所做的一些事情让计算机模拟人类来完成,因此,人类认识世界的这些概念映射到计算机世界中去,让计算机模拟人类的活动。
由于人类认识世界的角度的不同,可能对同一类事物认识的结果也不同,所以,要实现计算机化的活动就必须让人类对这些概念的认识达成一致才行。
现实世界中存在冲突的事物,必须在概念世界中得到统一,不然这些不统一的或冲突的概念将会直接影响到计算机世界的生态。
是用什么来描述这三个世界的呢?
Definition1-Data:
数据是以文本、数字、图形、图像、声音和视频等格式对事实进行表现。
从技术上讲,数据(Data)是数据(Datum)一词的拉丁语的复数形式,这意味着数据本身是“一个事实”。
然而,人们通常把它当作单数术语使用,对事实进行获取、存储和表达即形成数据。
又由谁来负责定义、描述这些数据呢?
Definition2-Metadata:
Dataaboutdata.理解I:
关于数据的数据。
理解II:
描述数据的数据或描述数据的信息。
理解III:
元数据相当于描述数据的模式。
标准定义:
在GB/T3935.1-83对“标准”的定义:
对重复性事物和概念所做的统一规定。
它以科学、技术和实践经验的综合成果为基础,经有关方面协商一致、由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。
它的含义如下:
标准是一种“统一规定”,这种统一规定是作为有关各方“共同遵守的准则和依据”。
根据中华人民共和国标准化法规定,我国的标准分为强制性和推荐性标准两类。
标准制订的对象是重复性事物和概念。
这里讲的重复性指的是同一事物或概念反复多次出现的性质,而且极易引起冲突的那些事物和概念。
数据标准化主要为复杂的信息表达、分类和定位建立相应的原则和规范,使其简单化、结构化和标准化,从而实现信息的可理解、可比较和可共享。
为信息在异构系统间实现语义互操作提供基础支撑,即数据标准化是实现数据共享的重要基础。
又由谁来负责定义、规范并管理元数据呢,谁是终极者?
Definition-DataElement(DE):
用一组属性描述定义、标识、表示和允许值的一个数据单元(DataUnit)。
理解I:
它是一个数据单元,即它是用来“盛”数据的。
理解II:
这个数据单元必须由一系列的属性描述以实现对该单元的全方位刻画。
单元,ISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part1:
FrameISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part2:
ClassificationSchemesISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part3:
RegistrymetamodelandbasicattributesISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part4:
FormulationofdatadefinitionsISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part5:
NamingandidentificationprinciplesISO/IECFCD11179-1:
200x(E):
Informationtechnology-MetadataRegistries(MDR)-Part6:
Registration,早在90年代,为了推动电子通信的全球化,国际标准界通过细心而持续不断的努力确定了开放系统互连环境(OSIE)。
在该环境内,不同的计算机硬件的应用可实现信息共享。
开放性信息处理系统所需的四个基本要素:
硬件、软件、通信和数据,其中数据的变数最大,也是标准化中的棘手问题。
Data,Data,通信,通信,关于数据标准方面的方法论国际标准化组织已经在90年代初期就开始制定相关的数据标准方面的标准了,其中典型代表就是ISO/IEC2382-4:
1987(数据的组织-词汇)ISO/DIS704:
1997(术语工作:
原则与方法)ISO/IEC11179-2:
2000(数据元的规范与标准化)ISO/IEC11179-5.1995(数据元的命名与标识原则)ISO/IEC11179-6:
1997(数据元的注册)等标准。
国际应用现状:
美国从小到大学,大到国家均利用数据元素方法论制订了国家、行业等相关层面的数据元目录,象国防部牵头制订的(DOD国防数据元目录),该目录包括了从战争的后勤保障、前线指挥等数据链中的数据传输协议;美国国家医疗卫生数据元目录、科技数据元目录、政府政务数据元目录等等。
可以说数据元目录渗透到各个领域的信息化中。
2001年11月10日,世界贸易组织(WTO)第四次部长级会议在多哈作出决定,接纳中国加入WTO.于2001年12月11日正式成为世界贸易组织的成员。
正是由于这件轰动世界的大事,才促开启了我们国家对数据标准研究的开端。
为实现与世界经济接轨,首先是要解决我国经济贸易与国际的接轨。
所以,当时开始引进并研究了国际贸易数据元标准,那时主要以国际贸易数据元标准为基础,采用等同采用的方法,该国际贸易数据元标准即成为我国第一部利用数据元技术制订的数据标准。
之后由全国电子业务标准化技术委员会牵头研究并制定出了第二部的国际贸易数据元标准,该标准最终由中华人民共和国国家质量监督检验检疫总局和中国国家标准化管理委员会正式向全国发布并实施。
该标准于2010年发布了一个新版本:
GB/T15191-2010贸易数据交换-贸易数据元目录。
在该标准和国家系列标准的影响下国人开始关注数据元素方法论的重要应用。
在后续的工作中,第二部国家标准就是:
由中国标准化研究院起草的GB/T19488.1-2004:
电子政务数据元第1部分:
设计和管理规范;石油领域开展研究工作比较早,从2000年开始研究,于2007年,石油工业领域发布:
SY/T6705-2007:
石油工业数据元设计原则(石油工业行业标准)。
目前,数据元素方法论相继在我国各领域开始研究与应用,象林业、农业、海洋、科学、天文等诸多领域得以应用,并发布了系列的数据元目录以及相应的交换标准。
用一组属性描述定义、标识、表示和允许值的一个数据单元。
图左半部分牵着数据元素目录标准,右半部分牵着数据模型标准。
该模型蕴含相当的深远的语义!
揭示了面向对象的本质!
对数据元素方法论的深度解析与认识:
在一般人看来,数据元素国际标准只不过是一套对数据进行规范的标准规程,通过我们多年的深入研究与思考,认为如果仅仅停留在这个认识层面上,那完全抹杀了数据元素方法论的核心思想,我们认为:
数据元素方法论不仅是对数据进行规范化的规程,也是:
数据分类的方法论术语标准化的方法论数据建模的方法论。
拓展后的数据元素模型,其实上图上中的各个维也是信息标准体系中的数据标准体系。
数据标准体系,DE,DE基本属性维,DE字典/元数据标准,DE术语维,概念模型标准,逻辑模型标准,对象分类标准,特性分类标准,物理模型标准,数据元注册标准,数据采集标准,数据质量标准,数据交换标准,数据接口标准,数据安全标准,信息处理标准,程序设计标准,数据管理标准,应用模型标准,本体标准,术语标准是数据标准中的核心标准之一,其它的数据标准均以它为基础。
有关术语标准化的国际与国家指导标准包括:
GB/T5271.4-2000信息技术词汇第4部分:
数据的组织(idtISO/IEC2382-4:
1987)GB/T10112-1999术语工作原则与方法(neqISO/DIS704:
1997)GB/T15237.1-2000术语工作词汇第1部分:
理论与应用(eqvISO1087:
1-2000)GB/T20001.1-2001标准编写规则第1部分:
术语(ISO10241:
1992,InternationalTerminologyStandards-PreparationandIayout,NEQ)ISO标准手册:
数据处理词汇1982下面给出国际上一些具体典型代表的石油领域上游术语字典。
23,国际石油工业术语字典标准:
PIDX、PIDDPIDX(ThePetroleumIndustryDataExchange)的PIDD(PetroleumIndustrialDataDictionary)术语字典该字典是目前国际上石油上游领域权威字典了,对上游专业涉及的术语进行了规范的定义(http:
/pidx.org/pidd.htm),24,SchlumbergerOilfieldGlossary术语字典(http:
/)这是对含水层这个专业术语的定义。
Schlumberger术语字典对勘探与开发相关的术语进行了比较全面的定义。
25,SchlumbergerOilfiledGlossary术语字典(http:
/)这是对于井测量深度这个术语的定义,十分的具体、直观形象。
26,PPDMGlossary术语字典(http:
/www.ppdm.org/wiki/index.php?
title=Category:
Glossary&pagefrom=Productivity+Test),27,PPDMGlossary术语字典(http:
/www.ppdm.org/wiki/index.php),28,PPDMGlossary术语字典(http:
/www.ppdm.org/wiki/index.php),29,POSC术语字典POSC对于EP中出现的每个术语都进行了详细地定义。
PTY_PERMEABILITYThemeasureofthecapacityofaporousmaterialtopermitfluidflowother_spatial_object(O,K,I:
other_spatial_object(property)rock_material(O,K:
rock_material(pty_permeability)hole(O,K:
hole(pty_permeability)activity(O,K,I:
activity(process_data)data_value(M:
ndt_permeability)/引用了域名preferred_flag(O,I:
ndt_boolean)/引用了域名POSC不但定义了术语字典,而且对数据的类型、值域以及计量单位等进行了详细的定义。
石油领域制订术语标准:
石油天然气工程建设基本术语标准号:
SY/T0439-2012油气田及管道腐蚀与防护工程基本词汇标准号:
SY/T0030-2008陆上石油工业安全词汇标准号:
SY/T6455-2010石油管材常见缺陷术语标准号:
SY/T6445-2000油田化学常用术语标准号:
SY/T5510-92钻井工程术语标准号:
SY/T5313-2006石油天然气工程建设基本术语标准号:
SY/T0439-2012,目前,国际对于术语标准建设工作做得很细致!
目前,我们国有在术语标准化这方面的工作显得薄弱些,有些领域认为这些是基础工作,给人们的感觉是做不做没有多大意义!
就象改革开放之前,我们国家的基础设施很落后,改革后的今天,随着经济的发
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 中心 标准 体系 研究 袁满