信息生命周期管理ILM详解存储基础信息化333.docx
- 文档编号:29561335
- 上传时间:2023-07-24
- 格式:DOCX
- 页数:11
- 大小:22.32KB
信息生命周期管理ILM详解存储基础信息化333.docx
《信息生命周期管理ILM详解存储基础信息化333.docx》由会员分享,可在线阅读,更多相关《信息生命周期管理ILM详解存储基础信息化333.docx(11页珍藏版)》请在冰豆网上搜索。
信息生命周期管理ILM详解存储基础信息化333
信息生命周期管理(ILM)详解_存储_基础信息化
在e-works举办的合肥信息管理与信息安全培训班上,武汉国家光电实验室信息存储部、华中科技大学计算机学院曹强博士为培训班讲述了信息生命周期管理的相关内容。
以下为曹博士所讲主要内容的整理。
一、信息数据管理面临的挑战
(一)数据量成指数增长
1、图灵奖获得者JimGray提出经验定律:
网络环境下每18个月产生的数据量等于有史以来数据量之和。
2006年人类全部的书本文字加起来大约50PB;
2006年全球每年制造、复制出的数字信息量共计1610亿GB;
至2010年,达9880亿GB,年复合增长率为57%
2、数字化发展速度大体上正比于当前的信息化程度。
ERP的推广导致更多的数据产生
(二)数据重要性不断增加
1、14天内无法恢复数据:
75%的公司业务会完全停顿;
43%的公司再也无法重新开业;
20%的企业在两年之内被迫宣告破产。
2、各行业最长可忍受的信息系统停机时间分别为:
金融业2天;销售业3.3天;制造业4.9天;保险业5.6天;平均4.8天。
3、数据的重要性和信息化程度成正比。
(三)数据类型多样化
1.结构化数据。
例如数据库中的数据。
2.半结构化数据。
例如Email,部分生产数据。
3.非结构化数据。
例如超文本、图像、视频、音频。
4.数据集的多态性。
在不同系统中表现不同形式。
图1各种数据源产生的数据
(四)整体拥有成本增加
1、硬件成本的增加
需要购置更多的存储设备、计算设备、网络设备。
2、软件和维护成本的增加
各种不同的管理软件(虚拟化,备份,ILM等)、维护系统运行需要可用性(快照、CDP等)
3、管理复杂度增加
管理各种类型的数据;管理不同的时代、类型的软硬件模块
4、能耗增加
5、安全风险增加
(五)信息化时代,企业面临的问题
对于许多企业来说,数据增长都是无法控制的。
数据增长带来了新的挑战:
1、如何实现数据增长、数据访问和管理成本之间的平衡?
2、如何保证在适当的时间访问适当的信息?
3、如何及时发现和检索存档信息?
(六)信息的不畅与管理不善
2008年9月,德国复兴信贷银行已经提前三天得知美国雷曼兄弟银行即将破产,并决定不再对其汇款,但财务系统还是“送去”3.5亿欧元的巨额资金。
究其原因是信息不畅:
该银行电脑里储存着繁多的支付任务,却没有及时更新这一重要数据。
过时的信息导致银行直接蒙受重大经济损失。
(七)信息具有生命周期
当今信息社会,企业使用和管理的信息量每年成倍地增长。
这些信息不但需要保存较长的时间,而且需要对其进行查询.目前,一些国家还制定了新法规.新法规规定了与业务相关的电子邮件和互联网通信的保留时间,以及这些信息的恢复速度。
例如,在美国,就已出台了10,000多项法规,规范信息的存储、可用性和处置方式。
因而,随着信息价值的变化,企业有必要将信息转移到不同的存储介质上,以最低的成本提供适当级别的保护、复制和恢复。
为了以最低的成本实现信息价值最大化,企业已经开始将自动化网络存储基础设施与其综合服务和解决方案结合在一起,然后以此为基础制定出新的信息管理策略。
这种新的信息管理策略称为信息生命周期管理,其目标是以完全支持组织和机构业务目标和服务水平的需求。
采用这种新的信息管理方式意味着根据信息和应用对企业的价值进行分类,然后制定相应的策略,确定最优服务水平和最低成本.利用自动化网络存储基础设施将信息转移到相应的服务等级,以满足企业要求。
借助信息生命周期管理,企业不但能够在整个信息生命周期内充分发挥信息的潜力,还可以按照业务要求快速对突发事件做出反应。
图2信息的价值随时间而异
图3信息生命周期管理:
不同信息类别的重要性–对应到不同的服务水平及正确平台
图4不活动的数据消耗资源:
80%存储的数据在30天后不再被存取;非活动数据增加主存储的代价,并降低效率。
二、信息生命周期管理(ILM)
信息生命周期管理(ILM)由一套策略、流程、实践、服务和工具组成,从信息创建之初直到最后被处理,使信息的业务价值和最合适、最具有成本效率的存储基础设施保持一致。
—StorageNetworkingIndustryAssociation–SNIA
(一)ILM的目标
ILM通过存储、保护、管理、集成四个组成部分实现信息管理费用与业务需求之间的平衡,从而达到降低企业的风险和费用的目的。
因此,ILM使企业实现了"适当的信息,在适当的时间,以适当的费用,存储在适当的设备上"。
图5数据在生命周期中的不同形态与存储部署
(二)ILM对企业的战略价值
利用信息生命周期管理,可以将信息管理与业务目标相对应。
这样在数据对业务的价值不断变化时,企业可以按照信息的当前价值来管理数据,从而获得:
1.通过分层存储平台提高资产利用率
2.实现信息和存储基础结构的简化和自动化管理
3.获得成本高效的信息存取、业务连续性和保护解决方案
4.通过将存储基础结构和管理与信息的价值相匹配,从而以最低的信息持有成本提供最大的信息利用价值
(三)ILM的核心
ILM的核心是理解信息在其不同生命阶段中对企业的不同价值,帮助企业从战略高度来管理信息。
从管理信息的角度出发,会根据信息生命周期的特点,将其存储在与自身价值相符、并与拥有者所需要的交流方式和服务方式相符的不同层次的架构里,通过有计划、主动地管理存储,不断降低复杂性并增加整个存储系统的可用容量。
(四)ILM解决的问题
建立一个更完整、更具有价值的信息系统,能够完全满足用户对于数据的以下五种需求:
随时访问、按时间恢复、方便的共享、所有数据受到适当的保护以及按照一定的时间规定(比如法律规定)管理数据。
图6信息生命周期管理(ILM)注重信息的流动和管理
(五)应用效果举例
三、信息归档
(一)面临的问题
1.难以分析数据的特征
2.难以知道设备和低层拓扑的关系
3.数据管理具有物理边界(分区,文件系统)
4.数据管理具有业务边界(不同业务划分)
5.数据管理具有逻辑边界(数据库、文件系统)
6.数据管理具有时间边界(不同的时间段有不同的划分)
7.数据管理具有人为边界(不同的部门,不同管理员具有不同的使用方法)
8.软硬件集成问题(不同提供商,不同时代)
(二)ILM与归档的关系
1.非活动数据的归档是数据生命周期管理的重要部分
2.归档依赖于对数据集的分类
3.归档展现数据在系统中的迁移过程
(三)归档定义
归档是一个智能化流程,它将不活跃的,很少被访问的,但仍有业务价值的数据进行搬迁,并提供查询和找回这些数据的能力。
图7备份与归档的区别
(四)信息归档提供的价值
1.开放系统的51%数据是不必要的、重复的或没有业务价值的
2.68%的数据在90天或更长的时间未被访问
3.55%服务器非计划宕机是由于存储空间的超载造成的
4.每年需在管理效率提升60%才能赶上存储的增长
5.研究报告显示80%的信息需要保留50年,68%的信息需要保留100年
因此,为提高效率,不活跃、不常被访问的数据可采用归档。
(五)存储归档的法规遵从特性
1、收集并保存所有相关文档
为多种信息(文件、数据库以及电邮)提供存储空间
在用户修改前收集收发的电子邮件
核实记录的完整性和精确性
在信息保存期内保护好数据以免恶意或意外删除
2、为保留信息提供选项
提供不可擦除、不可改写的保护途径
为不能满足法律法规遵从的数据在可擦洗介质上提供选项
提供镜像或复制的存储空间
在老的介质报废前将数据升级到新介质
3、在适当的时间对数据进行处置,但不能提前
在信息保存期内,存储的数据和索引都被保存好
当信息不再被法律、法规和法人需要时需立即删除
(六)信息归档的体系架构
图8信息归档的体系架构
四、分级存储
(一)ILM与分级存储的关系
1.数据(信息)的时间性价值决定其存储方式的选择
2.数据(信息)的时间价值取决于其处在生命周期的不同阶段
3.分级存储是积极响应用户需求和数据自身的生命周期共同决定的,其与信息生命周期息息相关
图9分级存储简例
五、ILM存储技术的实例分析(EMC和IBM)
(一)EMC独有数据内容管理技术----Centera
图10Centera的工作机制:
应用示例
内容寻址为信息存档带来了这些好处:
消除了管理开销——地址是独立于位置的;
提高了存储效率——完全相同的对象仅存储一次;有保证的完整性——绝对保证内容真实性;强制性地将任何应用程序策略——固化到存储中;允许在对象级别利用元数据。
图11内容镜像
Centera实现的是内容镜像(内容奇偶校验保护),而不是磁盘镜像。
在接到一个存储内容请求时,Centera会问这样的问题:
“Centera中的哪两个节点最闲、在不同的电源架上而且有足够的空间?
”可以将一个驱动器上的内容镜像到Centera中任意多个节点上。
这使得重建时间非常短,因为Centera不用等待某个驱动器可用时才开始重建。
相反,它要求保存单一内容实例的节点快速在另一个可用节点上创建第二个拷贝。
因此,可以同时对多个节点执行内容镜像。
图12内容康复
这里概述了Centera如何处理组件故障:
如果某个磁盘发生故障,则给故障驱动器中的对象创建一个新拷贝。
如果某个节点发生故障,在确认此节点确实停机后(不是由于其他原因临时离线,如短期网络问题,进行软件升级等),Centera向拥有一个该内容实例的各节点发送请求,请求创建一个重复的拷贝。
不会将内容复制到同一电源架上的节点上。
机架中配置两个交换机。
如果一个交换机或交换机端口/连接发生故障,到受影响节点的通信量将自动通过另一个交换机/未停下的LAN连接路由。
对固定内容如果使用传统的存储解决方案,对文件系统和内容放置的管理将会随着固定内容数量的增加变得越来越复杂。
因此,管理/人力资源几乎随固定内容呈线性增长。
但如果使用Centera,则不存在这一情况。
Centera满足了客户需要:
“如果我不是一直都要接触此内容,就不要让我一直管理它。
”它是一个最佳固定内容解决方案,非常适合于无法承受管理事务性信息存储解决方案带来的呈线性增加的成本的公司。
图13自我管理和配置
再说一遍,内容地址与内容联系在一起,而不与内容的位置联系在一起。
这减少了资源管理,因为内容地址既不是层级(文件系统)中的一个位置,也不是磁盘阵列(逻辑卷)中的一个位置。
这明显增加了每个全职员工可以管理的内容的数量,因为它不需要与文件系统或逻辑卷交互。
(二)IBM
图14IBM模块化的ILM解决方案
图15IBM产品模块
六、总结
1.面对业务数据量的增加,必须对于数据进行分类
2.不同的存储资源具有不同的特性
3.ILM能够结合数据和存储资源特征,降低总拥有成本
4.ILM是基于标准,业务驱动的管理实践过程
在e-works举办的合肥信息管理与信息安全培训班上,武汉国家光电实验室信息存储部、华中科技大学计算机学院曹强博士为培训班讲述了信息生命周期管理的相关内容。
以下为曹博士所讲主要内容的整理。
一、信息数据管理面临的挑战
(一)数据量成指数增长
1、图灵奖获得者JimGray提出经验定律:
网络环境下每18个月产生的数据量等于有史以来数据量之和。
2006年人类全部的书本文字加起来大约50PB;
2006年全球每年制造、复制出的数字信息量共计1610亿GB;
至2010年,达9880亿GB,年复合增长率为57%
2、数字化发展速度大体上正比于当前的信息化程度。
ERP的推广导致更多的数据产生
(二)数据重要性不断增加
1、14天内无法恢复数据:
75%的公司业务会完全停顿;
43%的公司再也无法重新开业;
20%的企业在两年之内被迫宣告破产。
2、各行业最长可忍受的信息系统停机时间分别为:
金融业2天;销售业3.3天;制造业4.9天;保险业5.6天;平均4.8天。
3、数据的重要性和信息化程度成正比。
(三)数据类型多样化
1.结构化数据。
例如数据库中的数据。
2.半结构化数据。
例如Email,部分生产数据。
3.非结构化数据。
例如超文本、图像、视频、音频。
4.数据集的多态性。
在不同系统中表现不同形式。
图1各种数据源产生的数据
(四)整体拥有成本增加
1、硬件成本的增加
需要购置更多的存储设备、计算设备、网络设备。
2、软件和维护成本的增加
各种不同的管理软件(虚拟化,备份,ILM等)、维护系统运行需要可用性(快照、CDP等)
3、管理复杂度增加
管理各种类型的数据;管理不同的时代、类型的软硬件模块
4、能耗增加
5、安全风险增加
(五)信息化时代,企业面临的问题
对于许多企业来说,数据增长都是无法控制的。
数据增长带来了新的挑战:
1、如何实现数据增长、数据访问和管理成本之间的平衡?
2、如何保证在适当的时间访问适当的信息?
3、如何及时发现和检索存档信息?
(六)信息的不畅与管理不善
2008年9月,德国复兴信贷银行已经提前三天得知美国雷曼兄弟银行即将破产,并决定不再对其汇款,但财务系统还是“送去”3.5亿欧元的巨额资金。
究其原因是信息不畅:
该银行电脑里储存着繁多的支付任务,却没有及时更新这一重要数据。
过时的信息导致银行直接蒙受重大经济损失。
(七)信息具有生命周期
当今信息社会,企业使用和管理的信息量每年成倍地增长。
这些信息不但需要保存较长的时间,而且需要对其进行查询.目前,一些国家还制定了新法规.新法规规定了与业务相关的电子邮件和互联网通信的保留时间,以及这些信息的恢复速度。
例如,在美国,就已出台了10,000多项法规,规范信息的存储、可用性和处置方式。
因而,随着信息价值的变化,企业有必要将信息转移到不同的存储介质上,以最低的成本提供适当级别的保护、复制和恢复。
为了以最低的成本实现信息价值最大化,企业已经开始将自动化网络存储基础设施与其综合服务和解决方案结合在一起,然后以此为基础制定出新的信息管理策略。
这种新的信息管理策略称为信息生命周期管理,其目标是以完全支持组织和机构业务目标和服务水平的需求。
采用这种新的信息管理方式意味着根据信息和应用对企业的价值进行分类,然后制定相应的策略,确定最优服务水平和最低成本.利用自动化网络存储基础设施将信息转移到相应的服务等级,以满足企业要求。
借助信息生命周期管理,企业不但能够在整个信息生命周期内充分发挥信息的潜力,还可以按照业务要求快速对突发事件做出反应。
图2信息的价值随时间而异
图3信息生命周期管理:
不同信息类别的重要性–对应到不同的服务水平及正确平台
图4不活动的数据消耗资源:
80%存储的数据在30天后不再被存取;非活动数据增加主存储的代价,并降低效率。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 生命周期 管理 ILM 详解 存储 基础 信息化 333
![提示](https://static.bdocx.com/images/bang_tan.gif)