系统灾备技术基础概述Word下载.docx
- 文档编号:13345360
- 上传时间:2022-10-09
- 格式:DOCX
- 页数:16
- 大小:253.83KB
系统灾备技术基础概述Word下载.docx
《系统灾备技术基础概述Word下载.docx》由会员分享,可在线阅读,更多相关《系统灾备技术基础概述Word下载.docx(16页珍藏版)》请在冰豆网上搜索。
在IT技术的不断更新以及全面风险管控要求提高的环境下,灾备的范畴从传统的数据和系统备份、恢复,业务连续性规划、灾难恢复规划、灾备演练、灾备从业资质认证、人才培养、法律法规制定等领域,拓展到了通信保障、危机公关、紧急事件响应、第三方合作机构和供应链危机管理等。
图1-19·
11事件造成多家跨国公司数据损毁
在云和大数据时代,数据已经成为重要的生产要素。
特别是在棱镜门、永恒之蓝、汶川大地震这类造成大规模数据丢失和泄漏的人为或自然灾害事件发生后,无论是用户还是国家,均通过一系列的措施,强化对数据的安全保护。
中国也相继出台了一系列的法律法规,对各组织机构的数据安全保护条件进行限定,如2016年颁布的《中华人民共和国网络安全法》、2019颁布的《信息安全技术网络安全等级保护基本要求》、2019年起草的《数据安全管理办法(征求意见稿)》以及2020年在两会提及拟起草的《数据安全法》等。
尤其是在大力推动以技术创新为驱动、信息网络为基础、数据为核心的新基建的当下,数据安全成为提高数字转型、智能升级、融合创新等服务的关键因素。
1.2灾备的重要性
信息系统灾备的重要性不言而喻,存储专家JonToigo认为,如果不做DR/BC的规划,就可能有5%的概率引发企业的财务危机。
对于灾备的重要程度,科研机构已经进行了量化的分析:
美国德克萨斯州大学较早的一次调查显示——只有6%的公司可以在数据丢失后生存下来,43%的公司会彻底关门,51%的公司会在两年之内消失。
另一份针对这一课题的研究报告也显示——灾难发生之后,如果无法在14天内恢复信息作业,有75%的公司业务会完全停顿,20%的企业在两年之内被迫宣告破产。
美国明尼苏达大学的研究也表明,在遭遇灾难时,在没有灾难恢复计划的企业中,将有超过60%的企业在两到三年后退出市场。
而随着企业对数据处理依赖程度的递增,该比例还有逐渐上升的趋势。
IDC在全球范围内针对多个行业的中小型企业(员工数<
1000名)的调研结果显示——近80%的企业每小时的停机成本预计至少2万美元,超过20%的企业估算其每小时的停机成本至少
为10万美元。
2016年灾备行业的一份可用性报告显示,企业每年因应用停机造成的损失达到1600万美元,“可用性差距”(这一差距存在于用户所需,例如全天访问关键性应用和数据,与IT部门的交付能力之类)进一步扩大。
该报告指出,尽管去年发生了诸多备受瞩目的宕机事件,但依然没有引起足够的重视。
比如,全球84%的资深IT决策者承认,他们正在经历“可用性差距”的困境,这个比例只比去年增加了2%。
根据权威数据机构预测,2020年全球云计算市场规模将超4000亿美元。
而我国云计算近年来以超过30%的年均增长率,成为全球增速最快的市场之一。
云服务已经全面覆盖人们生活的方方面面,企业和个人的数据存储、各类业务的正常运作、大文件的高效传输均离不开云服务。
云服务器一旦宕机,企业业务以及信息安全等必然会受到波及,甚至成为安全隐患。
2019年3月,谷歌云、阿里云、腾讯云就相继发生大规模宕机时间,造成大量产品和服务受到影响,在腾讯云宕机的4个小时中,仅腾讯游戏就损失高达千万。
且随着企业信息架构复杂程度的加深,影响系统正常运作的因素也越来越多,无论设备故障、云平台宕机,还是人为误操作、断电等,均对企业业务造成巨大的影响,如2020年2月发生的微盟恶意删库事件,就因为缺乏合理的权限管控和全面的数据备份和恢复计划,造成大量用户数据丢失,影响线上近300万商户,两天内市值蒸发超11亿元人民币。
1.3信息灾备发生方式
虽然每个行业面对的应用场景不一样,但是万变不离其宗,根据已经发生的灾备事件总结分析,通常情况下灾难发生的原因会有以下几种方式:
表1-1信息灾备发生方式
灾难原因
具体方式
代表事件
IT系统问题
服务器、应用程序、操作系统、数据库、虚拟机等故障
美团服务器宕机
网络安全技术问题
网络、病毒攻击、数据窃取/丢失、篡改、加密、泄露
永恒之蓝WannaCry病毒
信息安全管理问题
rm-rf/*删除、升级失败、无灾备演练、权限管理混乱
微盟删库事件
灾害类事件
地震、洪灾、火灾、雷电、战争、城市建设
汶川地震
根据行业的研究表明,在以上各种导致系统故障的原因中,其比例为:
40%的系统故障是由操作人员操作失误而引起。
40%的系统故障是由应用软件的问题所引起。
20%的系统故障是由设备的物理原因所引起,如硬件失效、掉电、自然灾害等。
综上,系统故障导致业务下线的主要原因在于人为操作失误和应用软件问题造成,自然灾难造成的下线概率较小。
1.4灾备基础知识
在信息化环境下,灾备行业有很多的专业灾备知识及技术,理解这些内容对于业务和系统的灾备规划建设会有很大的帮助。
1.4.1备份
备份是指数据或系统的备份,它是容灾的基础,是指为防止系统出现操作失误或故障导致的数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。
图1-2备份
按照备份数据量分为:
全量备份、增量备份、差量备份。
全量备份:
用存储介质对整个数据及系统进行完全备份。
这种备份方式的好处是很直观,容易被人理解,易恢复;
缺点是在备份数据中有大量重复数据,由于需要备份的数据量相当大,因此备份所需时间较长。
增量备份:
每次备份的数据只是相当于上一次备份后增加和修改后的数据。
这种备份的优点很明显:
重复数据少,即节省存储空间,又缩短了备份时间。
差量备份:
是拷贝所有新产生或更新的数据,这些数据都是最近一次全量备份后产生或更新的。
增量备份与差量备份的区别是,增量备份判断数据更新标准是依据上一次备份检查点,而差量
备份一定是依据全量备份检查点。
如没有全量备份,就没有差量备份。
差量备份的主要目的是限制完全恢复时使用的介质数量。
备份类型
原理
优点
缺点
全量备份
对备份集合中所有数据进行备份
完全恢复系统需要的时间最短
费时,如果文件不频繁进行更改,备份内容几乎完全相同
增量备份
对上次备份后改变的数据进行备份
存储的数据最少,备份速度最快
完全恢复系统需要时间比全量备份或差量备份长
差量备份
对自上次全量备份后改变的数据进行备份
恢复时仅需要最新全量备份和相应的差量备份,备份速度比全量备份快
完全恢复系统需要的时间比全量备份长,如果大量数据发生变化,备份所需的时间长于增量备份
表1-2三种备份方式比较
Image备份是映像级备份的简称,是指对整个文件卷进行数据块级别备份,备份传输的是数据块而不是文件。
这种备份不仅做全备份时效率提高,而且在随后的增量备份时会更快。
它采用快照技术来创建一个近似于及时的数据映像,然后对快照数据映像进行备份,对应用的影响很小。
适合文件个数在百万量级以上的大型文件系统,以及更多要求恢复整个文件卷的应用环境。
图1-3Image备份
按照备份时间频率分为:
定时备份、实时备份。
定时备份:
是指有时间间隔的数据备份方式,比如一天一次,一周一次,或者一个月一次,定时备份不能保证数据的零丢失。
实时备份:
是指无时间间隔的数据备份方式,通过实时数据复制,保证主备两端的数据读写一致,确保数据的零丢失。
持续数据保护CDP(ContinualDataProtection)是一种连续数据保护技术,被称为高级的实时备份,它兼具数据备份与数据恢复的功能,通过CDP实时备份技术,可以实现到秒级的细粒度抓捕效果。
目前,主流的CDP有很多维度,包括基于存储数据块的、存储快照的、操作系统I/O层的,采取不同的技术维度,所获得的数据还原细粒度也有所差别,根据恢复的细粒度的大小,业界将
CDP分为真CDP(TrueCDP)和准CDP(NearCDP)。
真CDP技术是持续不间断地监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份,不会造成数据的丢失。
准CDP是指接近持续数据保护,数据备份存在延时,也就是意味着存在部分数据丢失的风险。
根据用户对RPO的要求以及灾备策略的不一样,CDP技术方案选择有很大自主性,但是随着数据量的增长和业务信息化的加快,未来的趋势将是以真CDP为主。
英方i2CDP属于真CDP技术,能够提供细粒度数据持续保护,可恢复至任意历史时间点。
按照备份对象分为:
字节级备份、块级备份、文件级备份。
字节级备份:
以字节级变量为基本单位,通过捕获生产系统数据的变化,并将变化数据实时传输到备端。
块级备份:
以磁盘块为基本单位,将数据从源端复制到备端,即每次备份数据以一个扇区或多个连续扇区为单位来进行备份。
文件级备份:
以文件为基本单位,将数据以文件的形式读出,通过文件系统接口调用备份到另一个介质上。
此外,根据数据备份时服务器是否停机又可分为冷备和热备;
按照数据存储介质之间的距离又可以分为本地备份和异地备份。
通过网络进行备份是热备的主要方式,其主要的传输模式如图:
图1-4持续数据保护CDP
在国内,基于高可用系统中的两台服务器的热备(或高可用)使用较多,因此双机热备常被人提起。
双机热备按工作中的切换方式分为:
主备方式(Active-Standby方式)和双主机方式(Active-Active方式)。
主备方式是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器处于该业务的备用状态(即Standby状态)。
而双主机方式即指两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。
注:
Active-Standby的状态指的是某种应用或业务的状态,并非指的是服务器状态。
1.4.2容灾
从广义上讲,任何提高系统可用性的措施都可称之为容灾。
容灾,即灾难发生时,在保证生产系统数据尽量少丢失的情况下,保持生产系统业务的不间断运行。
容灾可分为本地容灾、异地容灾、云容灾。
本地容灾:
本地容灾一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续正常对外提供服务。
通常可通过共享存储或双机双柜的方式实现本地容灾,其中多以共享存储为主。
共享存储由三部分组成:
活动主节点,不活动备节点,共享存储。
其中两台计算资源节点提供主备角色服务,通过SAN网络附加型存储作为数据存储的介质。
主备节点共享一份存储,一旦主节点宕机,备节点可基于共享存储实现业务的接管。
但共享存储的同构成本和远距离高可用接管成本过高,存在较大存储故
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 技术 基础 概述