DSG数据集中备份技术建议书云南电信.docx
- 文档编号:6554769
- 上传时间:2023-01-07
- 格式:DOCX
- 页数:87
- 大小:683.21KB
DSG数据集中备份技术建议书云南电信.docx
《DSG数据集中备份技术建议书云南电信.docx》由会员分享,可在线阅读,更多相关《DSG数据集中备份技术建议书云南电信.docx(87页珍藏版)》请在冰豆网上搜索。
DSG数据集中备份技术建议书云南电信
中国电信云南公司
2009年远程数据备份中心建设二期项目
技术建议书
迪思杰(北京)数码技术有限公司
2009年10月
目录
1综述4
1.1项目背景4
1.2建设目标5
1.3应用及系统现状5
1.4建设方案6
1.4.1目标架构6
1.4.2管理对象6
1.4.3建设规模6
1.4.4本期项目涉及的IT系统现状7
2技术方案建议书9
2.1方案设计思想9
2.2方案设计要点10
2.2.1Oracle非归档模式下的在线热备(业内唯一)10
2.2.2备份数据的恢复性验证(业内唯一)11
2.2.3备份时间(速度最快)12
2.2.4恢复时间、特殊的恢复策略(速度最快)12
2.2.5管理维护简单方便14
2.3备份方案推荐采用“SnapAssure备份软件”15
2.4备份拓扑结构图16
2.5硬件设备清单17
2.6软件配置清单18
2.7备份策略的设计19
2.7.1备份类型19
2.7.2备份策略20
2.7.3恢复策略21
2.8备份系统的管理22
2.8.1备份系统灾难恢复设计22
2.8.2备份策略的设计23
2.8.3备份系统管理建议24
2.9SnapAssure的特性介绍27
2.9.1SnapAssure备份产品工作原理29
2.9.2SnapAssure备份软件的指标36
3软硬件设备清单37
3.1硬件设备清单37
3.1.1系统部署所需主机设备要求。
38
3.1.2系统部署所需存储设备要求40
3.2软件配置清单41
4工程实施进度计划表44
5工程界面分工45
6技术协调会46
6.1项目管理46
6.2实施策略规划47
6.3测试47
6.4生产系统实施48
6.5项目小组及成员50
7场地及环境要求53
8测试及验收54
9培训56
10技术支持及服务的承诺和说明59
11保修说明,软硬件维保说明61
12技术文件62
13DSG公司简介(厂商)64
13.1DSG成立和组成64
13.2DSG业务范围64
13.3DSG核心技术65
13.4DSG公司的业务方向65
13.5DSG在国内的主要应用客户66
14DSG部份备份案例的介绍68
14.1新疆电信IBSS系统集中备份69
14.2重庆联通集中备份应用73
14.3天津联通集中备份系统应用78
14.4新疆移动BOSS系统集中备份81
14.5江苏电信综合结算系统备份应用84
14.6中国电信重庆等8省结算系统备份改造86
14.7江西移动BOSS异地备份应用87
15其他89
15.1部分集中备份项目的环境(电信行业)89
15.2应急恢复案例(电信行业)89
15.3性能指标占用参考90
1综述
数据是企业的重要资产,对于电信运营商而言,保护好企业信息系统的数据安全具有至关重要的意义。
云南省电信业务支撑系统包括融合计费系统、联采计费系统、Crm系统、综合结算系统、10000号等关键业务系统,这些业务系统构建起云南省电信的整体信息技术基础,采取必要的措施保护这些系统的系统安全和数据安全,将能促进云南省电信各项业务的顺利开展,提高客户服务水平,创造良好的社会形象,提升云南省电信的整体竞争力。
迪思杰(北京)数码技术有限公司是业内知名的专业数据管理软件公司,其SnapAssure备份软件采用了国际一流技术,具有备份/恢复速度快,占用空间小,对生产系统影响小等特点。
SnapAssure先后在中国电信的多个分公司得到使用,包括:
电信总部、北方电信(一期二期)、广西电信、新疆电信、青海电信、海南电信、贵州电信、宁夏电信、江西电信、九省结算中心备份系统集采(江苏/江西/广西/青海/海南/新疆/贵州/甘肃/福建)等,都表现了良好的功能和性能特点。
因此建议此次云南省电信采用DSGSnapAssure软件进行的集中备份。
1.1项目背景
随着近年云南分公司企业IT系统建设力度加大,IT设备数量剧增,数据库、J2EE等应用广泛使用,各种信息数据急剧膨胀,对数据的安全和可恢复性要求越来越严格。
在对云南分公司IT生产系统数据进行备份保护与日常维护过程中发现如下问题:
1.维护人员不足,维护压力过大,需要借助相应的工具提升数据维护管理工作的效率。
2.缺乏全面有效的数据备份恢复管理与监控手段。
3.BOSS系统数据量大、现有备份时间过长,影响生产系统的性能。
4.备份存储设备较为分散,缺乏对备份存储设备的统一管理和整合。
5.缺乏高效、可靠的针对不同类型故障的数据恢复手段。
6.缺乏便捷的可恢复性测试功能。
7.缺乏可供分析的统计报表。
8.缺乏一个统一的IT备份恢复系统管理平台。
从目前IT系统备份环境和实际维护管理工作来看,基本每套IT系统都有各自独立的备份系统。
备份软件的品牌也各异。
因此建立一套统一的数据集中备份管理系统是十分必要和迫切的。
通过该平台的建立,实现各个IT系统数据备份恢复运行状况的实时监控,提供有效的故障预警手段,降低数据丢失风险;实现数据备份和恢复的统一集中管理和操作,提升数据备份恢复的管理效率,降低备份软硬件资产投资;为备份数据的恢复提供日常的有效性、完整性验证手段,提高系统数据恢复成功率,缩短备份恢复的时间。
同时通过该系统,可以帮助维护管理人员在历史数据的基础上,对备份数据的状况和备份设备的使用情况进行科学有效的分析和预测,提升维护人员对备份软件和备份设备的掌控能力,并在备份设备的扩容或变更时提供相关决策依据。
1.2建设目标
建立一套高效、统一的数据集中备份管理系统平台,提供完善的可适应各种主机、存储平台、数据库应用及各种业务数据类型的高效数据保护与恢复机制,实现云南分公司核心IT系统数据的集中备份恢复管理,包括对现有各IT系统的数据保护存储设备统一管理和综合利用,提升存储资源的共享能力和利用率。
有效地降低数据备份恢复工作的复杂性和风险,全面提升维护管理人员的工作效率。
并提供多种预告警手段,记录历史数据,通过相应报表或趋势图等对数据备份管理工作进行量化分析,为科学决策提供可以信赖的依据。
1.3应用及系统现状
IT系统数据备份管理现状:
云南分公司企业IT系统包括融合计费帐务、联机采集、CRM/SPS、综合结算、10000号客服等各种核心应用系统,每天都产生大量的业务数据信息急需得到有效的备份保护,并能在出现各种数据故障时能得到快速完整的恢复。
而现有的数据备份恢复工作是通过不同系统自带的数据备份恢复系统分别进行,各系统间相互独立,缺乏有效的存储设备资源共享能力和资源整合利用能力,十分浪费资源和投资。
同时由于原有的数据备份系统缺乏直观、全面、高效的备份监控和预告警手段,使得日常的数据备份保护与管理工作十分繁重。
此外,原有数据备份恢复系统均采用D-T备份模式,导致数据备份特别是恢复的时间长、效率低,数据恢复有效性、完整性无法验证,实际应用中缺乏可操作性。
IT组织现状:
目前云南分公司企业IT系统的数据备份恢复管理主要由云南分公司企业信息化部统一进行维护管理。
1.4建设方案
1.4.1目标架构
目前云南分公司IT生产系统大部分采用省集中模式建设,各个系统在数据备份恢复平台的软、硬件方面都相互独立,这样对系统维护人员的日常维护工作造成较大压力,同时在系统数据备份恢复管理方面也相对复杂化。
因此需要对现有各备份恢复系统进行改造,将现有的数据备份物理资源整合利用,形成一套具备高效数据备份恢复功能和数据集中管理功能的数据集中备份恢复管理系统平台。
1.4.2管理对象
本期数据集中备份管理系统的管理对象即目标IT生产系统主要以云南分公司BSS系统和OSS为主,包括融合计费帐务系统、联机采集系统、CRM/SPS系统、综合结算系统以及10000号客服系统。
1.4.3建设规模
根据云南分公司信息化滚动规划要求,本期远程数据容灾备份中心建设二期项目将完成对现有核心业务系统分散、低效、功能单一的备份保护系统进行存储资源的整合,以及数据备份保护及管理系统的全面更新升级至统一的数据集中备份管理系统。
在后继项目中将完成核心系统远程容灾、所有其他IT系统纳入数据集中备份管理系统管理,最终实现云南分公司所有IT核心系统远程容灾、备份恢复的统一管理目标,有效降低云南分公司数据管理的投资成本,大幅提升业务支撑服务的水平,满足今后不断竞争、发展的需要。
1.4.4本期项目涉及的IT系统现状
系统名称
主机名
HA对应主机
备份目标类型
备份目标用途
现数
据量
日增量
数据
备注
融合计费帐务系统
P595A_ACCOUNT_DB
P690A_ACCOUNT
文件
bill、acct数据库的dmp文件
50g
1.5g
现有数据大部分存放于生产阵列,历史数据存放于磁带库,项目改造后,历史数据还是存放于磁带库,部分重要数据存放于二级存储;
P595B_ACCOUNT_APP
P690B_ACCOUNT
文件
话单文件、程序
100g
1g
P595A_ACCT_DB
P690C
归档数据库
销账数据库
2t
200m
P595B_ACCT_APP
P690D
非归档数据库
比对数据库
1.2t
100m
P570A_STAT
P570B_STAT
归档数据库+文件
统计查询数据库、dmp文件、程序
4t
200m
P570B、P550A、P550B
P550C、P550D、P550E、P550F
文件
程序
400g
350m
联机采集系统
P690B_BILLING
P690A_BILLING
文件
话单文件、程序
2t
200m
P595B_DAS1
P595A_DAS1
文件
话单文件、程序
3t
500m
P595B_DAS2
P595B_DAS2
文件
话单文件、程序
1t
200m
CRM/SPS系统
PROV595B
PROV595A
归档数据库
crm数据库
1788G
900M
ODS595B
ODS690
非归档数据库
ods数据库
2495G
700M
EAI595A
EAI690
归档数据库
eai数据库
10G
P595BWSYYT
WSYYT690
OracleRAC
归档数据库
网上营业厅数据库
151G
100M
原表遗漏
kmolcom01
非归档数据库
自动激活系统数据库
512G
150M
kmolcom02
非归档
自动激活系统数据库(同上共享)
kmolcom03
文件
自动激活系统程序
400G
200M
综合结算系统
P5701
P5702
归档数据库
结算数据库、表空间
1637G
月增80G
P5702
P5701
文件
原始话单
月增800G
M851
无
归档数据库
分析数据库
2046G
0G
循环使用存储
M852
M853
无
文件
对tsmdb备份
9G
月增400M
M854
10000号客服系统
P6501
文件,归档数据库(计划中)
程序
数据库
190G
0
Issdb01
issdb02
520G
500M
Issdb02
issdb01
fs1
fs2
文件
语音数据文件
2000G
备份在自有存储上,软件和数据库备份软件一致
云南电信现有部分设备可利旧:
设备名称
设备配置
使用现状
设计容量
已用空间
剩余空间
IBM3584磁带库-1
4个LTO2磁带驱动器及6个LTO3磁带驱动器
用于融合计费与联采计费的数据备份保护
55t
40t
15t
IBM3584磁带库-2
6个LTO2磁带驱动器
用于CRM系统的数据备份保护
35T
25T
10T
IBM3584磁带库-3
2个LTO2磁带驱动器
用于综合结算系统的数据备份保护
11.4T
(已计划新扩容量)
11.4T
0
IBM4800磁盘阵列
裸盘容量12TB,RAID后可用容量约为8TB
暂未使用
8t
0t
8t
2技术方案建议书
云南电信此次需要集中备份的系统包括:
同一机房内的融合计费系统、联采计费系统、Crm系统、综合结算系统、10000号5大系统的48台主机设备、11套oracle9i数据库的综合集中备份,其中有3-4套为非归档数据库。
总数据量在25T左右,日增数据量较大,部分磁盘阵列和磁带设备利旧
2.1方案设计思想
备份方案的设计需要遵循以下原则:
⏹实用性,必须满足当前的备份需求
⏹先进性,必须采用先进的设备和技术,提供更好的服务级别
⏹可扩展性,考虑到技术的发展带来的系统扩展,必须保证可以继续提供服务,具有很好的可扩展性
⏹易管理性,作为辅助的工具,必须用最小的培训投入提供最好的服务级别
针对云南省电信的备份需求,我们可以提供基于SnapAssure软件的解决方案
⏹可靠性,必须保证备份可用,而且提供可随时监控的手段
⏹恢复时间短,最好的RTO,可以采用当前的硬盘备份技术,达到快速恢复的要求,同时采用智能完全备份进行恢复,大大提高恢复的速度
⏹恢复时间点短,最好的RPO,可以恢复到灾难发生前的时刻,可以每隔几秒对当前日志进行备份,可以基于时间点恢复,而且可以恢复到最近的时刻,数据丢失最少
⏹备份策略简单,只需要进行全备份和增量备份,就可以得到智能完全备份版本
⏹备份窗口小,增量备份不需要扫描数据块,增量备份的速度很快
⏹灵活的恢复策略,可以恢复数据库,表空间,数据库文件,数据块,表,大大提高恢复的速度和灵活性
⏹可以和传统的磁带备份系统结合,利用本方案实现快速恢复,利用磁带备份系统达到数据长期保存的目标
2.2方案设计要点
电信行业在过去的项目建设中,都购买过一些其他厂商的备份系统,且都选用了磁带库备份方案,软件一般都是VeritasNBU、LegatoNetworks、IBMTSM、HPOminiBack以及BMC等备份工具。
但这些传统备份技术由于可靠性、性能以及功能方面都越来越难以满足业务需要,建立的备份系统也只是增加了心理的安慰,而实际上并没有真正解决了数据安全问题。
在出现故障时,很少能够预知其系统多长时间内能够恢复,很少知道备份系统的数据可用性到底有多少,很少知道其备份系统的维护投入了多少力量。
在这众多的未知因素中,企业无法保证其业务的安全和业务运行的连续性。
对于电信省公司这样一个完全省集中管理的系统来说,其每个系统的数据量都在数TB以上,那么采用传统磁带库备份系统已经不能满足用户需求。
主要体现在:
⏹经常出现故障:
经常出现磁带卷带情况,导致备份和恢复失败;
⏹恢复时间长:
如某电信在春节期间出现故障,需要磁带恢复,总共花了近一周时间。
⏹备份数据可靠性较差:
因为备份到磁带库上的数据只有在恢复时才能确认备份数据是否完整。
为此,一些电信在使用了DSGSnapAssure以后,决定将其已有备份系统进行升级和替换、建设一个以DSGSnapAssure为主的信息系统集中备份系统,为信息系统部的所有关键业务系统提供统一的磁盘备份支持。
在建设模式上,如果实施统一集中备份模式,比分散备份具有更大的优势:
✓资源的充分利用的统一分配:
集中备份系统中的存储资源是可以统一规划的,在一个统一的存储池中各系统可根据需要划分所需空间,避免为每套系统独立购买备份存储空间带来的空间分配困难和空间浪费。
✓便于统一管理:
集中备份系统中可由系统管理员统一进行管理,统一制定相同的安全策略。
2.2.1Oracle非归档模式下的在线热备(业内唯一)
业界提供的备份软件大部分都是基于OracleRman接口的备份模式,而OracleRman备份模式不支持OracleNoArchiveLog模式下的在线热备份。
大部分电信分公司很多Oracle系统为了节约主机资源,往往运行在NoArchiveLog模式下。
这就导致这些库的备份采用EXP的方式导出数据备份,存在很大的问题:
第一:
导出的性能很慢;
第二:
恢复的性能更慢,恢复一个上TB级的数据库需要的时间非常长;
第三:
只能恢复到每天导出的时刻点,无法恢复到故障发生的前一个点;
第四:
只能恢复导出过的表,而故障的出现并不能预先确定会破坏哪张表,所以无法起到全库备份的作用;
此次云南电信有3-4套oracle非归档数据库,采用传统备份方案将无法满足云南电信的备份需求,DSG公司的SnapAssure备份软件是业内唯一支持非归档模式备份的软件产品。
系统名称
备份目标用途
归档
现有数据量
融合计费系统
销账数据库
归档
2t
比对数据库
非归档
1.2t
统计查询数据库、dmp文件、程序
归档
4t
Crm系统
crm数据库
归档
1788G
ods数据库
归档
2495G
eai数据库
非归档
10G
网上营业厅数据库
归档
151G
自动激活系统数据库1
非归档
512G
自动激活系统数据库2
非归档
综合结算系统
结算数据库、表空间
归档
1637G
分析数据库
归档
2046G
10000号
数据库
归档
520G
2.2.2备份数据的恢复性验证(业内唯一)
备份出来的数据是否可用,必须通过全库恢复才能够验证。
但是对于资源有限的主业务生产系统来说,传统备份系统所要求的资源几乎与主生产环境一样,这使得电信各省用户没有条件和资源做恢复测试来验证备份数据的可用性。
由于不能验证备份数据的可靠性,一旦在数据需要恢复时而不能恢复,后果不堪设想。
此外,赛班斯法案也要求确保定期检查备份数据的可恢复性,所以迫切需要解决此问题。
技术要点
DSG备份技术
其他备份技术
验证方式
在备份系统上直接用oracle打开备份系统上的数据
将备份数据恢复出来再用oracle打开验证
需要的硬件条件
一个PCSERVER
一个相同平台的oracle服务器
一个相同平台的oracle服务器
大容量的恢复磁盘阵列
操作复杂程度
1.将备份数据用vvfs文件系统挂起来:
耗时10分钟
2.openoracle:
耗时30分钟
1.restore恢复数据,耗时1天
2.open数据库,耗时30分钟
2.2.3备份时间(速度最快)
对于1TB的数据库全备时间和增量备份时间都需要10小时以上,这使得备份工作几乎无法完成。
技术要点
DSG备份技术
其他备份技术
全备方式
全库扫描备份
全库扫描备份
全备效率
优化的压缩传输,200~1100GB/小时
200~500GB/小时
全备测试
1.9T的acct数据库,全备份7小时40分钟
1.9T的acct数据库,全备份13小时45分钟
增备方式
无需扫描的增量备份
需要扫描整个数据库
增备测试
1TB/30分钟
1TB/2-4小时
2.2.4恢复时间、特殊的恢复策略(速度最快)
数据库的恢复时间将需要几十个小时甚至更多,甚至有的系统因为只做归档日志备份导致可能无法完成恢复。
尤其是针对单表的恢复,在现有的备份系统上很难实现,为了恢复一个表,恢复时间经常需要几天。
技术要点
DSG备份技术
其他备份技术
全库恢复
1*全备+6*智能全备+归档日志,每个智能全备都可以直接恢复,支持并发恢复,恢复时间<全备份时间
1*全备+归档日志备份,需要恢复数据时需要回滚上TB的redolog,效率极其低下
单表恢复方式
直接从备份数据上抽取需要恢复的表(<=20分钟)
先将需要恢复的表的tablespace和systemtablespace恢复到auxilarydatabase,然后再OPENauxilarydatabase,才能恢复需要的标
单表恢复需要的额外条件
不需要
1.auxilarydatabase服务器
2.auxilarydatabase存储空间
3.需要恢复的tablespace的存储空间
2.2.5管理维护简单方便
SnapAssure配置成为后台系统,自动运行,不需要额外的维护操作,提供中文图形界面,界面相似,管理简单。
不需要配置RMAN备份、恢复脚本,通过选择相应的数据库、表空间或者文件就能实现指定方式的备份。
DSGSnapAssure支持多用户管理,可以灵活制定帐号规则,设置密码,修改密码,制定密码安全策略。
该软件同时提供完整的安装、使用与维护手册,通过简单的培训即可胜任管理工作。
普通工程师经过半天的培训即可维护系统、进行日常操作。
我们的备份方案就是,采用DSG公司的SnapAssure备份软件,构架D-D-T的系统结构进行数据备份
2.3备份方案推荐采用“SnapAssure备份软件”
通过采用DSGSnapAssure解决方案,客户可在其关键的Oracle数据库备份恢复系统上获得巨大收益:
(1)备份数据的备前验证和备份后可打开验证,确保备份数据一定可以恢复(唯一支持)
DSGSnapAssure在全球独家提供了对备份数据的数据流和日志流提供全面的正确性验证,这种备份之前的验证技术,可以检查出数据库本身是否有故障;同时,DSGSnapAssure独家提供了以数据库直接打开的方式来验证已经备份了的数据的可恢复性,这个技术解决了传统备份难以验证备份对错的全球难题。
(2)智能合成全备份技术,大大缩短恢复时间(速度最快)
SnapAssure-DC采用资源需求优化技术和单版本恢复技术,避免了传统方式在恢复上的性能瓶颈,使得恢复性能与备份性能相当。
(3)Oracle直接单表恢复(速度最快)
传统技术无法提供大量逻辑错误(如:
人为误操作和应用程序错误造成的Table损坏、记录丢失等情况)的有效恢复支持。
而SnapAssure-DC的智能数据存储技术能够在物理备份上提供逻辑(表、记录级)的恢复功能。
(4)30分钟完成1TB数据库的增量备份(速度最快)
SnapAssure提供了Oracle专用备份接口,支持无需扫描的增量备份功能,使得增量备份的时间大幅度缩短,1TB的数据库增量备份时间可控制在30分钟左右。
(5)支持OracleNoArchiveLog模式下的在线热备份(唯一支持)
在实际应用中存在着许多OracleNoArchiveLog模式,而对于传统的备份软件这种模式是无法实现在线热备份的。
SnapAssure-DC能够支持该模式的在线热备份,让企业既享受了NoArchiveLog模式的优点,又避免了其安全性不足的缺点。
(6)降低存储空间75%
采用磁盘阵列作为备份介质,人们最关心的是磁盘阵列的成本。
而SnapAssure-DC采用压
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DSG 数据 集中 备份 技术 建议书 云南 电信
![提示](https://static.bdocx.com/images/bang_tan.gif)