医院系统容灾建设方案.docx
- 文档编号:27909142
- 上传时间:2023-07-06
- 格式:DOCX
- 页数:28
- 大小:1.40MB
医院系统容灾建设方案.docx
《医院系统容灾建设方案.docx》由会员分享,可在线阅读,更多相关《医院系统容灾建设方案.docx(28页珍藏版)》请在冰豆网上搜索。
医院系统容灾建设方案
医院系统容灾建设方案
1、概述
第一医院即河口医院是一所具有光荣传统和历史的军区中心医院,1939年创建干革命圣地延安,前身是“和平医院”。
著名友人、柯棣华等大夫曾在医院工作过。
医院地处市中心,实力雄厚,交通便利,管理规范,设有近40个科室,有高级技术职务人员60余名,博士和硕士研究生40余名,实际展开床位500余张,年门诊量20余万人次。
随着信息化建设的推进,提升工作效率的同时企业对于IT的依赖性也日益增强,说“数据就是企业的生命线”毫不为过,如何对企业的数据和业务进行容灾保护,是当前急需解决的问题,我医院现有oracle、sql等数据库若干,服务于HIS、LIS、PACKS等系统,其中HIS数据库属于核心应用库,要求实现sql语句级容灾,其他各类应用只要实现数据级即可,部分应用可能要求实现持续数据保护,以便在需要时能够恢复到任意历史时刻。
容灾备份及业务连续性管理建设目标至少包括如下几个方面:
业务连续性保障。
恢复时间目标RTO~0,让系统在出现故障后能快速恢复业务系统对外服务。
抗灾难性。
能够做到异地容灾,抵御各种区域的大规模的天灾人祸,便于灾难演练。
安全可信任。
容灾备份系统将会毫无保留的接触及获得用户的所有数据,要坚决杜绝后门,特别是有保密要求的数据及单位,数据的安全性尤其重要。
简单易用。
简单易用是容灾备份建设的必要条件,否则,企业花了钱,没人能很好的用起来。
TCO合理,易用易维护易扩展易升级。
不能简单地追求便宜,最好是适合国人使用习惯的系统。
2、需求分析
2.1需求分析
我医院信息化系统全部为x86平台,通过前期沟通和调研得知,目前需要进行容灾的系统可以分为三类,核心HISoracle数据库、核心应用系统及sql等数据库、需要进行历史数据恢复的PACKS等应用。
目前我医院拥有2个数据中心机房(原机房和现有新机房),两个机房间有可用的光纤链路,要求实现两机房间的容灾备份,需求总结如下:
实时备份
对需要备份的服务器上的数据库和文件进行自动监控,连续捕获和备份数据变化,只要数据发生变化,便实时、准确的备份下来。
RPO=0,保证数据零丢失.
任意回退
当任何一台服务器内的数据库发生逻辑错误时,可按任意操作步数或时间点进行数据快速恢复,回到数据的任何状态,从而能够找回误删或者损坏前的数据。
恢复后的数据要100%可用,确保事务完整。
集中备份
可以将多台服务器上的数据集中实时备份到此容灾备份一体机上。
结构化和非结构化数据区别备份
为了保证数据库的备份准确和可用,对结构化的数据库要通过独立的专用模块进行实时备份,需能进行数据库的任意时间点回退。
不能采用卷复制、镜像以及快照技术。
低耗资源
对主数据压力小,系统采用消息机制,只有在数据发生变化时才触发,只传数据的变化部分
高保密性
采用C/S架构,安全、稳定且保密性强;采用自主开发的特殊动态压缩加密传输方式,保证数据在传输过程中的安全
错峰机制
在系统负荷极大时可以暂停备份或者将数据缓存在本地以免系统瘫痪,当系统负荷下降时备份暂停期间的数据,并重新开始实时备份。
手动、自动接管
灾难发生时一分钟内应用切换的实现,当核心应用系统服务器出现意外宕机时,备份机可以在一分钟之内接管主服务器的IP,提供对外的所有服务,保证了核心业务连续性,可以提供365天7*24小时的业务不间断的保护,同时支持单机及双机集群的接管。
环境支持
为了方便以后业务的灾备扩展,同一软件需要支持主流windows、linux、unix环境下主流数据库(至少包括MSSQL\Oracle\DB2\Sybase\Informix\Interbase等数据库),支持主流的双机集群环境(至少包括MSCS、Lifekeeper、NEC、PlusWell、oraclerac+asm模式的双机)
适应性
为了保证生产业务的正常进行和程序的独立性,不能对数据库做任何添加和修改,不能采用日志重做类技术。
要与数据库是否归档以及表结构无关,且无任何限制。
对数据库的备份要完整:
如TABLES(表)、DIAGRAMS(关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等均能自动备份。
PC端文件容灾备份要求:
实时、定时增量备份:
用户可灵活设置备份模式和策略。
分级压缩:
方便在减少存储占用和降低本机资源占用之间灵活平衡。
数据加密:
支持对备份文件加密存储,防止泄密。
多点同步:
支持多点同步,以便多点共享文档。
映射下载:
支持映射恢复,从哪里来到哪里去,恢复后不改变用户使用习惯。
简便快捷易用。
落地到我院容灾可以总结为下面三个方面:
2.1.1HIS核心ORACLE数据库容灾需求
主要实现ORACLE系统容灾,ORACLE承载着医院核心HIS系统,要求零中断在主机房和同城容灾机房,要求实现同城机房的容灾备份,当系统发生灾难时能够进行自动切换,确保HIS系统的不间断运行,同时要求容灾数据库能够实时提供查询、分析、汇总等服务,以便降低对主oracle的应用负载。
2.1.2应用系统数据级容灾需求
除HIS系统外,我医院还有大量关键应用需要进行数据容灾,以便在发生系统灾难时能够及时恢复,尽量减少数据损失,为了保证这一目标,就不能使用传统的数据备份恢复方式来进行备份,需要进行实时复制来实现,传统方式每天仅有一个数据点,当发生灾难时需要恢复到10几小时甚至更长时间之间,且备份的数据格式不能直接被应用系统识别,必须使用备份软件恢复后才可使用,而实时复制可以保证实时的方式将应用系统数据备份到容灾站点,发生灾难时则可以恢复到分钟级,确保了关键系统的数据安全,且不需要做数据恢复操作,只需要拷贝即可。
2.1.3持续数据保护需求
我医院的部分应用,经常需要将数据恢复到历史版本(例如病人的病历),医生出于各种原因(例如检查、审计等)需要查看历史修改记录,传统的备份或者容灾方案无法实现,这要求我们使用CDP(持续数据保护)技术来保证历史数据的实时回查等需求。
2.2整体设计
根据前期调研和沟通,将当前的it系统分为2个层面进行设计,容灾和容错设计标准如下:
2.2.1容灾设计
所谓容灾,是指针对RTO/RPO,将系统的在线时间为99.99%级别,全年宕机时间小于52.5分钟,实现针对现有系统的数据级和应用级的容灾,可以保证在发生灾难时,快速恢复数据或者业务,区别与传统的数据备份恢复,传统备份每天仅有一个备份点(例如凌晨2点),当发生灾难时仅能恢复到最近的一个备份点,这将使我们丢失10几个小时甚至更多的数据,同时备份的数据需要使用备份软件进行数据恢复,之后数据才能被应用系统使用,RTO/RPO都非常大,而容灾方案进行实时备份,当工作站点发生任何数据变化时,容灾站点都会实时进行备份,换言之如果发生灾难,则可以将数据或者应用恢复到几秒钟之前,且数据可以被直接使用,不需要进行数据格式的转换工作,总结如下:
实时异步复制
实时异步方式,物理链路及容灾站点不应用生产站点,同时可以保证实时备份,RPO/RTo最小,无需做数据恢复。
可实现数据级容灾、应用级容灾、持续数据保护(CDP)
针对不同的需求,能够进行数据级容灾,即只备份指定的文件夹或文件;将用户的应用进行1对1的应用级容灾,当发生灾难时可以实时将用户的应用切换到容灾站点进行访问,无需进行数据恢复;针对特殊应用,本方案可以将用户数据恢复到任意历史时刻,可细化到i/o级别,秒后面6位的时间颗粒度。
此种方案使用于大部分应用,特点是数据丢失(RPO)少,恢复时间(RTO)短,部署灵活方便。
2.2.2容错设计
容错设计,是针对容灾和传统备份恢复而言,即RTO/RPO无限接近零,除容错方案外,其他所有的解决方案都是在系统发生灾难时进行补救工作,尽量减少数据损失和恢复时间,但无论如何,都会产生业务的中断和切换过程,容错解决方案设计可靠性为99.999%,设计目的是阻止灾难发生,可以说是当前IT业界最高等级的解决方案,容错产品能够帮助企业将不同业务系统的核心数据实时集中复制到一个数据仓库中而不用人为过多的干预;能够帮助将企业各种业务系统的核心数据进行集中容灾的同时还构建出企业的数据仓库,让企业利用数据仓库对自己的数据资源够进行进一步的挖掘,分析,实现企业商业的智能决策系统,能够帮助企业在面临IT系统出现故障时不用恢复数据,而是直接将应用程序从容灾数据库中直接获取数据,继续进行正常的生产工作。
这一切都不是想象,数据库容错产品将轻而易举的为您实现这一切。
3、解决方案
3.1HIS数据库(oracle)容错设计
在此,我们提出基于Oracle数据库的逻辑级复制容灾方案,使用MLActive远程复制软件,支持跨平台的远程Oracle数据实时容灾。
能够预防自然灾害、系统宕机等物理故障,快速实施系统切换。
针对实现多种业务系统的集中容灾的需求,我们提出的MLActive软件对多一的数据集中容灾方案。
多对一的软件部署方案需要在每个源端(即主生产服务器)分别部署一个MLActive客户端,只需要在目标端(容灾服务器)部署一个MLActive客户端即可。
3.1.1一对一数据复制方案
MLActive一对一的数据容灾方案常用于企业IT系统核心数据实时容灾,一旦企业生产系统由于意外崩溃导致不能正常进行生产工作,可以将生产应用服务器直接执行容灾服务器继续进行生产工作,不需要进行数据恢复,因为容灾数据库是实时可用的,随时都可以用了进行生产工作。
当生产服务器修复完成后,亦可利用MLActive反向复制将数据恢复至生产服务器,以恢复系统故障前的运行架构。
采用多对一的复制模式,即容灾端基本模拟生产系统环境,硬件配置可减低,标准为生产系统处理能力的一半。
该方案优点为硬件冗余度大,配置简单明了,管理较方便。
远程网络环境“建议”为每条复制线路最低2M带宽。
如果带宽在10M以上,则效果更好。
延迟可基本控制在10秒以内。
3.1.2多对一数据复制方案
MLActive多对一的数据容灾方案常用于企业多个不同IT系统核心数据实时容灾,就是将企业各个生产系统的核心数据集中实时复制到一个大的数据仓库中,即简化了IT系统的容灾架构,也方便了数据管理。
利用MLActive实现多个生产系统的核心数据实时容灾,就是帮助企业建立起了自己的数据仓库,由于该数据仓库是实时可查询的,因此为企业进一步的挖掘数据的潜在价值,实现商业智能分析决策,提供了坚实的数据保证。
3.1.3一对多数据复制方案
MLActive一对多的数据容灾方案能够同时将数据备份到多个地点,能够快速的帮助企业建立多个数据中心,使企业的核心数据有多层保证,在主生产数据库发生故障时,可以直接将生产系统直接切换到任意一个容灾数据库继续进行正常生产工作。
一对多的数据容灾模式除了能够数据库负载均衡的手段外,还能够用于企业政府门的数据分发。
3.1.4级联数据复制方案
MLActive级联的数据容灾模式也能够同时将数据备份到多个地点,帮助也去快速的建立多个数据中心。
这种容灾方案可以方便的建立测试数据库。
3.1.5外挂数据复制方案
采用外挂方式要求外挂服务器和生产服务器在同一局域网内,不过这种方案较其他方案相比效率较低,不建议使用此种方案。
3.1.6方案优势
提高系统的整体可用性
根据我医院的需求和前期沟通,建议使用我公司MLActive解决方案来实现需求,MLActive能够帮助用户提高Oracle数据库的可用性,无论执行计划内停机(系统升级、备份)还是遇到故障引起的非计划宕机(例如硬件故障、灾难、人为错误等),MLActive对数据库的灾备保护和异构迁移能最大限度的减少宕机时间。
提高可用性是减少数据丢失、经济损失和保持生产力水平的关键。
数据实时逻辑容灾
对于大部分公司而言,容灾是一项巨大的工程,意味着高额的资金投入和人力成本。
受到传统复制技术的限制,容灾必须拥有专用的硬件支持和专用的光纤传输链路,容灾距离和系统平台还有诸多的限制。
此外,由于传统容灾系统的目的端数据库不能随时打开使用,不但风险不能评估,而且巨大的投入也得不到回报。
MLActive使用逻辑数据容灾技术,传递交易指令,因此传输数据量很小,保证了在低带宽环境下实现低延迟的数据异步复制,是一种高效且低成本的数据库容灾方式。
MLActive使用标准的IP网络进行通讯,容灾端的Oracle数据库可以部署在本地或远程容灾中心,距离没有限制。
此外,容灾端数据库始终处于打开状态,因此,当生产数据库遇到计划内或非计划停机时,MLActive能够支持前端应用程序快速、无缝的切换到容灾数据库。
与其它基于磁盘或文件系统的物理复制技术相比,不但省略了漫长的数据库recovery和启动时间,而且能够保证100%的切换成功率。
分担主数据库负载
MLActive的复制技术特点决定了目的端数据库始终处于可用状态,对于实时交易处理之外的只读应用,例如历史查询、报表处理、数据备份、统计分析等都可以交给复制的数据库处理。
多种应用也不必在同一个交易数据库上争夺资源和时间窗口。
生产系统运行和维护的压力得以释放,提高了稳定性;不同的应用在各自的数据库上也可以得到分别的优化。
业务数据分发
MLActive支持企业范围内数据分发,从数据生产库实时复制到一个或多个本地或异地的数据库。
MLActive有多种数据分发拓扑结构,一对多,多对一,级联复制等。
数据分发是一种典型的通过部署多服务器、多数据库来分担负载,提高响应速度的企业应用模式。
跨平台数据在线迁移
MLActive支持跨平台的数据传输,复制的源和目的系统可以在AIX、HP-UX、Solaris、Linux、Windows之间任意选择。
MLActive同时支持Oracle9i,Oracle10g和Oracle11g。
对于用户来说,不但硬件平台的选择有很大的灵活性,也可以用MLActive来完成异构平台的数据库升级和迁移工作。
实时复制和批量复制
应用的需求影响着用户使用复制工具的模式,对于容灾和查询应用,连续的实时复制保证目的端数据库拥有和生产系统完全一样的数据状态;而对于定时备份、系统升级和定时分析等应用,用户则希望复制软件做到定时或周期性的批量数据迁移。
在MLActive中批量复制和实时复制是相互独立又紧密结合的两个部分,通过管理员的操控,MLActive完全满足用户在多种应用条件下的需求。
同步数据校验
MLActive提供静态数据校验手段,通过静态校验复制源端和目的端数据,使用者可以快速定位同步错误的位置,以便尽快修复。
交易统计
MLActive在完成实时数据复制的同时,也跟踪到了数据库交易数量的变化,DBA可以随时查询到生产数据库在指定时间段的交易统计结果,通过分析这些数据,DBA能够量化生产数据库压力的变化,从而为数据库的扩容和升级提供了依据。
数据库增强分析工具
MLActive提供了简单实用的数据库工具包,包括日志分析工具、文件分析工具、在线导入导出工具等,工具包能帮助有经验的DBA更深入的分析处理数据库的问题。
实时监控容灾系统的运行状态
MLActive提供了两种图形化的工具来实时监控数据库容灾系统的运行状态:
一种是MLActive产品本身自带基于WEB浏览器的图形化监控管理页面,可以用来监控MLActive软件的运行状态和对MLActive复制系统进行管理和维护;另一种工具是独立的,绿色的免安装的MLActive监控客户端,该客户端不需要部署在服务器上,直接拷贝至window平台,启动MLActive客户端就可以实施监控MLActive建立的数据库容灾系统的运行状态。
短信预警平台
MLActive提供了短信预警平台,利用MLActive产品的短信预警功能,可以自由设置接收短信的人员,当MLActive数据库复制系统出现任何异常时,将向相关人员发送警告短信。
另外MLActive短信预警平台还可以根据客户系统进行深度定制开发,以更好的和客户IT系统进行深度融合。
解决方案兼容性
使用逻辑复制技术的MLActive,其跨平台能力是用户非常欢迎的。
MLActive能够支持不同版本Unix/Linux/Windows系统下的Oracle复制,对于具有复杂硬件环境的企业来说,异构部署可以节省大量的资源,有效降低成本。
不同Oracle版本的支持能力也非常有价值,对于一些7*24运行的Oracle9i数据库来说,MLActive可以帮助它们在线的无缝升级到Oracle10g。
操作系统
数据库版本
数据类型
数据对象
AIX
Oracle9i
NUMBER
Table
HPUX
Oracle9iRAC
CHAR
View
HPUX(IA64)
Oracle10g
VARCHAR/VARCHAR2
Package
Solaris
Oracle10gRAC
DATE
Packagebody
Linux
Oracle11g
TIMESTAMP
Index
windows
Oracle11gRAC
BLOB/CLOB
Sequence
RAW/LONGRAW
Procedure
ROWID
Function
Trigger
Synonym
Javasource
Javaclass
Iottable
3.2关键应用容灾设计
对于关键应用系统的容灾可以从以下两个层面来保证系统和数据的安全性:
3.2.1方案一:
多对一数据级容灾MLCOOPY
此种方案,只需要在容灾站点部署1-2套应用系统即可,主站点数据被实时容灾到灾备站点的1-2套系统上,只关注数据的安全,当发生灾难时,可以将业务数据拷贝恢复到灾难发生的前一刻(分钟级甚至秒级),最大限度的保证了数据RPO最小
如图所示,在需要容灾的应用系统上安装MLsoft,在同城灾备机房的虚拟化平台安装MLsoft系统的控制系统,进行如下工作:
在控制机上注册工作虚拟机、灾备虚拟机
在控制系统上选择需要备份的文件或者文件夹
在控制系统上指定灾备虚拟机上用于存放备份的文件位置
进行首次全镜像
设置带宽限制策略,可以根据时间段对容灾系统使用的带宽进行设置,以保证生产的正常运行,如果带宽充裕也可以不进行限制
定时快照,根据需求对每个虚拟机进行定时快照,保证数据每天除实时复制备份外还有一份定时数据切片,每天最后64个快照副本。
完成设置和部署后,即可通过字节级变化技术,实现数据级的实时异步复制,保证所有数据变化都能被及时备份,一旦发生灾难即可对任意虚拟机进行恢复。
3.2.2方案一优势
MLCOOPY为您提供企业级的连续数据备份、按需恢复服务,让您能简便地将各分节点的数据实时备份到本地或异地的灾备中心节点,并且按需快速地恢复需要的数据,启动业务应用,确保生产系统的业务连续性。
MLCOOPY通过部署在生产系统上的轻量级客户端模块,对要保护的数据进行系统级I/O旁路监听,以细粒度的字节级增量数据捕捉方式,将生产端变化的数据复制到灾备中心并将变化的数据实时地传输到任意距离外的灾备站点,且通过特有的数据序列化传输技术(DataOrderTransfer,简称DOT),严格保证生产系统和灾备中心数据的一致性和完整性。
每时每刻保护您的数据
在任何虚拟机或物理机上,MLCOOPY监控并捕获受保护文件或目录上发生的所有变化,并将改变的字节量通过标准IP网络复制到您选择的任何恢复站点上,最大限度避免数据丢失。
处理和复制正在使用的文件与目录时,无需要求关闭该文件,相关的应用仍然保持在线和活跃运行状态,不会对您的工作有任何负面影响,MLCOOPY无时不刻地保护着您的数据。
字节级增量数据捕获
MLCOOPY以字节为数据捕捉的最小单位,而不是以传统方式上的文件或者块为单位,从而极大地缩小了需复制的数据量,不仅节省了网络带宽资源,也提高了整个灾备系统的效率。
通过旁路式截获生产系统的数据变化,即数据的变化被MLCOOPY截获后,在应用层对变化的数据进行缓冲、压缩、加密、发送、确认,并且可预先限制MLCOOPY可使用的系统资源上限,从而保证了任何情况下不会对现有生产系统的正常运行造成影响,且保证了数据在整个过程中的安全性。
高效的数据传输算法
MLCOOPY优化的传输方式在窄带、远距离、大数据量等各种复杂环境下均有优异的表现,其效率远高于传统的数据传输方式。
并且可自由设置传输带宽高低及使用时段,从而在优先保证带宽用于生产系统业务应用的同时,合理地分配和使用整个系统的各类资源。
全新的系统分层架构
MLCOOPY采用三级分层架构,对生产端(一般也称为源端)、灾备端(目标端)和管理控制端分别部署、综合管理的模式,使安装在客户的生产和灾备系统上的ML更加轻量化,对现有系统影响更低,最大限度的提升了系统性能,提高部署和后期管理的高效性和简便性。
同时,这种架构能够更好的展现相关监控信息,对您所保护的服务器的存储使用状况、镜像状态,登录状况进行分类、过滤和监控,并且在一个本地或远程的WEB管理屏幕中进行显示。
灵活的部署方式
MLCOOPY能够跨平台部署,比如Linux和windows平台生产端统一采用Linux平台灾备端进行数据保护。
比如VMware到Citrix虚拟化平台的数据保护等。
MLCOOPY可以进行多级级联配置,星型配置等,即支持一对一、多对一、多对多以及级联等多种方式的部署;也支持物理机、虚拟机平台(VMwarevSphere、CitrixXenServer、MicrosoftHyper-V)间的混合部署。
图形化管理
通过图形化的管理监控,MLCOOPY对数据保护中的各个状态了如指掌,对各项功能可以进行直观的配置,如复制目录选择、带宽、压缩配置等等。
并可通过实时流量监控图形对数据复制进行实时监控。
3.2.3方案二:
一对一应用容灾MLAvailability
此种方案可以保证关键应用系统环境进行一对一的容灾,即实现每个关键应用系统都有一个对应的容灾系统进行应用级容灾,定位的是将所有应用进行监控和接管,当发生灾难时,系统可以根据策略进行自动、半自动或者手动的方式切换到容灾站点,即可直接接管所有应用,无需所任何的恢复动作,此方案部署后将使我公司的IT应用环境产生质的变化,实现应用双活。
部署模式如下,在同城主备机房都有一套对等的应用环境(可以为虚拟化平台),然后在2个机房的关键应用系统上安装MLsoft,在同城灾备机房的应用系统平台安装MLsoft系统的控制系统,进行如下工作:
首先需要保证在容灾机房有一套虚拟化环境,并且创建与工作站点对等的VM,这些vm将作为容灾站点使用
在控制系统上,注册工作虚拟机、容灾虚拟机
指定工作虚拟机及容灾虚拟机的备份目录
设置应用监控参数,例如主备站点监测时间,切换时间阀值等
挂载相关应用脚本,主要是用于检测除硬件和操作系统外的故障,以便及时切换主备站点
设置带宽限制,根据用户带宽条件进行基于时间的限制策略,保证链路在工作时间内的链路状态,如果带宽充裕也可以不启用此策略
3.2.4方案二优势
MLAvailability提供针对多种应用任何距离内的高可用性服务。
即当生产系统出现异常时,MLAvailability将生产系统上的应用按需自动切换到灾备服务器上,实现应用级快速切换,减少服务的中止时间,保持业务应用的高度可用性。
MLAvailability基于实时数据复制技术,将您的生产应用无缝地动态的切换到灾备中心上,实现业务的连续性。
还在受停机困扰吗?
采用MLAvailability可以监控应用工作情况,自动做出切换选择,以预先设定的灾备中心接管生产服务器,实现业
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医院 系统 建设 方案