数腾电力行业调度部门指导手册Word下载.docx
- 文档编号:18355088
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:24
- 大小:4.10MB
数腾电力行业调度部门指导手册Word下载.docx
《数腾电力行业调度部门指导手册Word下载.docx》由会员分享,可在线阅读,更多相关《数腾电力行业调度部门指导手册Word下载.docx(24页珍藏版)》请在冰豆网上搜索。
2.2其他问题14
2.3电力行业服务器及业务系统保护现状及未来趋势15
3.电力行业调度机房问题解决方案15
3.1“D5000保障平台”实现一对多应急保护16
3.2“D5000保障平台”能改善备份和恢复机制16
3.3“D5000保障平台”实现服务器的在线迁移17
3.4“D5000保障平台”业务升级和新员工培训利器17
3.5“D5000保障平台”减轻机房工程师的工作压力18
4.“D5000保障平台”应用部署和产品配置18
4.1应用部署18
4.2方案配置清单22
5.调度部门进行方案介绍需要注意的问题25
5.1“仿真平台”和DTS的区别25
5.2恢复和迁移不是同一个的概念26
5.3备份、应急、恢复需要严格区分26
5.4自动接管和手动接管的区别26
5.5工作效率取决于网络和服务器的性能27
5.6保障平台对D5000有没有影响27
6.数腾D5000保障产品特色(我们和传统保护模式的区别)28
1.简介电力行业业务系统介绍和描述
本章主要介绍电力行业的主要业务系统,电力行业的主要业务系统包括D5000(智能电网调度技术支持系统)以及DTS(电网调度员培训仿真系统)、EMS(能量管理系统)、OMS(电网调度生产管理信息系统)等,下面具体描述每个业务系统的组成架构和在电力行业的作用。
1.1D5000业务系统
D-5000平台直接承载着实时监控与预警(新EMS)、调度计划(OPS)、安全校核(SCS)和调度管理(OMS)四大应用平台,对提高电网的调度运行水平、加快调度机构的标准化建设和提高调度业务精益化的管理具有重要而深远的意义,是电网调度部门核心的业务系统。
图1总体结构图
平台包括电力中间件、调度计划应用和调度管理类应用系统,实现了电网运行实时监控、在线稳定性分析、调度业务管理等功能。
子系统包括:
能量管理系统、动态稳定预警系统、广域相量测量系统、电力计划管理系统、调度员培训模拟系统、水调自动化系统、继电保护及故障信息管理系统、调度生产管理信息系统、电力调度数据网络系统、雷电监测系统、电网稳定自动控制装置、微机继电保护装置、电网仿真计算系统、变电站自动化系统、发电厂计算机监控系统等。
1.1.1SCADA系统
SCADA系统(SupervisoryControlAndDataAcquisition系统,即数据采集与监视控制系统)作为D5000系统的一个主要的子系统,有着信息完整、提高效率、正确掌握系统运行状态、加快决策、能帮助快速诊断出系统故障状态等优势,现已经成为电力调度不可缺少的工具。
它对提高电网运行的可靠性、安全性与经济效益,减轻调度员的负担,实现电力调度自动化与现代化,提高调度的效率和水平中方面有着不可替代的作用,它的主要系统模块如下图:
图2SCADA系统
1.1.2FES系统
FES系统是D5000的前置机系统,实现D5000和场站与其他调度中心与外部系统之间的数据采集和交换。
接收变电站的通讯管理器发送的远动信号,前置机处理后发给后台系统。
由前置服务器和数据采集子网段、数据采集接口设备等组成。
前置的基本任务是信息交换、命令传递、规约的组织和解释,通道的编码和解码、采集资源的合理分配。
报文监视和保存、维护界面管理的任务。
具体架构如下:
图3FES系统
1.1.3PAS系统
电力调度自动化系统高级应用系统(PAS)的功能主要是利用调度自动化系统SCADA采集的电力系统各种信息,在实时型和研究型模式下,对电力系统的运行状态进行分析,帮助调度人员了解和掌握电力系统的实际运行状态,预测和分析电力系统的运行趋势,对电力系统运行中发生的各种问题作出正确处理。
PAS在提高电力系统的安全性和经济性方面,正发挥着重要的作用。
1.1.4AGC系统
AGC(系统自动发电量控制系统AutomaticGenerationControl)是能量管理系统EMS中的一项重要功能,它控制着调频机组的出力,以满足不断变化的用户电力需求,并使系统处于经济的运行状态AGC系统。
图3AGC系统
1.1.5AVC系统
AVC是自动电压控制(AutomaticVoltageControl)的简称。
它是利用计算机和通信技术,对电网中的无功资源以及调压设备进行自动控制,以达到保证电网安全、优质和经济运行的目的。
AVC装置的功能是:
装置作为电网电压无功优化系统中分级控制的电压控制实现手段,是针对负荷波动和偶然事故造成的电压变化迅速动作来控制调节发电机励磁实现电厂侧的电压控制,保证向电网输送合格的电压和满足系统需求的无功。
同时接受来自省调度通讯中心的上级电压控制命令和电压整定值,通过电压无功优化算法计算并输出以控制发电机励磁调节器的整定点来实现远方调度控制。
1.1.6DSA系统
DSA(在线动态安全评估和预警系统dynamicsecurityassessment)。
基于电力系统在线数据和实时动态信息,在给定的时间间隔(5-10分钟)内对电力系统做出安全评估,给出稳定极限和调度策略。
以保障电力的安全稳定运行。
1.1.7WAMS系统
WAMS系统(电网广域监测系统WideAreaMeasurementSystem)对全网同步相角及电网主要数据的实时高速率采集。
采集数据通过电力调度数据网络实时传送到广域监测主站系统,从而提供对电网正常运行与事故扰动情况下的实时监测与分析计算,并及时获得并掌握电网运行的动态过程。
具体架构见下图:
图4WAMS系统
1.1.8GIS系统
GIS(地理信息系统geographicinformationsystem)是将电力企业的电力设备、变电站、输配电网络、电力用户与电力负荷和生产及管理等核心业务连接形成电力信息化的生产管理的综合信息系统。
它提供的电力设备设施信息、电网运行状态信息、电力技术信息、生产管理信息、电力市场信息与山川、河流、地势、城镇、公路街道、楼群,以及气象、水文、地质、资源等自然环境信息集中于统一系统中。
通过GIS可查询有关数据、图片、图象、地图、技术资料、管理知识等。
架构如下图:
图5GIS系统
1.1.9IALARM系统
IALARM系统是智能告警系统,架构如下图:
图6LALARM系统
1.1.10监控系统
监控系统主要就是对省网和全网的电厂、变电站进行实时监控,并反馈到图表中,具体见下图:
图7监控系统
图8集中监控
图9省调监控
1.2DTS系统
调度员培训模拟系统(DispatcherTrainingSimulator,简称DTS)是一套数字仿真系统,它运用计算机技术,通过建立实际电力系统的数学模型,再现各种调度操作和故障后的系统工况,并将这些信息送到电力系统控制中心的模型内,为调度员提供一个逼真的培训环境,以达到既不影响实际电力系统的运行而又使调度员得到身临其境的实战演练的目的。
调度员培训仿真系统通过模拟电力系统和控制中心为调度员提供了一个逼真的环境,以便培训在系统正常、故障和恢复情况下的操作。
基本组成部分如下:
(1)控制中心模型(CCM)。
控制中心模型应与实际控制中心的环境一致,并且具有EMS的各种功能。
为达到逼真的效果,SCADA/EMS仿真系统可以模拟在线SCADA/EMS所有的功能,并尽可能地做到一致,包括监控系统和在线应用软件,具有相同的显示、相同的人机界面、实现相同的控制和操作。
(2)电力系统模型(PSM)。
电力系统模型模拟电力系统网络及各种设备的响应,包括网络拓扑、动态潮流、频率计算、稳态计算、继电保护、自动装置、操作培训等模型。
(3)教练员系统(IS)。
教员系统具有监视和控制培训过程的功能,包括初始化参数、调整控制参数、教案管理和制作、仿真过程控制、事件处理和数据申报等功能。
教员系统具有灵活的培训支持功能,教员可灵活的设定各种事件、编制各种教案、建立初始条件进行演示和培训;
培训过程中可方便地进行事件的设置、插入、修改和删除,并具备暂停、恢复、快放和慢放等功能,使教员台操作灵活。
1.3EMS系统
EMS能量管理系统是现代电网调度自动化系统(含硬、软件)总称。
其主要功能由基础功能和应用功能两个部分组成。
基础功能包括:
计算机、操作系统和EMS支撑系统。
应用功能包括:
数据采集与监视(SCADA)、自动发电控制(AGC)与计划、网络应用分析。
1.4OMS系统
OMS系统中文全称是电网调度生产管理信息系统。
是以一体化管理理念为指导,以现代化信息技术为手段,按照“统一工作要求、统一技术规范、统一业务流程、统一基础资料建设”的“四统一”要求,逐步实现电力调度生产的流程化、规范化管理,实现省、地调的信息共享,加强电网调度业务中各专业的协同工作能力,加强省调对地调的专业指导、行政监督。
2.电力行业调度部门机房安全现状和未来发展
电力行业调度机房信息化程度国内是处于领先地位,对核心的业务系统均作了至少双节点的负载均衡或者集群保护。
重要业务系统出现问题的概率很小,但是我们和电力行业调度部门的资深工程师进行业务交流,电力行业调度机房还是有一些安全风险,一旦这些风险爆发,会让调度信息部门处于很被动的局面,严重的事故不但会让领导承担相关责任。
也让调度信息部门造成严重的损失。
这些问题主要分为两部分,一部分可以利用保障平台来解决的,一部分问题是其他方面造成的,需要我们销售去规避。
具体问题分析如下:
2.1电力行业调度机房存在的风险(产品可以解决的)
◆硬件设备老化:
电力机房服务器已经全部实现国产化,硬件设备的一般质保期在5-7年,一旦质保到期,服务器因为长期运行会出现一些问题,一旦设备出现问题,会导致正在运行的业务停顿、数据丢失。
如果出现上述情况,造成的损失是巨大的,难以挽回;
◆负载\集群服务器正在运行期间,如果其中一台出现问题,也能做到业务不中断。
但是在维修出问题的设备的时候,会造成单台运行的负载\集群服务器压力过大,这段时间一旦出现单台服务器的软硬件故障,会导致负载\集群环境彻底崩溃,恢复原生产环境费事费力,期间还要忍受业务中断的风险。
◆硬件服务器出现故障,修复完成后,以前的工作模式是需要重新安装操作系统,请南瑞工程师远程或者上门安装操作系统、业务软件以及数据库,同步备份数据(备份数据是定时的,会造成数据丢失),一般需要3天或者更长时间来恢复环境,如果设备硬件出问题,需要修复硬件或者重新采购设备,恢复时间会更长。
◆业务系统出现崩溃,D5000的采集子平台的服务器出现过瞬间生产压力过大,导致服务器内存溢出,业务环境直接崩溃的事故。
负责全省的采集系统3天内只有一台服务器在运行(正常情况下是两台高性能的服务器负责采集的)。
生产压力很大。
如果在此期间幸存的服务器也出现软件故障,整个甘肃电网的采集工作都必须停下来。
◆业务软件的新版本升级和补丁修复。
电力行业业务软件需要定期打补丁或者软件新功能升级。
D5000平台现在还处于完善阶段,经常需要南瑞工程师现场或者远程升级。
南瑞的工程师在测试环境测试完成以后,直接在生产服务器上打补丁、升级,出现过业务系统因为升级失败导致业务单点运行2天以上的事故。
◆电力行业业务软件众多,信息部门的工程师人数有限,基本上每个人的工作量很大,特别是核心业务只有2-3人来维护。
新入职的工程师很难给出大量的时间去学习,要求快速上手,在测试环境中学习,没有真实的数据,很难达到好的培训效果。
但是在真实的环境下去学习,会对业务环境造成不利影响。
比如数据误删除,误操作导致业务崩溃等。
新员工的业务能力培训是调度部门的一个头疼的问题。
2.2其他问题
◆电力行业对网络要求很高,大区、省、市、县的电网网络是全国统一规划的,一旦出现网络、通讯中断会造成很恶劣的影响,整个大区、省、市、县的网络通讯安全保障其实是电网最关心的问题。
这需要加强电力网络通讯面对自然灾害、以外事故的防范能力。
◆电力行业工作繁杂,大部分工作是一些重复性的工作,这种模式并不能因为数腾产品的介入而避免掉。
这种重复性工作不是机房安全运维的工作,更多是业务之间交互。
2.3电力行业服务器及业务系统保护现状及未来趋势
目前电力行业调度部门的服务器和数据保护方式主要是:
均做双机集群(重要业务四节点以上),定时对重要数据进行备份。
本地硬盘均作了RAID5,同时服务器设备均做了双网卡冗余。
在这种情况下,出现硬件故障一般不会导致业务中断,只是数据保护还处于落后阶段,同时应用保护、迁移、恢复还是采取传统方式。
(定时备份、停机迁移,重装环境)现状下的保护方式会给电力行业调度部门带来很大的工作维护量,同时还不能保证系统安全。
调度部门业务系统现在已具规模,硬件冗余保护已经完成。
后期随着虚拟化的发展,和“绿色机房”的概念的传播。
D5000进行大数据和云平台的整合可能是一个趋势,如果D5000在虚拟化云平台上运行的话,后期应用和数据安全的工作也需要进行专门的保障云进行保护。
传统的保护技术(不针对虚拟化进行保护)和虚拟化自身的保护技术(硬件保护,但是对每台工作的虚拟服务器软件故障无法保护)还是有所欠缺的。
一旦D5000云平台和对应的保障云的上线,可以大大减轻机房软硬件维护量。
同时让机房的服务器、应用环境、数据安全的保护力度再上一个台阶。
3.电力行业调度机房问题解决方案
在第二章我们整理了电力行业机房面临的一些问题和风险,对于这些问题我们已经做了分类,其中大部分问题利用数腾的电力行业的多业务应急平台可以去解决的。
例如:
硬件设备老化、集群\负载设备单机运行期间业务系统安全问题、服务器宕机业务环境的重新部署、业务软件的版本和补丁升级以及业务软件操作人员的培训等。
下面我们针对这些问题,把数腾的调度D5000保障平台特色相结合起来,系统的介绍保障平台怎么解决这些问题。
3.1“D5000保障平台”实现一对多应急保护
可以随机接管机房任意需要保护的服务器,任意一台服务器发生数据丢失等故障时,1-2分钟内就可以快速恢复数据并解除故障。
任意一台服务器发生硬件损坏、业务系统崩溃等故障,通过短暂的判断时间可以通过自动应急接管方式实现业务接管,接管后的虚拟服务器不需要做任何设置,就可以实现业务的接管,整个过程中毋须人工干涉。
一台应急保障设备保护多台服务器。
传统的保护模式需要投入大量的硬件设备和软件做应急接管,投入成本是本方案的3-4倍,机房电力等资源消耗增加5倍以上。
采用一对多的应急保护能够很好的防护硬件老化和集群设备故障导致的业务中断,不但能起到快速应急的作用,同时对机房排错赢得了宝贵的时间。
3.2“D5000保障平台”能改善备份和恢复机制
保障平台提供操作系统、应用系统与数据(数据库、文件等)的一体化整机实时备份功能,可实现对需要保护的整体数据的服务器(操作系统、业务系统、数据库、文件等)进行实时备份保护。
采用磁盘块级复制比传统的文件级备份提高了5倍以上备份效率,实现备份数据的分钟级验证(1-2分钟内)以及分钟级恢复(1-2分钟内)功能。
不仅几秒钟就能恢复单个数据,也可以几十分钟就可以完整恢复一个应用和数据(千兆网络每小时恢复300G的数据),立即启动就可以使用,可彻底改观传统恢复漫长局面。
机房内一旦硬件服务器宕机的情况,传统的重建环境方式不但时间长,而且还需要业务厂家现场支持(电力行业核心业务不允许远程),利用整机恢复技术可以摆脱长时间停止业务的不利局面和对业务厂商的依赖。
3.3“D5000保障平台”实现服务器的在线迁移
平台提供了Windows、Linux等操作系统和电力行业目前所有的业务系统的快速迁移工具,可以帮助用户快速实现老旧服务器的更替,实现异构服务器(不同硬件品牌)的迁移工作,同时平台工具也支持物理服务器到虚拟机、虚拟机到物理服务以及各种虚拟化系统间的平滑迁移(P2P、P2V、V2P、V2V),以上迁移工作在千兆网络下每小时迁移300G的数据。
目前主流的迁移工具在迁移过程中存在迁移成功率低(60%左右)、迁移时间长(每小时基本上在100G左右)、
迁移效率低下等。
3.4“D5000保障平台”业务升级和新员工培训利器
电力行业的业务系统版本和补丁升级在原机直接升级是被禁止的,所以一旦开展版本升级和业务打补丁的工作时,均需要搭建和原生产环境一模一样的业务测试环境,在测试环境进过测试成功后,在生产服务器再做升级的工作。
这种方式存在两大弊端:
A、测试环境需要去手工搭建,费时费力,同时还不能保证搭建的环境和生产环境一致。
测试环境测试没有问题,生产环境升级失败的案例层出不穷。
B、生产环境运行稳定,如果直接在生产环境进行版本升级,有极大的可能性会破坏这种稳定性,会使生产环境处于一个危险的环境下运行,增加给生产造成损失的可能性。
本平台能够在机房构建一个和机房一模一样的“影子机房”,里面业务环境和数据都是生产环境最真实的模拟,在不影响生产环境和数据保障的情况下,在“影子机房”对生产环境进行业务升级,然后把升级后的业务环境平移到原生产环境。
大大的提高了版本升级的成功率;
调度机房的D5000业务子系统众多,每个业务系统的维护量很大,但是机房运维人员有限,怎么让新入职的运维人员快速的熟悉业务环境,这是一个长期困扰调度部门相关领导的问题,搭建测试环境让新同事进行业务培训,但是测试环境没有办法完全模拟生产环境,培训效果不如人意;
同样的,贸然的直接让新同事直接在生产环境操作,误操作的风险谁也承担不了。
本平台的出现,解决了这个困扰,我们在平台的演练环境下,独立于生产环境,但是又拥有100%的模拟生产环境,一方面能够让新同事在真实的环境下快速上手,同时也保障了生产环境的安全。
3.5“D5000保障平台”减轻机房工程师的工作压力
本保障平台做为机房的业务和数据运维保障的工具,能够把电力行业的机房运维人员从大量的硬件、软件预警,维护的繁杂的工作中解放出来。
经过我们的调研,电力行业人员有60%以上的时间花费在业务和硬件维护上面。
对于新业务软件学习和机房日常工作的维护工作时间被压缩到很少的比例。
本平台能够代替机房的工程师完成机房软硬件的故障维护以及业务和数据的保障工作。
从而让机房的运维人员有更多的精力去管理好机房,增强机房运维效率。
4.“D5000保障平台”应用部署和产品配置
4.1应用部署
电力行业的调度部门根据业务的分类和重要程度,把机房分为三块区域,每块区域之间通过专用的通道进行信息交互。
具体拓扑如下:
图10调度部门的网络拓扑
和调度部门运维人员进行讨论,由于每个区域不允许建立新的通讯通道,同时为了保障原有网络通信安全。
建议分区进行保护,对调度1区、2区、3区进行分区保护,在每个区域进行保障平台部署。
同时经过对调度机房进行调研,调度部门已实现全国产化,服务器均采用曙光服务器,应用系统采用国产麒麟操作系统,数据库采用了人大金仓数据库。
整体业务均放在南瑞的D5000的大平台上。
整体环境存在以下特点:
◆服务器配置好,所有服务器均采用曙光高性能服务器。
一旦上线保障平台,就要考虑采用高性能设备进行保护;
◆所有服务器均作了网卡聚合技术,同时为了多区业务通讯通信,部分服务器至少存在三个网段以上的地址。
网络环境复杂。
要求保障平台提供多网卡的设备(应急设备至少满足四块网卡)。
◆部分业务环境负责全省的业务调度,工作压力很大,对于此类服务器,保障平台上线要考虑到合理的资源分配。
基于上述考虑,厂家建议的部署方案是,采用高配、多网卡的设备分区进行保护,部分高业务量的服务器进行应急设备的资源重点分配。
只有这样才能够满足调度部门的业务需求。
具体保障平台部署拓扑如下:
图11调度一区部署图
图12调度二区部署图
图13调度三区部署图
通过对每个调度区域进行部署多保障平台集群,可以保障每个区域的服务器的业务和数据安全,做到RTO和PRO趋近于0,能够做到业务不中断,数据不丢失。
同时还能给客户带来运维上的便利,例如业务升级和新员工培训,每个调度区域配备至少两台设备(64G以上内存、4路8核CPU,4个千兆网卡)。
本方案考虑到了机房业务增长,具有很好的扩展性,后期还可以做成保障云。
4.2方案配置清单
最佳配置:
产品名称
配置型号
产品参数
数量
D5000保障平台
ET-8800-ST
硬件模块:
标配裸容量32TBSATA企业级硬盘;
3U机箱16盘位;
双冗余电源;
2个千兆网口;
标配32GB内存;
2颗至强六核处理器。
软件模块:
标配16个授权点,单台最大支持24个授权点,支持集群管理,最多支持384个授权点;
最小数据同步间隔10秒;
最大快照数256个,应急虚拟机最大支持16核,应急虚拟机内存支持32GB,单设备支持5台服务器同时接管应急。
6台
内存
建议扩到64G内存
CPU
2颗16核或者4颗8核处理器
网卡
增加2颗千兆网卡
软件模块
对数据库,文件,邮件,操作系统,应用程序等进行一体化实时备份,支持业务快速接管应急。
待定
备注
显卡
工作站需要显卡支持,调度部门至少是双屏的,所以至少需要2块显卡。
显卡参数待定。
2个
标准配置:
ET-6800-ST
标配裸容量24TBSATA企业级硬盘;
2U机箱12盘位;
标配12个授权点,单台最大支持18个授权点,支持集群管理,最多支持216个授权点;
最大快照数128个,应急虚拟机最大支持16核,应急虚拟机内存支持32GB,单设备支持5台服务器同时接管应急。
5.调度部门进行方案介绍需要注意的问题
由于电力行业调度部门是一个新的业务增长点,在技术人员和客户交流中发现,电力行业有自己的一些特殊之处,可能和我们面对政府、公检法等行业有一些不同。
如果在这些方面和客户交流不到位的话,可能会影响到后期的项目进展。
现在把这些问题列举出来一起分享。
5.1“仿真平台”和DTS的区别
调度员培训模拟系统(DispatcherTrainingSimulator,简称DTS)是一套数字仿真系统是电力调度系统为了让调度员快速熟悉流程的一个培训平台,它高度仿真调度业务
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电力行业 调度 部门 指导 手册