业务性能管理监控方案.docx
- 文档编号:23190578
- 上传时间:2023-05-15
- 格式:DOCX
- 页数:10
- 大小:123.93KB
业务性能管理监控方案.docx
《业务性能管理监控方案.docx》由会员分享,可在线阅读,更多相关《业务性能管理监控方案.docx(10页珍藏版)》请在冰豆网上搜索。
业务性能管理监控方案
金融行业
业务性能管理监控方案
以奕信息
2015/03/09
1.IT运维现状
近年来,各金融企业的IT系统发展朝着集约化、高效化的方向发展,伴随着各种复杂的应用对IT系统的支持要求越来越高,IT系统规模越来越大,架构也越来越复杂,IT系统的后期维护管理显的越来越重要。
传统的IT维护管理方式已经无法满足现有IT系统与信息化建设的迫切需要,同时在管理大量分布在不同地理位置的IT设备,也会大大增加故障的发现与响应时间以及运维成本。
那么如何通过引入新的运维思路、方法并在保证IT系统与应用稳定高效运行的前提下,减少运维支出,提升服务质量是急待解决的问题。
传统的运维方法造成了各运维部门之间的运维管理是割裂的,出现业务故障时,应用管理人员只能通过服务器性能状态收集,大量的交易日志来排查问题,但无法定位非服务器外的问题。
网络管理人员通过应用管理的人员的交易故障描述排查网络问题,通过自身的网管平台进行配置梳理,网络设备日志查看、网络延迟测试、端口流量带宽跟踪等手段来定位网络故障,实际上很难定位问题,在遇上棘手问题时,网管人员都会使用网络嗅探技术来抓取交易的网络原始数据包进行分析,但其难度更大,首先要求网管人员对TCP/IP协议组的技术理解要高,要有日积月累的抓包分析经验,第二对业务交互的特点要了解,如果遇上一些特殊机制的应用,如长连接、多通道交互的应用或者多通道异步应用,通过大量数据包的查看,定位问题的效率很低,而且往往有时也不能精准定位。
要求网管人员对生产业务系统都要有很好的理解,也不太现实。
所以如何将网管人员和应用管理人员的运维工作通过一套监控系统来联系起来,简化生产运维工作,提高服务质量管理,避免部门间互相推诿责任的现象,是我们企业面临的真正挑战
2.方案思路
为适应各金融企业大规模集约化运营管理的需求,解决IT运维中专业事件
处理量大、业务影响分析困难、故障根源定位慢、故障节点难以自动隔离恢复等问题。
为此,我们提出面向业务应用交易的运维监控系统的搭建,通过实时跟踪
业务交易的四大性能指标(带宽、交易响应时间、交易请求量、交易响应量),
多个业务纬度(业务子交易类型、交易请求码、交易返回码、客户交易区域码)
来及时地掌握业务应用系统的运行情况。
面向交易的应用监控系统有如下特点:
面向服务的性能监控,深入服务组件
同时关注业务性能与网络性能
贯通面向服务的完整路径
支持多中心监控,实时监测组件跨中心切换
实时性高、符合面向服务架构的敏捷原则
纯旁路监控,无需Agent,对服务和网络无影响
实施简单,快速实现SOA台理中的性能管理目标
3.方案架构
EstopBPM基于网络数据包嗅探技术,通过先进的协议解码技术,充分利用可靠的网络数据源,在端到端的整个业务交易路径上通过Tap方式或端口镜像旁路的方式将网络流量引流到Estopflowsensor,EstopBPM后台监控系统实时提取各网络节点Sesor上的数据进行分析,呈现以业务为中心的各项性能监控指标,帮助企业IT部门建立自主可控的应用性能管理平台,从而实现应用可用性、
性能、负载量的全面可视化
曷獻眄■务善
乩■也册■
BPM
^^sensoi1
辂由嚣■:
多台)
业务代碎级曲析
BP怕分析平台
应用朋等葢:
多台)
1F-ITE
最大响应时间超阀值告警
业务响应成功率低告警
•nt1?
⑴
k-4il1k
■■■MbT
.”2.-■砂■•!
:
IMMF1-MHIlJBffTW.■*SMM
•"科
告警功能处于任何监控系统的核心位置,告警系统的优劣直接导致了运维人
员处理故障的效率,EstopBMP告警功能实时收集不同网络节点的三个纬度告警(带宽、业务最大响应时间、业务响应成功率),帮助运维人员通过业务交易的实时告警可知告警发生物理位置,告警内容,以及告警级别。
4.2业务系统网络拓扑呈现
通过交易应用的访问关系,梳理出交易的网络访问路径图,对理解业务流访
问关系,故障定位有很大好处。
4.3实时监控业务四大性能指标
431业务响应时间(最大|平均)
|实时统计业务最大|平均肩应时间(时间精度每秒)
实时追踪每一秒钟最大炯应吋问的交易信息
实时展示跨越各网络节点的交易时延,并进行比对分析,充分反映网络交付
时延、服务器处理时延、网络设备处理时延的变化
432业务带宽统计
监控业务实际所占网络带宽的变化,跟踪带宽负载,并为带宽扩容等需求提供依据。
433交易请求量,交易响应量
实时统计每秒的交易请求数、交易的应答数,跟踪每秒交易请求响应的变化,
查看每秒交易不成功的原因,如下图所示:
此功能的最大价值:
快速定位网络故障
快速定位应用故障的能力
适用于多种网络场景
如:
比对每秒防火墙前后、负载均衡器前后、通讯网关前后的交易请求、应
答数目,快速定位网络设备故障、服务器无响应故障等。
适用于多种业务场景
如:
监控TCP长连接,多通道应用交付,监控异步非对称路径的应用交付
4.4实时业务统计
实时统计业务各交易子类型、交易返回码、交易金额等多维度的统计
4PM
Hug亍4阿
EMM
nan
Mfl
K»
Mt1
WO
井
p
li
・1
|-
|f
I
9Q
■
i
IfettU昶*MHt
3>
J0
j|i
r
■I ・u • 0> i t0 o> i 宜* £ an 1 * mfi I- tii * H 1 ■ &6*•0**01 tD Q i •EDHh抽ft mn Qi tD <& a 1 ■U tt HftkHi|I ◎1 •D H O1 i JiV ■M t0 1 i ” fiJIWtIFlJI——1? IIifI* 4.5历史数据统计分析 对过去历史某一时间段的所有交易性能状态指标进行回溯分析 4.6历史交易查询 按照交易时间、交易子类型,返回代码等多种条件查询业务量,如下图所 示: 提供统计某时间段卡支付交易,返回代码为账户余额不足的交易统计。 4.7追溯每笔交易行为 如下图所示: 根据客户的卡号信息,追溯某客户在某时间点的刷卡交易行为, 记录了两次刷卡行为,第一次未成功,并显示原因,第二次成功。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 业务 性能 管理 监控 方案
![提示](https://static.bdocx.com/images/bang_tan.gif)