NDC平台支撑管理系统需求.docx
- 文档编号:2883915
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:10
- 大小:244.16KB
NDC平台支撑管理系统需求.docx
《NDC平台支撑管理系统需求.docx》由会员分享,可在线阅读,更多相关《NDC平台支撑管理系统需求.docx(10页珍藏版)》请在冰豆网上搜索。
NDC平台支撑管理系统需求
NDC平台支撑管理系统需求
为更好的推进NDC平台建设,确保NDC平台的可控可管理,现结合业内云计算的发展现状与趋势,依据网络运维管理需求,提出NDC平台的支撑管理模块功能需求如下。
一、总体目标
为实现NDC平台的可运营目标,应首先确保NDC平台的可控可管理,因此应建立强大的后台支撑管理系统,以实现对NDC平台从资源层到业务层的整体可知可控可管理。
近期目标:
支持跨平台,以业务为中心,可对网内资源及业务(物理主机、物理存储、云主机、云存储等)进行图形化的配置与管理,实现资源与业务的有效关联,为维护提供智能化信息支持;初步具备对网内资源、网内流量、业务实时监测与调控以及历史数据分析功能。
远期目标:
全面支持NDC平台所承载的各项业务,为承载业务提供强有力的保证;建立实时高效的流量监控与调度体系,实现对平台流量的灵活科学调度;对业务及资源数据进行深层次分析,为平台、业务规划及优化等提供决策支持;
二、总体原则与需求
1)技术原则
◆独立性原则:
系统所采用的技术应不偏向任何一种网络或设备,应采用标准的协议,而不依赖于某些厂商的特殊协议技术;
◆模块化原则:
系统各模块相互集成,各个模块的安装和卸载不会影响其它模块和系统的运行及功能操作;
◆一体化原则:
各功能模块紧密集成、无缝连接,统一对外提供服务;
◆安全性与可靠性原则:
系统具有很强的安全与容错性,硬件设备应持支持分布式多处理机结构,主要设备应采用双机热备的工作方式,软件系统各模块应支持自动切换,保障系统的高可用性与不间断运行,以维持和提高平台运营水平;
◆开放性原则:
应支持业内主流硬件设备,支持业内主流虚拟化与云计算技术;
◆适应性原则:
现在实施的系统既要满足现有的资源管理、业务管理的要求,又要能够满足今后大规模、大容量、高业务量运营的需要;
◆先进性原则:
采用先进的技术,使系统的建设能处在同类科技的前列;
◆灵活性原则:
系统能够适应网络和业务的发展,灵活地设计、调整业务处理流程和组织结构,适应未来的发展变化;
2)系统管理及部署原则
◆系统依据现有互联网管理原则,即集中分布式原则,总部负责整个NDC的管理,各省分公司负责本区域的平台管理:
具体形式为铁通30个省分公司通过部署在当地的网管终端,以WEB方式访问管理支撑系统,并以分级分权的授权方式,管理本区域平台;
◆系统部署原则:
服务器及采集机均部署在总部,后续根据平台发展情况,可将采集机部署至各地;
◆系统利用互联网网络,实现带内管理,具体见下图:
NDC平台管理支撑系统拓扑
3)管理范围及能力
对平台内全部硬件及软件的监控与管理,具体为可支持1000台物理主机的监控与管理,支持5000台虚拟机的监控与管理,支持10000T存储的监控与管理,支持基于100G流量的监控、分析与调度。
后续应能支持到存储数据达到1PB级,支持的文件数量规模达到10亿级,单区域服务器规模在达到万级。
三、支撑管理系统功能需求
支撑管理系统应采用模块化设计,实现对平台内物理设备、逻辑设备及业务的监控与管理,同时对外提供各类接口,建议系统功能架构如下:
建议系统软件分为数据采集接口层、业务功能层、展示层,具体如下:
1)拓扑模块
拓扑模块实现对平台资源及运行情况的实时直观展现,提高监控效率,辅助后续平台的优化。
具体为:
⏹支持基于web的拓扑展现;
⏹支持直观展现各项资源的部署,各项资源的性能,如物理机的部署,物理机的性能等;
⏹支持多视图的拓扑展现,如单独基于物理资源的拓扑,单独基于虚拟资源的拓扑,单独基于内容业务的拓扑,基于单个域的视图等等;
⏹支持各资源间对应关系的直观展现;
⏹支持各项指标的预警展现。
2)系统运行监控模块
系统运行监控模块依据用户级别以图形化方式实现对不同资源及业务的实时监控。
具体为:
⏹实现物理主机、物理存储的运行及使用情况进行监控,包括CPU、内存、硬盘、关键进程、IO操作、系统切换、网络流量等;
⏹实现对云主机、云存储的运行及使用情况进行监控,包括CPU、内存、硬盘、关键进程、IO操作、系统切换、网络流量等;
⏹实现对不同内容源流量的实时监控;
⏹根据上述指标的阀值进行实时资源与业务的关联预警与告警;
⏹支持基于snmp、syslog、agent等多种方式产生的故障信息,支持故障的分级、去重、升级等操作。
3)资源管理模块
资源管理模块实现对物理资源、虚拟资源、业务资源的增加、删除、查询、信息修改等功能。
具体为:
⏹实现物理机资源的增、删、改、查功能;
⏹实现虚拟资源(云主机、云存储)的增、删、改、查功能;
⏹实现内容源信息的增、删、改、查功能;
⏹实现各类资源阀值的设定;
⏹实现各类资源的状态设定,如定义物理机处于检修状态、云主机处于暂停状态等;
⏹实现各类资源对应关系的映射,如内容源对应哪些云主机,对应哪些云存储,对应哪些物理机及存储;
⏹云主机及云存储模板管理,包括添加、删除、修改、复制等功能;
⏹镜像文件生成工具,供用户生成镜像文件,以方便云主机操作系统和应用软件的安装。
4)业务管理模块
业务管理模块实现对各类业务的后台开通、调整、撤销管理,具体为:
⏹实现云主机的创建、启用、停用、扩容、删除、迁移等功能;
⏹实现云主机建立及安全备份策略的创建、修改、下发等功能;
⏹实现云主机的在线访问功能;
⏹实现云存储的创建、启用、停用、扩容、删除、迁移、手工备份、恢复等功能;
⏹实现云存储分配及备份策略的创建、修改、下发等功能。
5)流量管理调度模块
由于采用云存储技术,同一份数据会在不同节点存放,因此在提高数据稳定、安全的同时,也为用户提供最近访问应答提供了可能,如同一份数据同时存放在北京、广州各一份,可由北京节点响应北方用户请求,而广州节点则响应南方客户请求,充分利用资源的同时提高用户质量。
远期需求:
后续NDC平台将对内容进行整合,以统一的云存储、云计算网络进行业务承载,平台直接响应用户访问请求,实现自主的网内流量调度,因次后续应具备以下功能:
⏹应用级流量调度总体说明
1)SP流量调度说明
SP流量调度示意图
2)NDC流量调度说明
NDC流量调度示意图
⏹用户属性管理模块
将用户请求依据不同内容资源部署情况,根据地域或其他因素进行不同分组管理;
⏹流量分析模块
针对不同内容源进行流量分析,按照用户分组进行统计,实现各省用户对各内容的访问情况,为流量调度及平台优化提供基础;
⏹网络负载分析模块
针对全网链路负载进行集中分析,实现对流量进行模拟分布;
⏹流量调度策略管理模块
流量调度应依据网络现状、云主机、云存储状态/性能、用户流量等因素进行综合分析调度,流量调度策略对应不同的流量调度算法,支持针对不同内容源可采取不同的调度策略,如最近访问原则或流量均衡原则等等;
⏹流量重定向模块
针对镜像网站的重定向:
网站源站将请求重定向至NDC平台后,流量管理调度模块应支持根据不同策略运行不同调度算法,根据结果将请求二次重定向至网内最优资源。
针对分光缓存的重定向:
各出口通过分光缓存的内容应通过NDC平台实现共享,建议在缓存服务模块内也设立重定向功能,将本地没有但网内其他缓存有的资源重定向至NDC平台,进而指向网内其他缓存。
初期需求:
根据业务规划,初期流量调度模块基于虚拟机进行流量调度,因此建议流量管理调度模块具备以下功能:
⏹网络级流量调度说明
网络级流量调度示意图
⏹流量分析模块
针对不同内容源进行流量分析,实现各省用户对各内容的访问情况的统计与分析,为流量调度及平台优化提供基础;
⏹网络负载分析模块
通过接口实现骨干网链路信息的采集,针对全网链路负载进行集中分析,实现对流量进行模拟分布;
⏹流量调度模块
提供与业务管理中虚拟机迁移的接口,以流量分析与网络负载模拟情况为基础进行虚拟机的迁移,实现流量调度。
6)系统管理模块
系统管理包括用户管理、日志管理、公告管理、计费管理等模块。
⏹系统用户管理
支持完备的权限管理,实现系统用户的注册、信息查询与修改、权限设定等功能,具体系统用户可分为三种角色:
超级系统管理员、NDC平台操作员、普通用户。
用户权限的设定以NDC平台功能为基础,依据功能划分,如超级系统管理员可以查询所有的资源使用及计费情况,可以对计费标准、资源使用情况进行调整,可创建用户并对其他用户权限进行调整。
系统的云计算平台操作员,负责NDC平台中所辖范围运营的日常操作,包括资源池的监控管理、镜像文件的制作、模板的制作、特殊资源申请的审核等工作。
普通用户,即通过自助注册的用户,当用户自助注册后,系统需要提醒系统管理员进行确认,只有经过系统管理员的确认后,用户才可进行资源的申请、使用及相关信息的查询;
⏹日志管理
日志管理实现对登录日志、操作日志的查看、删除等功能;
⏹公告管理
公告管理实现公告信息的浏览、发布、暂停、删除、修改以及重发等功能;
⏹计费管理
实现对付费方式,计费标准,收费统计的管理功能。
7)数据分析模块
数据分析模块提供相关的统计报表功能,包括各类资源清单、汇总表以及趋势分析等,具体为:
⏹物理机/云主机清单;
⏹物理机/云主机使用资源清单;
⏹针对物理机的CPU、内存、硬盘、IO操作、切换、网络流量进行周期性统计及趋势分析;
⏹针对云主机的CPU、内存、硬盘、IO操作、切换、网络流量进行周期性统计及趋势分析;
⏹平台告警及故障信息的统计与趋势分析;
⏹对流量分析结果进行周期性统计及趋势分析;
⏹针对不同用户进行用户消费行为分析,实现不同用户对不同内容源访问频度分析,访问时间分布分析等;
8)其他
⏹提供与现有网管系统的接口,如告警接口等;
⏹后续为用户提供的API接口及管理。
四、平台性能需求
序号
网管系统的性能指标
数值
备注和说明
1
打开拓扑(全网)时间
<30s
2
打开拓扑(省分)时间
<10s
3
显示设备性能曲线
<3s
4
显示业务流速曲线
<4s
5
流量分析查询时间
<50s
6
调度方案生成时间
<10分钟
7
重定向时延
<1s
8
各类网元轮询遍历时间
<5分钟(每个网元采集10个指标)
9
告警发生到前台展示时延
<30s
10
流量数据从采集到呈现的时间
<5s
11
模块切换时延
<30s
12
云主机、云存储配置及调整生效时间
<30s
13
报表生成时延
<15s
14
管理规模
>1000台设备
>5000台虚拟机
>10000T存储
技术分析处
2009年12月28日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NDC 平台 支撑 管理 系统 需求