中信地产IT运维监控平台
1.1 项目背景
随着视频会议系统、售楼系统、协同办公系统、全面预算系统、财务系统等业务系统相继投入使用,基础网络的不断扩容改造,对IT业务保障的要求就越来越高。目前,中信地产北京总部有13台服务器,13台交换机,全国有26个专线网络和相应的设备,而且规模还在扩大中。IT业务状态涉及到网络、服务器、数据库、应用软件平台等,手工维护只能在出现故障后依次查找各因素,需要较长时间,严重影响了相关业务的正常运行。由于缺乏跨平台的7×24小时网络监控管理工具,无论是日常实时监控还是故障排除,都需要一台一台设备的手工检查,比较耗时耗力,解决问题所花时间较长,而且即便发现异常也很难快速判断对业务的影响。同时没有监控手段,很难预先发现问题并解决,出现问题后去查找并维护会严重影响业务系统的正常运行。
1.2 建设目标
该项目是通过建立统一的技术运行监控平台,实现对网络设备、防火墙、服务器、操作系统、数据库、中间件等IT基础架构进行7×24小时不间断的监控,实现集中的事件智能管理,保障业务可靠运行。通过建设统一的IT运维支撑系统对全网设备进行实时性能监控、对各个硬件和软件运行状态和性能进行集中监视,充分发挥各业务系统的效益,并实现全网统一的故障、告警信息监视处理,快速掌控全网的故障和告警情况,帮助运维人员快速定位故障;进一步,利用收集到的设备信息,建立全网各类网络设备、服务器等资源信息库和配置信息库,通过统一平台连接各类系统,开放相关接口,建立各类系统之间业务流和管理数据流,针对IT运维系统建立平台维护中心。
1.3 项目规模
1.4 方案部署
通过BSM (Business Support Management)监控系统建立统一的技术运行监控平台,实现对网络设备、防火墙、服务器、操作系统、数据库、中间件等IT基础架构的监控,实现集中的事件智能管理,保障业务可靠运行。
1.5 项目实际运行效果
通过BSM (Business Support Management)监控系统建立以中信地产北京总部为核心的信息化监控管理体系。实现对支撑各个业务的IT硬件、软件的自动、实时、主动监控;对系统指标异常情况提前预警、自动通知;同时呈现软硬件与业务的逻辑关联,异常对哪些业务有影响,影响范围和程度有多大。
监控管理子系统主要包括:状态监控模块、告警管理模块、业务拓扑展现模块、自定义Portal展现、管理员权限分配模块。
最终实现了IT基础架构的跨平台统一监控、业务应用的有序管理、统一的事件和报警管理、IT运行维护平台的统一、对特别IT设备及资源的重点监测等。在实际的运行中系统运行稳定,数据准确、告警信息明确、事件通知及时,实现了最初确定的实施目标。
1.6 方案亮点
(1)全面的数据中心监控
监控范围广,监控力度深入,实现了综合运维管理的目标
(2)个性化的自定义拓扑展现
深入的自定义拓扑,使IT运维更加清晰
(3)清晰的业务逻辑关系展现,使故障排查更迅速
把业务与相对于的IT资源进行逻辑关系疏离,当故障发生时,能够迅速判断其影响的业务范围;反之,当发现业务有故障时,能够快速找到故障点。
(4)多用户不同角色和权限的用户管理,使运维更加清晰
通过不同运维人员角色的划分,建立相应的用户,并赋予其不同权限,实现不同用户的不同信息展现和监控策略配置,使运维分工更加明确。