智能运维解决方案:TOC -IT技术运行中心

TOC--IT技术运行中心(Technoical  Operation  Center )是网利友联在多年运维经验基础上,全新打造的一套综合智能运维解决方案。


  运维现状


运维行业经过几十年的发展,基本上每个用户的信息中心都已经建立了一套完整的运维体系,这其中不乏最重要几个部分:人、物、数。业务在变,运维目标也在时刻发生着变化。如今的运维体系现状是有团队、有工具、有数据。但是面向智能运维生态的发展趋势,面对大数据分析计算场景,缺少的是数据汇聚、数据融合、告警关联分析、数据统一展现等。总结起来就是整个运维环境中缺少最具有价值的“连接者”角色。而TOC在整个的智能运维生态中扮演的就是数据连接者的角色。


TOC.png


面对工具多样性,告警源多样性,数据多样性,团队协同工作的场景,TOC方案提供了边融合、边迭代的解决方案。通过“松耦合”的方式持续融合专业的运维工具、数据、流程、持续优化运维数据共享、团队协同、资源优化的一体化运维效果。


运维大数据融合分析


工欲善其事,必先利其器。数据是一切智能运维的根基。要想智能运维方案落地,必须有强大的数据做支撑。而TOC通过丰富的数据接口,负责将Zabbix、Nagios 、Tivoli等主流开源和商业监控平台的告警数据整合,快速接入到TOC技术运行平台。通过智能算法压缩告警数据 ,全程统一采集,统一存储,统一展现,从而能够杜绝数据孤岛,提高运维尤其是异常处理的效率。并且可以通过全局的数据统计评价各告警源的规范性,各类服务响应的SLA水平,发现运维服务瓶颈,优化服务资源匹配。

同时,配合专业的基础IT数据监控采集工具BSM,TOC+BSM的数据采集加汇聚组合,绝对是智能运维的一把利器。


告警全生命周期管理与事件工单流程



TOC一站式解决所有的监控告警问题:


TOC对接各大主流监控工具可在一个平台中接收所有监控系统的告警,让运维人员集中处理IT事件,避免多平台切换,通过智能算法将告警压缩合并,为运维人员提供分析、甄选之后的最重要的告警。


TOC 作为汇聚多个告警源的集中告警服务台,与ITSM 工单流程统一对接,不仅避免各告警工具分别与ITSM 对接,而且能够从更高维度实现告警响应能力的统筹管理,能够从更高维度支持多个关联告警的合并开单,提升服务管理效率。


TOC 平台支持和流程工单系统进行对接,实现手动派单和自动派单的自动化流程,同时支持多维度的工单统计信息,为IT运维持续优化提供依据。

 

服务台已确认告警统计.png



工单处理情况.png



灵活的排班和告警分配策略


TOC提供灵活的告警分派策略,可以将不同级别的告警分配给不同的运维人员。 运维团队可通过排班机制建立起 7 x 24 小时的应急响应机制。 在合适的时间,把告警推送给最合适的人员,随时查看已处理和未处理的告警情况。通过告警排行分析,可以了解哪些应用、 哪些告警是频发的,作出针对性的解决方案。

创建灵活的排班规则,把您的运维团队更有效地管理起来。一线二线运维团队分工协作。可以了解大到团队、小到个人的工作效率、解决能力。 通过对告警压缩的分析,可以发现产生告警风暴的原因,优化告警规则,提高处理效率。