数据驱动是智慧运维的根本
伴随计算机技术和互联网的飞速发展以及企业的快速扩张,企业信息化建设得到了大幅度提升。企业IT资源日益庞大,种类繁多。跨厂商跨地域的网络结构日趋复杂,支撑企业经营的信息系统和业务生产管理系统架构复杂,并且不断在快速更迭。
新一代信息技术,尤其是云计算、大数据、人工智能和虚拟现实技术的快速发展,全球迎来了数字化时代。但是IT运维能力的沉淀跟不上 IT 的建设速度,这对于IT运维服务来说,既是机遇也是挑战。
运维服务的发展趋势
随着企业信息化建设的发展,业务系统对 IT 的依赖越来越大。运维工具从最初的奢侈品逐步变成必需品,进而迭代成智能化工具。
1. 奢侈品时代
这个阶段的运维产品价格昂贵,主要是国外知名厂商IBM、HP旗下的产品,只有“有钱”的主才会考虑,需求主要集中在监、管、控。价格昂贵,场景单一是这个阶段运维产品的特点。
2. 专业细分时代
随着企业IT的发展,运维需求不断细分。监管控的需求变成运维领域的三个分支,即使在监控一个方向,也逐步细分成机房监控、基础设施监控、虚拟化监控等不同方向的产品。
3. 可持续性时代
随着运维工具的细分,又出现一些新的问题和需求。比如需要监控的设备厂商繁杂,要求运维工具能跨厂商兼容。又比如IT基础资源的监控和业务进行关联,以业务视角提供给上层进行决策;又比如运维已经不局限在数据采集和发现异常,而是希望在数据采集、发现异常的基础上,还能进行全方位展现和多维度数据挖掘;又比如运维不仅要满足企业当下的需求,还要必须满足未来3~5年企业IT发展可能出现的需求;从盈利模式上,运维服务也需要从成本中心逐步转变成创收盈利中心。
4. 智能化时代
企业信息化建设逐步从信息化向数字化、智能化转型,对运维服务也提出了智能化的要求。运维服务是否可以通过数据挖掘和深度分析给出有价值的信息,提高企业经营效率,降低企业生产成本?运维服务是否可以直接参与决策或者对策略调整给出智能化建议,降低主观因素带来的不确定性?
企业运维场景的痛点转移
随着运维服务的发展,企业运维场景的痛点也进行了转移。认识这些痛点,对于认识未来IT运维服务的方向很有帮助。
1. 从无工具到有工具再到工具太多
显而易见,企业IT运维从开始的无工具、人工看护或者采用简单脚本进行维护,到开源工具、商用工具过渡,进而工具不断细分。这必然造成工具数量繁多、种类复杂。这些工具“头痛医头,脚痛医脚”,缺乏统一规划。一个故障出现,可能会在多个工具中产生告警,这些告警却无法统一呈现。
2. 从无数据到有数据再到数据孤岛
运维工具的发展趋势导致了运维工具产生的数据是零散的、无关联的。数据定义不统一、数据分类不一致,逐步形成了“企业拥有海量数据,但是这些数据互相孤立。数据冗余和重复录入非常严重。这些数据无法进行数据挖掘和深度分析。这些数据对企业来说就是累赘”。
3. 数据和运维场景脱钩
IT基础资源和企业的业务系统没有关联,所以很难判断IT资源告警对业务的影响。当故障产生时,无法判断处理故障的优先级。当业务出现问题时,也无法迅速准确判断具体的故障原因。
4. 运维关联越来越复杂
随着企业IT的发展,业务系统变得越来越复杂,运维工具也越来越复杂,同时运维团队也越来越复杂。企业的运维部门成为企业的鸡肋,企业将为此付出巨大的人员成本,但是又无法收到满意的运维效果。
总之,很多企业的运维现状是有团队、有工具,有数据,但是缺少集中的告警平台、缺少统一展现平台,缺少故障的关联分析。这变成了当下很多企业IT运维场景的新痛点。
智能运维的建设之路
如何利用信息化手段,深度分析和挖掘企业运维数据,实现数据驱动下的价值创新,进而降低企业运维成本,提高企业IT环境可用度,提高企业核心竞争力,成为企业数字化、智能化建设的重要命题。企业智能运维的建设之路是一条自底向上的建设之路。
1. 全面的数据采集
不同阶段上线的运维监控工具将对企业IT环境进行实时数据采集,做到全面的实时监控,这是智能运维建设之路的第一步。运维天生自带数据,其中包括IT资源的实时状态和可用性数据、全面的告警数据和性能数据,业务系统和IT资源的全量日志数据,各种应用产生的应用数据以及业务系统产生的业务数据。
2. 数据关联和重新定义
在规划元数据的基础上,对IT资源进行统一建模,实现数据种类和数据标准的统一。进而完成运维数据的关联,包括数据之间的归属关系、数据和业务之间的关联关系、资源和资源的连接关系、告警和告警的根源因果关系等等。这样原始的数据被赋予了新的含义,为数据的挖掘、分析和场景应用提供了基础。
3. 数据挖掘和分析
数据进行关联并赋予了业务属性,就可以采用大数据分析算法对数据进行挖掘和分析,并结合应用场景,对接不同的上层应用系统,让数据辅助运维策略的调整,代替人工进行决策,实现运维的智能化。
总 结
企业运维的智能化是一个不断迭代的过程。PIGOSS的BSM实现了企业智能运维建设之路中的第一步和第二步。PIGOSS ITSM、资产管理、PIGOSS智能巡检实现了运维场景的闭环和部分智能化。而更深入的企业运维智能化需要大数据分析和更多的AI算法加入其中,结合特定的运维场景才能得以实现。