运维监控系统PIGOSS BSM自定义告警策略
对于一个负责运维监控的系统来说,做到7*24小时监控和告警,在一些大的运维系统中,如医院,银行等这种对系统要求特别高的环境中就显的特别重要了。但pigoss bsm 可以提供不同的告警策略,当监控环境中出现告警或者故障时,可以通过声音,邮件、短信等方式通知到用户,帮助用户及时发现和定位问题,从而减少事故的发生。PIGOSS BSM 在监控过程中,不同用户可根据实际工作内容的来建立自己告警策略。
如果不能实现7*24小时监控,会出现哪些问题,我们就拿宕机这个问题来说:
宕机成本 :
如果没有运维监控系统的话,一个企业每年至少会有20个小时的IT停运而且机器停运损失的不仅仅是金钱,停机时间长了将会造成企业直接和长期的成本损失。
当机器停运时:
企业在客户心中的诚信度将处于危险之中,不满意的客户会去其他家或其他地方,可能再也不会回不来了。
企业的负面消息还会得到媒体的关注
之前花费大量的精力所做的努力都将腹水东流。
如果发生重大的停运事故,严重的还可能丢失企业的宝贵数据。
归根结底,如果不利用运维监控系统将公司的IT运维状态监控起来,做到实时监控,这一切都将有可能发生在企业身上,损坏公司的品牌直属声誉。
PIGOSS 提供了多种告警压制机制,用于防止误报以及应对数据抖动比较大的指标,包含告警屏蔽、告警连续性策略、告警间隔策略等。
1、告警屏蔽
屏蔽规则创建完成后,被在规则之中的对象则正常采集数据,但是不会产生告警。
“告警管理”--“告警屏蔽”,进入配置页面
点击右上角的添加按钮创建屏蔽规则,选择需要屏蔽的等级或对象即可
2、 告警连续性策略
设置针对某个采集对象连续多次采集,直到连续N次违反阈值后,才产生一条告警
“告警管理”--“告警策略”,进入配置页面
创建压制规则,选择需要压制的级别、对象及告警次数等
3、 告警间隔策略
设置针对某个对象N次采集,直到总共M次违反阈值后,才产生一条告警
“告警管理”--“告警策略”,进入配置页面,选择相应需要压制的对象和规则