运维监控系统PIGOSS BSM自定义告警策略

   对于一个负责运维监控的系统来说,做到7*24小时监控和告警,在一些大的运维系统中,如医院,银行等这种对系统要求特别高的环境中就显的特别重要了。但pigoss bsm 可以提供不同的告警策略,当监控环境中出现告警或者故障时,可以通过声音,邮件、短信等方式通知到用户,帮助用户及时发现和定位问题,从而减少事故的发生。PIGOSS BSM 在监控过程中,不同用户可根据实际工作内容的来建立自己告警策略。

   如果不能实现7*24小时监控,会出现哪些问题,我们就拿宕机这个问题来说:

   宕机成本 :

   如果没有运维监控系统的话,一个企业每年至少会有20个小时的IT停运而且机器停运损失的不仅仅是金钱,停机时间长了将会造成企业直接和长期的成本损失。

   当机器停运时:

   企业在客户心中的诚信度将处于危险之中,不满意的客户会去其他家或其他地方,可能再也不会回不来了。

   企业的负面消息还会得到媒体的关注

   之前花费大量的精力所做的努力都将腹水东流。

   如果发生重大的停运事故,严重的还可能丢失企业的宝贵数据。

   归根结底,如果不利用运维监控系统将公司的IT运维状态监控起来,做到实时监控,这一切都将有可能发生在企业身上,损坏公司的品牌直属声誉。

PIGOSS 提供了多种告警压制机制,用于防止误报以及应对数据抖动比较大的指标,包含告警屏蔽、告警连续性策略、告警间隔策略等。

1、告警屏蔽

屏蔽规则创建完成后,被在规则之中的对象则正常采集数据,但是不会产生告警。

“告警管理”--告警屏蔽配置页面

点击右上角的添加按钮创建屏蔽规则,选择需要屏蔽的等级或对象即可


图片.png

2、 告警连续性策略

设置针对某个采集对象连续次采集,直到连续N次违反阈值,才产生一条告警

告警管理”--告警策略进入配置页面

   创建压制规则,选择需要压制的级别对象及告警次数等


图片.png


3、 告警间隔策略

设置针对某个对象N采集,直到总共M次违反阈值,才产生一条告警

告警管理”--“告警策略进入配置页面选择相应需要压制的对象和规则

图片.png