文章目录加载中

告警中台设计

# 自定义字段

能自定义告警字段,这些字段来自:告警任务设计中的任务触发告警时,传给中台 API 的参数。

这些字段可以被用来下发通知时,替换消息模板中的变量字段。

# 告警升级

当正式下发的告警没有被「认领」,那么就会触发告警升级。

通过手机或者短信等形式,来触达接受者。

# 告警屏蔽

告警触发后,在修复完成前,可能会重复触发。

此时,屏蔽告警,进行处理即可。

# 告警订阅

向指定用户、群组配置告警触发的途径。

# 告警回调

当告警触发后,向回调地址发送请求。

可以用来自定义统计告警信息。

# 告警收敛

收敛时长:指定时间内,相同告警收敛为 1 条。

收敛的作用:防止同一时间大量相同告警,淹没其他少量但是重要的告警。

收敛升级:当指定时间内的相同告警超过指定数目,立即升级告警。

收敛升级的作用:收敛后,总数量无法展示,无法体现紧急程度。当数量过多,说明是重大问题,应该进行升级。

# 告警恢复

指定时间内,没有相同告警,则发送恢复消息。

有些告警是网络抖动的原因,或者其他偶发性因素,不具备常态。

本文来自心谭博客:xin-tan.com,经常更新web和算法的文章笔记,前往github查看目录归纳:github.com/dongyuanxin/blog