首页 > 运维 > Linux > 二进制方式部署配置prometheus-webhook-dingtalk+alertmanager自动告警
2020
01-17

二进制方式部署配置prometheus-webhook-dingtalk+alertmanager自动告警

1.Alertmanager 安装

<1>. 下载Alertmanager

<2>. 启动Alertmanager

<3>.创建Systemd服务启动alertmanager

启动

也可以nohup启动

<4>. 查看Alertmanager运行状态

<5>. Prometheus中配置Alertmanager

修改prometheus.yml,配置alertmanager的地址。

配置后重启prometheus

至此。prometheus产生告警后将会发送给 Alertmanager 。

2.安装prometheus-webhook-dingtalk

prometheus-webhook-dingtalk, version 1.4.0 安装记录

<1>.获取 prometheus-webhook-dingtalk 安装包

<2>.解决依赖

(1)yarn

(2)go 环境依赖

(3)node.js 版本

node.js 要求版本大于等于10

<3>.进行编译安装

编译完成后进行如下操作

踩坑备注

<4>.配置prometheus-webhook-dingtalk

(1).钉钉创建机器人自定义告警关键词并获取token 和 secret(加签)不必设置关键词,三种方式任选一种即可

(2)创建配置文件config.yml (创建之前备份下默认的配置文件)

(3).创建模板文件 (默认模板是default.tmpl,我这里自行创建一个)

模板1号

模板2号

<5>. 配置prometheus-webhook-dingtalk启动文件

<6>.配置altermanager配置文件

配置文件

重启alertmanager

curl测试发信到钉钉(复制下面第二第三项)

钉钉接收到消息说明成功了。(先不管消息为空的问题,这是因为接收参数问题)

3.接下来配置prometheus告警规则

修改prometheus的配置文件prometheus.yml

在rules目录中添加.yml结尾的规则文件,prometheus会根据这些规则配置文件进行监控报警。

相关监控模版:

模板参数大致解析:

node_alived.yml ( 实例存活告警规则 )

memory_over.yml (内存报警规则)

cpu_over.yml ( CPU报警规则 )

disk_over.yml (磁盘使用率报警规则 )

登陆prometheus的UI界面,查看Alerts规则

  • Inactive:没有触发阈值
  • Pending:已触发阈值但未满足告警持续时间
  • Firing:已触发阈值且满足告警持续时间

这里说一下触发告警的原理:

最后编辑:
作者:shooter
这个作者貌似有点懒,什么都没有留下。