参考链接:https://www.cnblogs.com/apnpc/p/13780080.html
名称 | 版本 |
---|
操作系统 | CentOS 7.8.2003 |
Python | 3.6.8 |
1、安装相关依赖
# 安装python3,脚本是基于Python3写的
yum install -y python3
# 安装pip,pip是python的包管理器
##########方法1:
# 下载pip安装脚本
curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
# 运行安装脚本
sudo python3 get-pip.py
##########方法2:
yum install python3-pip -y
pip3 install --upgrade pip
#pip安装加速,国内源安装过慢
[ -s ~/.pip/pip.conf ] && mv ~/.pip ~/.pip.bak
mkdir ~/.pip
touch ~/.pip/pip.conf
cat >> ~/.pip/pip.conf << EOF
[global]
index-url=http://mirrors.aliyun.com/pypi/simple
[install]
trusted-host=mirrors.aliyun.com
EOF
# 安装puthon包
pip3 install configparser
pip3 install requests
# 创建钉钉发送日志文件路径
touch /var/log/zabbix/zabbix_ding.log
chown zabbix.zabbix /var/log/zabbix/zabbix_ding.log
2、配置钉钉告警脚本
(1)钉钉机器人安全配置采用“关键词+加签”
#配置钉钉告警配置文件
[root@Linux191 ~]# cat /etc/zabbix/zabbix_ding.conf
[config]
# 日志文件路径
log_path=/var/log/zabbix/zabbix_ding.log
#钉钉机器人 webhook 值,替换成自己的机器人配置
webhook=https://oapi.dingtalk.com/robot/send?access_token=xxxxxx
# 安全设置 -- 加签
secret=xxxxxxx,替换成自己的机器人配置
#更改zabbix_ding.conf文件权限,可防止钉钉机器人信息泄露造成安全问题
chmod 600 /etc/zabbix/zabbix_ding.conf
chown zabbix. /etc/zabbix/zabbix_ding.conf
#创建日志文件并授予权限
touch /var/log/zabbix/zabbix_ding.log
chown zabbix. /var/log/zabbix/zabbix_ding.log
#查看告警脚本路径
[root@Linux191 ~]# cat /etc/zabbix/zabbix_server.conf|grep AlertScriptsPath
AlertScriptsPath=/usr/lib/zabbix/alertscripts
#进入/usr/lib/zabbix/alertscripts目录,创建zabbix_ding.py脚本
cd /usr/lib/zabbix/alertscripts
[root@Linux191 alertscripts]# cat zabbix_ding.py
#!/usr/bin/env python3
# coding:utf8
#
import configparser
import os
import time
import hmac
import hashlib
import base64
import urllib.parse
import requests
import json
import sys
config = configparser.ConfigParser()
config.read('/etc/zabbix/zabbix_ding.conf', encoding='utf-8')
log_path = config.get('config', 'log_path')
api_url = config.get('config', 'webhook')
api_secret = config.get('config', 'secret')
log_time = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
# 钉钉机器人文档说明
# https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq
def get_timestamp_sign():
timestamp = str(round(time.time() * 1000))
secret = api_secret
secret_enc = secret.encode('utf-8')
string_to_sign = '{}\n{}'.format(timestamp, secret)
string_to_sign_enc = string_to_sign.encode('utf-8')
hmac_code = hmac.new(secret_enc, string_to_sign_enc, digestmod=hashlib.sha256).digest()
sign = urllib.parse.quote_plus(base64.b64encode(hmac_code))
return timestamp, sign
# 获取加签后的链接
def get_signed_url():
timestamp, sign = get_timestamp_sign()
webhook = api_url + "×tamp=" + timestamp + "&sign=" + sign
return webhook
# 定义消息模式
def get_webhook(mode):
if mode == 0: # only 关键字
webhook = api_url
elif mode == 1 or mode == 2: # 关键字和加签 或 # 关键字+加签+ip
webhook = get_signed_url()
else:
webhook = ""
print("error! mode: ", mode, " webhook : ", webhook)
return webhook
def get_message(text, user_info):
# 和类型相对应,具体可以看文档 :https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq
# 可以设置某个人的手机号,指定对象发送
message = {
"msgtype": "text", # 有text, "markdown"、link、整体跳转ActionCard 、独立跳转ActionCard、FeedCard类型等
"text": {
"content": text # 消息内容
},
"at": {
"atMobiles": [
user_info,
],
"isAtAll": False # 是否是发送群中全体成员
}
}
return message
# 消息发送日志
def log(info):
if os.path.exists(log_path):
log_file = open(log_path, "a+")
else:
log_file = open(log_path, "w+")
log_file.write(info)
def send_ding_message(text, user_info):
# 请求的URL,WebHook地址
# 主要模式有 0 : 关键字 1:# 关键字 +加签 3:关键字+加签+IP
webhook = get_webhook(1)
# 构建请求头部
header = {
"Content-Type": "application/json",
"Charset": "UTF-8"
}
# 构建请求数据
message = get_message(text, user_info)
# 对请求的数据进行json封装
message_json = json.dumps(message)
# 发送请求
info = requests.post(url=webhook, data=message_json, headers=header).json()
code = info["errcode"]
errmsg = info["errmsg"]
if code == 0:
log(log_time + ":消息已发送成功 返回信息:%s %s\n" % (code, errmsg))
else:
log(log_time + ":消息发送失败 返回信息:%s %s\n" % (code, errmsg))
print(log_time + ":消息发送失败 返回信息:%s %s\n" % (code, errmsg))
exit(3)
if __name__ == "__main__":
text = sys.argv[3]
user_info = sys.argv[1]
send_ding_message(text, user_info)
# 修改脚本权限
chown zabbix. zabbix_ding.py
chmod u+x zabbix_ding.py
#测试脚本
[root@Linux191 alertscripts]# python3 zabbix_ding.py user subject mesages
2020-11-11 14:21:15:消息发送失败 返回信息:310000 keywords not in content, more: [https://ding-doc.dingtalk.com/doc#/serverapi2/qf2nxq]
#发送失败原因是发送消息不包含钉钉机器人配置的关键词,建议开启
(2)钉钉机器人安全设置采用“关键词”
cd /usr/lib/zabbix/alertscripts
[root@Linux191 alertscripts]# cat zabbix_ding.py
#!/usr/bin/env python3
#coding:utf-8
#zabbix钉钉报警
import requests,json,sys,os,datetime
webhook="创建的钉钉机器人的webhook地址"
user=sys.argv[1]
text=sys.argv[3]
data={
"msgtype": "text",
"text": {
"content": text
},
"at": {
"atMobiles": [
user
],
"isAtAll": False
}
}
headers = {'Content-Type': 'application/json'}
x=requests.post(url=webhook,data=json.dumps(data),headers=headers)
if os.path.exists("/tmp/zabbix_dingding.log"):
f=open("/tmp/zabbix_dingding.log","a+")
else:
f=open("/tmp/zabbix_dingding.log","w+")
f.write("\n"+"--"*30)
if x.json()["errcode"] == 0:
f.write("\n"+str(datetime.datetime.now())+" "+str(user)+" "+"发送成功"+"\n"+str(text))
f.close()
else:
f.write("\n"+str(datetime.datetime.now()) + " " + str(user) + " " + "发送失败" + "\n" + str(text))
f.close()
#测试脚本
[root@Linux192 ~]# python3 test.py a b 告警测试
[root@Linux192 ~]# cat /tmp/zabbix_dingding.log
------------------------------------------------------------
2020-11-11 15:00:08.591249 a 发送成功
3、zabbix告警配置
(1)管理——告警媒介类型——创建媒体类型
{ALERT.SENDTO}
{ALERT.SUBJECT}
{ALERT.MESSAGE}
(2)告警测试
(3)给用户添加告警媒介
管理——用户——点击所需要添加告警媒介的用户——报警媒介
(4)配置告警动作
配置——动作——左上角选择【Trigger actions】——默认配置动作【Report problems to Zabbix administrators】
告警条件:逐条添加,选择自己需要的
告警通知用户配置
配置自定义信息,默认告警信息为英文,不便于查看,勾选custom message即可更改
#故障发生
#主题
故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生:{TRIGGER.NAME}故障!
#消息内容(正文)
告警主机: {HOSTNAME1}
告警时间: {EVENT.DATE} {EVENT.TIME}
告警等级: {TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目: {TRIGGER.KEY1}
问题详情: {ITEM.NAME}:{ITEM.VALUE}
当前状态: {TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID: {EVENT.ID}
#故障恢复
#主题
故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生:{TRIGGER.NAME}故障!
#消息内容(正文)
告警主机: {HOSTNAME1}
恢复时间: {EVENT.DATE} {EVENT.TIME}
告警等级: {TRIGGER.SEVERITY}
告警信息: {TRIGGER.NAME}
告警项目: {TRIGGER.KEY1}
问题详情: {ITEM.NAME}:{ITEM.VALUE}
当前状态: {TRIGGER.STATUS}:{ITEM.VALUE1}
事件ID: {EVENT.ID}
(5)告警测试
随便重启一台被监控的机器(生产环境可以用创建测试用户等安全的方式进行测试)