5.6. 使用 Ceph Manager 警报模块
您可以使用 Ceph 管理器警报模块通过电子邮件发送关于 Red Hat Ceph Storage 集群健康状况的简单警报消息。
这个模块并不是一个可靠的监控解决方案。作为 Ceph 集群本身一部分运行的事实是,在 ceph-mgr
守护进程出现故障时,它完全限制会防止警报被发送。但是,对于没有监控架构的环境中存在的一个独立的集群非常有用。
先决条件
- 一个正在运行的 Red Hat Ceph Storage 集群。
- Ceph 监控节点的根级别访问权限.
流程
登录到 Cephadm shell:
示例
[root@host01 ~]# cephadm shell
启用警报模块:
示例
[ceph: root@host01 /]# ceph mgr module enable alerts
确保启用了 alert 模块:
示例
[ceph: root@host01 /]# ceph mgr module ls | more { "always_on_modules": [ "balancer", "crash", "devicehealth", "orchestrator", "pg_autoscaler", "progress", "rbd_support", "status", "telemetry", "volumes" ], "enabled_modules": [ "alerts", "cephadm", "dashboard", "iostat", "nfs", "prometheus", "restful" ]
配置简单邮件传输协议(SMTP):
语法
ceph config set mgr mgr/alerts/smtp_host SMTP_SERVER ceph config set mgr mgr/alerts/smtp_destination RECEIVER_EMAIL_ADDRESS ceph config set mgr mgr/alerts/smtp_sender SENDER_EMAIL_ADDRESS
示例
[ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_host smtp.example.com [ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_destination example@example.com [ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_sender example2@example.com
可选:将端口更改为 465。
语法
ceph config set mgr mgr/alerts/smtp_port PORT_NUMBER
示例
[ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_port 587
重要Red Hat Ceph Storage 5 集群中不支持 SSL。不要在配置警报时设置
smtp_ssl
参数。SMTP 服务器验证:
语法
ceph config set mgr mgr/alerts/smtp_user USERNAME ceph config set mgr mgr/alerts/smtp_password PASSWORD
示例
[ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_user admin1234 [ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_password admin1234
可选:默认情况下,SMTP
From
名称是Ceph
。要更改它,请设置smtp_from_name
参数:语法
ceph config set mgr mgr/alerts/smtp_from_name CLUSTER_NAME
示例
[ceph: root@host01 /]# ceph config set mgr mgr/alerts/smtp_from_name 'Ceph Cluster Test'
可选:默认情况下,警报模块会每分钟检查存储集群的健康状况,并在集群健康状况有变化时发送消息。要更改频率,设置
interval
参数:语法
ceph config set mgr mgr/alerts/interval INTERVAL
示例
[ceph: root@host01 /]# ceph config set mgr mgr/alerts/interval "5m"
在本例中,间隔设置为 5 分钟。
可选:立即发送警报:
示例
[ceph: root@host01 /]# ceph alerts send
其它资源
- 有关 Ceph 健康消息的更多信息,请参阅 Red Hat Ceph Storage 故障排除指南中的 Ceph 集群的健康状态信息。