1.5. Ceph クラスターの正常性アラートのミュート
特定のシナリオでは、ユーザーが一時的にいくつかの警告をミュートしたい場合があります。正常性チェックをミュートして、Ceph クラスターの報告されたステータス全体に影響を与えないようにすることができます。
アラートは正常性チェックコードで指定します。たとえば、OSD がメンテナンスのためにダウンした場合は、OSD_DOWN
警告が出力されることがあります。メンテナンスが終了するまで警告をミュートにすることもできます。これらの警告が出ると、メンテナンス期間中、クラスターは HEALTH_OK
ではなく HEALTH_WARN
になります。
アラートの範囲が悪化すると、ほとんどの正常性ミュートも消えます。たとえば、1 つの OSD がダウンしていて、アラートがミュートになっている場合、さらに 1 つ以上の OSD がダウンすると、ミュートが消えます。これは、警告やエラーの原因となっているものの量や数を示すカウントを伴う正常性アラートに当てはまります。
前提条件
- 稼働中の Red Hat Ceph Storage クラスターがある。
- ノードへのアクセスのルートレベル。
- 正常性への警告メッセージです。
手順
Cephadm シェルにログインします。
例:
[root@host01 ~]# cephadm shell
ceph health detail
コマンドを実行して、Red Hat Ceph Storage クラスターの正常性を確認します。例:
[ceph: root@host01 /]# ceph health detail HEALTH_WARN 1 osds down; 1 OSDs or CRUSH {nodes, device-classes} have {NOUP,NODOWN,NOIN,NOOUT} flags set [WRN] OSD_DOWN: 1 osds down osd.1 (root=default,host=host01) is down [WRN] OSD_FLAGS: 1 OSDs or CRUSH {nodes, device-classes} have {NOUP,NODOWN,NOIN,NOOUT} flags set osd.1 has flags noup
ストレージクラスターは、OSD の 1 つがダウンしているため、
HEALTH_WARN
状態になっていることがわかります。アラートをミュートします。
構文
ceph health mute HEALTH_MESSAGE
例:
[ceph: root@host01 /]# ceph health mute OSD_DOWN
オプション: 正常性チェックのミュートに TTL (time to live) を設定することができ、指定した時間が経過するとミュートが自動的に失効します。コマンドの任意の duration 引数として TTL を指定します。
構文
ceph health mute HEALTH_MESSAGE DURATION
DURATION は、
s
、sec
、m
、min
、h
、hour
で指定できます。例:
[ceph: root@host01 /]# ceph health mute OSD_DOWN 10m
この例では、アラート
OSD_DOWN
が 10 分間ミュートされます。Red Hat Ceph Storage クラスターのステータスが
HEALTH_OK
に変更されているかどうかを確認します。例:
[ceph: root@host01 /]# ceph -s cluster: id: 81a4597a-b711-11eb-8cb8-001a4a000740 health: HEALTH_OK (muted: OSD_DOWN(9m) OSD_FLAGS(9m)) services: mon: 3 daemons, quorum host01,host02,host03 (age 33h) mgr: host01.pzhfuh(active, since 33h), standbys: host02.wsnngf, host03.xwzphg osd: 11 osds: 10 up (since 4m), 11 in (since 5d) data: pools: 1 pools, 1 pgs objects: 13 objects, 0 B usage: 85 MiB used, 165 GiB / 165 GiB avail pgs: 1 active+clean
この例では、OSD_DOWN および OSD_FLAG の警告がミュートされ、そのミュートが 9 分間有効であることがわかります。
オプション: ミュートを スティッキー にすることで、アラートが解除された後もミュートを保持することができます。
構文
ceph health mute HEALTH_MESSAGE DURATION --sticky
例:
[ceph: root@host01 /]# ceph health mute OSD_DOWN 1h --sticky
次のコマンドを実行して、ミュートを削除できます。
構文
ceph health unmute HEALTH_MESSAGE
例
[ceph: root@host01 /]# ceph health unmute OSD_DOWN
関連情報
- 詳細は、Red Hat Ceph Storage トラブルシューティングガイドの Ceph クラスターの正常性メッセージ セクションを参照してください。