1.4. Ceph クラスターの正常性アラートのミュート


特定のシナリオでは、ユーザーが一時的にいくつかの警告をミュートしたい場合があります。正常性チェックをミュートして、Ceph クラスターの報告されたステータス全体に影響を与えないようにすることができます。

アラートは正常性チェックコードで指定します。たとえば、OSD がメンテナンスのためにダウンした場合は、OSD_DOWN 警告が出力されることがあります。メンテナンスが終了するまで警告をミュートにすることもできます。これらの警告が出ると、メンテナンス期間中、クラスターは HEALTH_OK ではなく HEALTH_WARN になります。

アラートの範囲が悪化すると、ほとんどの正常性ミュートも消えます。たとえば、1 つの OSD がダウンしていて、アラートがミュートになっている場合、さらに 1 つ以上の OSD がダウンすると、ミュートが消えます。これは、警告やエラーの原因となっているものの量や数を示すカウントを伴う正常性アラートに当てはまります。

前提条件

  • 稼働中の Red Hat Ceph Storage クラスターがある。
  • ノードへのアクセスのルートレベル。
  • 正常性への警告メッセージです。

手順

  1. Cephadm シェルにログインします。

    [root@host01 ~]# cephadm shell

  2. ceph health detail コマンドを実行して、Red Hat Ceph Storage クラスターの正常性を確認します。

    [ceph: root@host01 /]# ceph health detail
    
    HEALTH_WARN 1 osds down; 1 OSDs or CRUSH {nodes, device-classes} have {NOUP,NODOWN,NOIN,NOOUT} flags set
    [WRN] OSD_DOWN: 1 osds down
        osd.1 (root=default,host=host01) is down
    [WRN] OSD_FLAGS: 1 OSDs or CRUSH {nodes, device-classes} have {NOUP,NODOWN,NOIN,NOOUT} flags set
        osd.1 has flags noup

    ストレージクラスターは、OSD の 1 つがダウンしているため、HEALTH_WARN 状態になっていることがわかります。

  3. アラートをミュートします。

    構文

    ceph health mute HEALTH_MESSAGE

    [ceph: root@host01 /]# ceph health mute OSD_DOWN

  4. オプション: 正常性チェックのミュートに TTL (time to live) を設定することができ、指定した時間が経過するとミュートが自動的に失効します。コマンドの任意の duration 引数として TTL を指定します。

    構文

    ceph health mute HEALTH_MESSAGE DURATION

    DURATION は、ssecmminhhour で指定できます。

    [ceph: root@host01 /]# ceph health mute OSD_DOWN 10m

    この例では、アラート OSD_DOWN が 10 分間ミュートされます。

  5. Red Hat Ceph Storage クラスターのステータスが HEALTH_OK に変更されているかどうかを確認します。

    [ceph: root@host01 /]# ceph -s
      cluster:
        id:     81a4597a-b711-11eb-8cb8-001a4a000740
        health: HEALTH_OK
                (muted: OSD_DOWN(9m) OSD_FLAGS(9m))
    
      services:
        mon: 3 daemons, quorum host01,host02,host03 (age 33h)
        mgr: host01.pzhfuh(active, since 33h), standbys: host02.wsnngf, host03.xwzphg
        osd: 11 osds: 10 up (since 4m), 11 in (since 5d)
    
      data:
        pools:   1 pools, 1 pgs
        objects: 13 objects, 0 B
        usage:   85 MiB used, 165 GiB / 165 GiB avail
        pgs:     1 active+clean

    この例では、OSD_DOWN および OSD_FLAG の警告がミュートされ、そのミュートが 9 分間有効であることがわかります。

  6. オプション: ミュートを スティッキー にすることで、アラートが解除された後もミュートを保持することができます。

    構文

    ceph health mute HEALTH_MESSAGE DURATION --sticky

    [ceph: root@host01 /]# ceph health mute OSD_DOWN 1h --sticky

  7. 次のコマンドを実行して、ミュートを削除できます。

    構文

    ceph health unmute HEALTH_MESSAGE

    [ceph: root@host01 /]# ceph health unmute OSD_DOWN

関連情報

Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.