第7章 Ceph Dashboard でのアラートの管理
ストレージ管理者は、Red Hat Ceph Storage Dashbaoard でアラートの詳細を表示し、アラートのサイレンスを作成できます。これには、次の事前定義されたアラートが含まれます。
- CephadmDaemonFailed
- CephadmPaused
- CephadmUpgradeFailed
- CephDaemonCrash
- CephDeviceFailurePredicted
- CephDeviceFailurePredictionTooHigh
- CephDeviceFailureRelocationIncomplete
- CephFilesystemDamaged
- CephFilesystemDegraded
- CephFilesystemFailureNoStandby
- CephFilesystemInsufficientStandby
- CephFilesystemMDSRanksLow
- CephFilesystemOffline
- CephFilesystemReadOnly
- CephHealthError
- CephHealthWarning
- CephMgrModuleCrash
- CephMgrPrometheusModuleInactive
- CephMonClockSkew
- CephMonDiskspaceCritical
- CephMonDiskspaceLow
- CephMonDown
- CephMonDownQuorumAtRisk
- CephNodeDiskspaceWarning
- CephNodeInconsistentMTU
- CephNodeNetworkPacketDrops
- CephNodeNetworkPacketErrors
- CephNodeRootFilesystemFull
- CephObjectMissing
- CephOSDBackfillFull
- CephOSDDown
- CephOSDDownHigh
- CephOSDFlapping
- CephOSDFull
- CephOSDHostDown
- CephOSDInternalDiskSizeMismatch
- CephOSDNearFull
- CephOSDReadErrors
- CephOSDTimeoutsClusterNetwork
- CephOSDTimeoutsPublicNetwork
- CephOSDTooManyRepairs
- CephPGBackfillAtRisk
- CephPGImbalance
- CephPGNotDeepScrubbed
- CephPGNotScrubbed
- CephPGRecoveryAtRisk
- CephPGsDamaged
- CephPGsHighPerOSD
- CephPGsInactive
- CephPGsUnclean
- CephPGUnavilableBlockingIO
- CephPoolBackfillFull
- CephPoolFull
- CephPoolGrowthWarning
- CephPoolNearFull
- CephSlowOps
- PrometheusJobMissing
図7.1 事前定義されたアラート
簡易ネットワーク管理プロトコル (SNMP) トラップを使用してアラートを監視することもできます。Red Hat Ceph Storage 操作ガイドの SNMP トラップの設定 の章を参照してください。
7.1. 監視スタックの有効化
コマンドラインインターフェイスを使用して、Prometheus、Alertmanager、Grafana などの Red Hat Ceph Storage クラスターのモニタリングスタックを手動で有効にできます。
Prometheus および Alertmanager API を使用して、アラートと無音を管理できます。
前提条件
- 稼働中の Red Hat Ceph Storage クラスターがある。
- すべてのホストへの root レベルのアクセス。
手順
cephadm
シェルにログインします。例
[root@host01 ~]# cephadm shell
監視スタックの API を設定します。
Alertmanager サーバーのホストとポートを指定します。
構文
ceph dashboard set-alertmanager-api-host 'ALERTMANAGER_API_HOST:PORT'
例
[ceph: root@host01 /]# ceph dashboard set-alertmanager-api-host 'http://10.0.0.101:9093' Option ALERTMANAGER_API_HOST updated
設定されたアラートを表示するには、Prometheus API への URL を設定します。この API を使用して、Ceph Dashboard UI は、新しい無音が対応するアラートと一致することを確認します。
構文
ceph dashboard set-prometheus-api-host 'PROMETHEUS_API_HOST:PORT'
例
[ceph: root@host01 /]# ceph dashboard set-prometheus-api-host 'http://10.0.0.101:9095' Option PROMETHEUS_API_HOST updated
ホストを設定した後、ブラウザーのダッシュボードウィンドウを更新します。
Grafana サーバーのホストとポートを指定します。
構文
ceph dashboard set-grafana-api-url 'GRAFANA_API_URL:PORT'
例
[ceph: root@host01 /]# ceph dashboard set-grafana-api-url 'http://10.0.0.101:3000' Option GRAFANA_API_URL updated
Prometheus、Alertmanager、および Grafana API ホストの詳細を取得します。
例
[ceph: root@host01 /]# ceph dashboard get-alertmanager-api-host http://10.0.0.101:9093 [ceph: root@host01 /]# ceph dashboard get-prometheus-api-host http://10.0.0.101:9095 [ceph: root@host01 /]# ceph dashboard get-grafana-api-url http://10.0.0.101:3000
オプション: Prometheus、Alertmanager、または Grafana のセットアップで自己署名証明書を使用している場合は、ダッシュボードで証明書の検証を無効にします。これにより、不明な認証局 (CA) によって署名された証明書や、ホスト名と一致しない証明書が原因となる接続拒否を回避することができます。
Prometheus の場合:
例
[ceph: root@host01 /]# ceph dashboard set-prometheus-api-ssl-verify False
Alertmanager の場合:
例
[ceph: root@host01 /]# ceph dashboard set-alertmanager-api-ssl-verify False
Grafana の場合:
例
[ceph: root@host01 /]# ceph dashboard set-grafana-api-ssl-verify False
Prometheus、Alertmanager、および Grafana の自己署名証明書検証設定の詳細を取得します。
例
[ceph: root@host01 /]# ceph dashboard get-prometheus-api-ssl-verify [ceph: root@host01 /]# ceph dashboard get-alertmanager-api-ssl-verify [ceph: root@host01 /]# ceph dashboard get-grafana-api-ssl-verify
オプション: ダッシュボードに変更が反映されていない場合は、ダッシュボードを無効にしてから有効にする必要があります。
例
[ceph: root@host01 /]# ceph mgr module disable dashboard [ceph: root@host01 /]# ceph mgr module enable dashboard
関連情報
- Red Hat Ceph Storage インストールガイド の ブートストラップコマンドオプション セクションを参照してください。
- Red Hat Ceph Storage インストールガイドの Red Hat Ceph Storage インストール の章を参照してください。
- Red Hat Ceph Storage Operations Guide の Deploying the monitoring stack using the Ceph Orchestrator セクションを参照してください。