第15章 Cephadm ヘルスチェック
ストレージ管理者は、Cephadm モジュールによって提供される追加のヘルスチェックを使用して Red Hat Ceph Storage クラスターを監視できます。これは、ストレージクラスターによって提供されるデフォルトのヘルスチェックの補足です。
15.1. Cephadm 操作のヘルスチェック
ヘルスチェックは、Cephadm モジュールがアクティブなときに実行されます。次のヘルス警告を受け取る場合があります。
CEPHADM_PAUSED
Cephadm のバックグラウンド作業は、ceph orch pause
コマンドで一時停止します。Cephadm は、ホストとデーモンの状態を確認するなどのパッシブ監視アクティビティーを実行し続けますが、デーモンのデプロイや削除などの変更は行いません。ceph orch resume
コマンドを使用して、Cephadm の作業を再開できます。
CEPHADM_STRAY_HOST
1 つ以上のホストが Ceph デーモンを実行していますが、Cephadm モジュールによって管理されるホストとして登録されていません。これは、これらのサービスが現在 Cephadm によって管理されていないことを意味します。たとえば、ceph orch ps
コマンドに含まれる再起動とアップグレードなどです。ceph orch host add HOST_NAME
コマンドを使用してホストを管理できますが、リモートホストへの SSH アクセスが設定されていることを確認してください。または、手動でホストに接続し、そのホスト上のサービスが削除または Cephadm によって管理されているホストに移行されるようにすることもできます。この警告は、設定 ceph config set mgr mgr/cephadm/warn_on_stray_hosts false
で無効にすることもできます。
CEPHADM_STRAY_DAEMON
1 つ以上の Ceph デーモンが動作中ですが、Cephadm モジュールによって管理されていません。これは、別のツールを使用してデプロイされたか、手動で開始されたためです。これらのサービスは、現在 Cephadm によって管理されていません。たとえば、ceph orch ps
コマンドに含まれる再起動とアップグレードなどです。
デーモンがモニターまたは OSD デーモンであるステートフルなデーモンである場合、これらのデーモンは Cephadm によって採用される必要があります。ステートレスデーモンの場合は、ceph orch apply
コマンドで新しいデーモンをプロビジョニングし、アンマネージデーモンを停止できます。
このヘルス警告は、設定 ceph config set mgr mgr/cephadm/warn_on_stray_daemons false
で無効にすることができます。
CEPHADM_HOST_CHECK_FAILED
1 つ以上のホストが基本的な Cephadm ホストチェックに失敗しています。name: value を検証します
- ホストは到達可能で、Cephadm を実行することができます。
- ホストは、Podman であるコンテナーランタイムの機能、時間同期の機能など、基本的な前提条件を満たしています。このテストが失敗した場合、Cephadm はそのホスト上のサービスを管理できません。
このチェックは、ceph cephadm check-host HOST_NAME
コマンドで手動で実行できます。壊れたホストを管理から削除するには、ceph orch host rm HOST_NAME
コマンドを使用します。このヘルス警告は、設定 ceph config set mgr mgr/cephadm/warn_on_failed_host_check false
で無効にすることができます。