5.7. Ceph Manager クラッシュモジュールの使用
Ceph Manager クラッシュモジュールを使用すると、デーモンの crashdump に関する情報を収集し、これを Red Hat Ceph Storage クラスターに保存して詳細な分析を行うことができます。
デフォルトでは、デーモンの crashdump は /var/lib/ceph/crash
にダンプされます。crash dir
オプションを使用して設定できます。クラッシュディレクトリーの名前は、時間、日付、およびランダムに生成される UUID で名前が付けられ、同じ crash_id
を持つメタデータファイルの meta
と最近のログファイルが含まれます。
ceph-crash.service
を使用して、これらのクラッシュを自動的に送信し、Ceph Monitor で永続化することができます。ceph-crash.service
は crashdump ディレクトリーを監視し、それらを ceph crash post
でアップロードします。
RECENT_CRASH ヘルスメッセージは、Ceph クラスター内の最も一般的なヘルスメッセージのいずれかとなります。このヘルスメッセージは、1 つ以上の Ceph デーモンが最近クラッシュし、そのクラッシュが管理者によってアーカイブまたは確認されていないことを意味します。これは、ソフトウェアのバグや、障害のあるディスクなどのハードウェアの問題があることを示している可能性があります。オプション mgr/crash/warn_recent_interval
は、最新の方法の期間 (デフォルトでは 2 週間) を制御します。以下のコマンドを実行して警告を無効にすることができます。
例
[ceph: root@host01 /]# ceph config set mgr/crash/warn_recent_interval 0
[ceph: root@host01 /]# ceph config set mgr/crash/warn_recent_interval 0
mgr/crash/retain_interval
オプションは、自動的にパージされるまでクラッシュレポートを保持する期間を制御します。このオプションのデフォルトは 1 年です。
前提条件
- 稼働中の Red Hat Ceph Storage クラスターがある。
手順
crash モジュールが有効になっていることを確認します。
例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow クラッシュダンプの保存:
meta
ファイルは、メタとして crash ディレクトリーに保存されている JSON blob です。ceph コマンド-i -
オプションを呼び出すことができます。これは、stdin から読み取ります。例
[ceph: root@host01 /]# ceph crash post -i meta
[ceph: root@host01 /]# ceph crash post -i meta
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 新しいクラッシュ情報およびアーカイブされたすべてのクラッシュ情報のタイムスタンプまたは UUID クラッシュ ID を表示します。
例
[ceph: root@host01 /]# ceph crash ls
[ceph: root@host01 /]# ceph crash ls
Copy to Clipboard Copied! Toggle word wrap Toggle overflow すべての新規クラッシュ情報のタイムスタンプまたは UUID クラッシュ ID をリスト表示します。
例
[ceph: root@host01 /]# ceph crash ls-new
[ceph: root@host01 /]# ceph crash ls-new
Copy to Clipboard Copied! Toggle word wrap Toggle overflow すべての新規クラッシュ情報のタイムスタンプまたは UUID クラッシュ ID をリスト表示します。
例
[ceph: root@host01 /]# ceph crash ls-new
[ceph: root@host01 /]# ceph crash ls-new
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 保存されたクラッシュ情報の概要を経過時間別にグループ化してリスト表示します。
例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 保存したクラッシュの詳細を表示します。
構文
ceph crash info CRASH_ID
ceph crash info CRASH_ID
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow KEEP の日数より古い保存済みクラッシュを削除します。ここで、KEEP は整数である必要があります。
構文
ceph crash prune KEEP
ceph crash prune KEEP
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 例
[ceph: root@host01 /]# ceph crash prune 60
[ceph: root@host01 /]# ceph crash prune 60
Copy to Clipboard Copied! Toggle word wrap Toggle overflow RECENT_CRASH
ヘルスチェックで考慮されなくなり、crash ls-new
の出力に表示されないようにクラッシュレポートをアーカイブします。crash ls
に表示されます。構文
ceph crash archive CRASH_ID
ceph crash archive CRASH_ID
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 例
[ceph: root@host01 /]# ceph crash archive 2022-05-24T19:58:42.549073Z_b2382865-ea89-4be2-b46f-9a59af7b7a2d
[ceph: root@host01 /]# ceph crash archive 2022-05-24T19:58:42.549073Z_b2382865-ea89-4be2-b46f-9a59af7b7a2d
Copy to Clipboard Copied! Toggle word wrap Toggle overflow すべてのクラッシュレポートをアーカイブします。
例
[ceph: root@host01 /]# ceph crash archive-all
[ceph: root@host01 /]# ceph crash archive-all
Copy to Clipboard Copied! Toggle word wrap Toggle overflow クラッシュダンプを削除します。
構文
ceph crash rm CRASH_ID
ceph crash rm CRASH_ID
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 例
[ceph: root@host01 /]# ceph crash rm 2022-05-24T19:58:42.549073Z_b2382865-ea89-4be2-b46f-9a59af7b7a2d
[ceph: root@host01 /]# ceph crash rm 2022-05-24T19:58:42.549073Z_b2382865-ea89-4be2-b46f-9a59af7b7a2d
Copy to Clipboard Copied! Toggle word wrap Toggle overflow