第1章 初期のトラブルシューティング
本章では、以下の情報を提供します。
- Ceph エラーのトラブルシューティングを開始する方法(「問題の特定」)
-
最も一般的な
ceph の正常性エラーメッセージ
(「ceph health
コマンドの出力について」) - 最も一般的な Ceph ログのエラーメッセージ(「Ceph ログについて」)
1.1. 問題の特定
発生した Red Hat Ceph Storage でエラーの原因を確認するには、以下の質問に回答します。
- サポート対象外の設定を使用する場合は、特定の問題が発生する可能性があります。設定がサポートされていることを確認してください。詳細は、Red Hat Ceph Storage でサポートされる設定について参照してください。
どの Ceph コンポーネントが問題を引き起こすかについて把握しているか?
- いいえ、「Ceph Storage クラスターの正常性の診断」 に従います。
- 監視。4章監視のトラブルシューティング を参照してください。
- OSD:5章OSD のトラブルシューティング を参照してください。
- 配置グループ7章配置グループのトラブルシューティング を参照してください。
1.1.1. Ceph Storage クラスターの正常性の診断
以下の手順では、Ceph Storage クラスターの正常性を診断するための基本的な手順を説明します。
クラスターの全体的なステータスを確認します。
# ceph health detail
コマンドが
HEALTH_WARN
またはHEALTH_ERR
を返す場合は、「ceph health
コマンドの出力について」 を参照してください。-
Ceph ログで 「Ceph ログについて」 に記載されたエラーメッセージがあるかどうかを確認します。ログは、デフォルトで
/var/log/ceph/
ディレクトリーにあります。 - ログに十分な量の情報が含まれていない場合は、デバッグレベルを増やし、失敗したアクションの再現を試行します。詳しくは、2章ロギングの設定 を参照してください。
-
ceph-medic
ユーティリティーを使用して、ストレージクラスターを診断します。詳細は、『Red HatCeph Storage 3 管理ガイド』の「Cephストレージクラスターの診断
」セクションを参照してください。