11.2. Ceph Dashboard で障害が発生した OSD の交換
Red Hat Ceph Storage クラスターで障害のある OSD は、ダッシュボードで cluster-manager
レベルのアクセス権限がある場合に、置き換えることができます。ダッシュボードでのこの機能で注目すべき点の 1 つとして、障害のある OSD を置き換える時に OSD ID を保持できることが挙げられます。
前提条件
- 稼働中の Red Hat Ceph Storage クラスターがある。
-
最低でも Ceph Dashboard での
cluster-manager
レベルのアクセス。 -
最低でも OSD の 1 つが
down
している。
手順
ダッシュボードでは、以下の方法で障害のある OSD を特定できます。
- ダッシュボード AlertManager ポップアップ通知。
- HEALTH_WARN ステータスを示すダッシュボードのランディングページ。
- 障害のある OSD を表示するダッシュボードのランディングページ。
障害のある OSD を表示するダッシュボード OSD ページ。
この例では、OSD の 1 つが Dashboard のランディングページでダウンしていることが分かります。
また、いずれかの OSD がダウンしている場合は、物理ドライブ上で LED ライトが点滅します。
Cluster→OSDs の OSDs List テーブルで、
out
およびdown
の OSD を選択します。- アクションドロップダウンから Flags をクリックし、Individual OSD Flags フォームで No Up を選択して Update をクリックします。
- アクションドロップダウンから Delete をクリックします。Delete OSD 通知で、Preserve OSD ID(s) for replacement と Yes, I am sure を選択し、Delete OSD をクリックします。
- OSD のステータスが out および destroyed に変わるまで待ちます。
オプション: クラスター全体の No Up フラグを変更するには、Cluster-wide configuration メニューから Flags を選択します。
- Cluster-wide OSDs Flags フォームで、No Up を選択し、Update をクリックします。
オプション: ハードディスク障害が原因で OSD がダウンしている場合は、物理ドライブを置き換えます。
- ドライブがホットスワップ可能な場合は、故障したドライブを新しいものと交換します。
- ドライブがホットスワップに対応しておらず、ホストに複数の OSD が含まれる場合は、ホスト全体をシャットダウンして物理ドライブを交換する必要がある場合があります。クラスターのバックフィルを防ぐことを検討してください。詳細は、Red Hat Ceph Storage トラブルシューティングガイド の リバランスの停止および開始 の章を参照してください。
-
ドライブが
/dev/
ディレクトリー配下に表示されたら、ドライブパスを書き留めます。 - OSD を手動で追加する必要がある場合には、OSD ドライブを見つけ、ディスクをフォーマットします。
新規ディスクにデータがある場合には、ディスクを消去します。
構文
ceph orch device zap HOST_NAME PATH --force
例
ceph orch device zap ceph-adm2 /dev/sdc --force
- Ceph ダッシュボードの OSDs List から、Create をクリックします。
Create OSDs フォームの Advanced Mode セクションで、プライマリーデバイスを追加します。
- Primary devices ダイアログで、Hostname フィルターを選択します。
リストからデバイスタイプを選択します。
注記デバイスを追加するには、まずホスト名を選択し、次に少なくとも 1 つのフィルターを選択する必要があります。
たとえば、Hostname リストから
Type
、hdd
の順に選択します。Vendor を選択し、デバイスリストから
ATA
を選択します。- Add をクリックします。
- Create OSDs フォームで、Preview をクリックします。
OSD Creation Preview ダイアログで、Create をクリックします。
OSD が正常に作成され、OSD のステータスが
out
およびdown
に変更されたことを示す通知が表示されます。
ステータスが out および down の新規作成された OSD を選択します。
- アクションドロップダウンから Mark In をクリックします。
Mark OSD in 通知で、Mark In をクリックします。
OSD ステータスが in に変わります。
- アクションドロップダウンから Flags をクリックします。
- No Up の選択を解除し、Update をクリックします。
オプション: 過去にクラスター全体の設定を No Up フラグに変更している場合は、Cluster-wide configuration メニューで Flags を選択します。
- Cluster-wide OSDs Flags フォームで、No Up の選択を解除し、Update をクリックします。
検証
破棄された OSD がデバイスに作成され、OSD ID が保持されていることを確認します。
関連情報
- ダウンしている OSD の詳細は、Red Hat Ceph Storage トラブルシューティングガイド の Down OSD セクションを参照してください。
- その他のサポートについては、Red Hat Ceph Storage トラブルシューティングガイド の Red Hat Support for service セクションを参照してください。
- システムロールの詳細は、Red Hat Ceph Storage Dashboard ガイド の Ceph Dashboard でのロールの管理 セクションを参照してください。