ノードの置き換え

Red Hat OpenShift Container Storage 4.7

置き換え用のノードを準備し、障害が発生したノードを置き換える方法

概要

本書では、Red Hat OpenShift Container Storage クラスターのノードを安全に置き換える方法について説明します。

多様性を受け入れるオープンソースの強化
リンクのコピー

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。まずは、マスター (master)、スレーブ (slave)、ブラックリスト (blacklist)、ホワイトリスト (whitelist) の 4 つの用語の置き換えから始めます。この取り組みは膨大な作業を要するため、今後の複数のリリースで段階的に用語の置き換えを実施して参ります。詳細は、弊社の CTO、Chris Wright のメッセージを参照してください。

Red Hat ドキュメントへのフィードバックの提供
リンクのコピー

弊社のドキュメントについてのご意見をお聞かせください。ドキュメントの改善点があれば、ぜひお知らせください。フィードバックをお寄せいただくには、以下をご確認ください。

特定の部分についての簡単なコメントをお寄せいただく場合は、以下をご確認ください。
1. ドキュメントの表示が Multi-page HTML 形式になっていていることを確認してください。ドキュメントの右上隅に Feedback ボタンがあることを確認してください。
2. マウスカーソルを使用して、コメントを追加するテキストの部分を強調表示します。
3. 強調表示されたテキストの下に表示される Add Feedback ポップアップをクリックします。
4. 表示される指示に従ってください。
より詳細なフィードバックをお寄せいただく場合は、Bugzilla のチケットを作成してください。
1. Bugzilla の Web サイトに移動します。
2. Component (コンポーネント) として Documentation を使用します。
3. Description フィールドに、ドキュメントの改善に向けたご提案を記入してください。ドキュメントの該当部分へのリンクも追加してください。
4. Submit Bug をクリックします。

はじめに
リンクのコピー

OpenShift Container Storage では、動作ノードに対しては事前対応として、以下のデプロイメントで障害のあるノードに対しては事後対応として、ノードを交換できます。

Amazon Web Services (AWS)
- ユーザーによってプロビジョニングされるインフラストラクチャー
- インストーラーでプロビジョニングされるインフラストラクチャー
VMware
- ユーザーによってプロビジョニングされるインフラストラクチャー
Red Hat Virtualization の場合:
- インストーラーでプロビジョニングされるインフラストラクチャー
Microsoft Azure
- インストーラーでプロビジョニングされるインフラストラクチャー
ローカルストレージデバイスの場合
- ベアメタル
- Amazon EC2 I3
- VMware
- Red Hat Virtualization
- IBM Power Systems
外部モードでストレージノードを置き換える場合は、Red Hat Ceph Storage のドキュメントを参照してください。

第1章動的デバイスを使用してデプロイされた OpenShift Container Storage
リンクのコピー

1.1. AWS にデプロイされる OpenShift Container Storage
リンクのコピー

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

以下の手順に従って、AWS のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードを置き換えます。

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

置き換える必要のあるノードを特定します。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
以下のコマンドを使用してノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規 AWS マシンインスタンスを作成します。プラットフォーム要件を参照してください。
新規 AWS マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
OpenShift Container Storage ラベルを新規ノードに適用します。
Web ユーザーインターフェイスの使用
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

以下の手順を使用して、AWS のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作するノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の AWS のユーザーによってプロビジョニングされるインフラストラクチャー (UPI) で動作しない障害のあるノードを置き換えます。

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

置き換える必要のあるノードの AWS マシンインスタンスを特定します。
AWS にログインし、特定された AWS マシンインスタンスを終了します。
必要なインフラストラクチャーで新規 AWS マシンインスタンスを作成します。プラットフォーム要件を参照してください。
新規 AWS マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の AWS のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作しない障害のあるノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
[オプション]: 失敗した AWS インスタンスが自動的に削除されない場合、インスタンスを AWS コンソールで終了します。

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2. VMware にデプロイされる OpenShift Container Storage
リンクのコピー

動作するノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え」
障害のあるノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え」

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

以下の手順に従って、VMware のユーザーによってプロビジョニングされるインフラストラクチャー (UPI) で動作するノードを置き換えます。

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

置き換える必要があるノードとその仮想マシンを特定します。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
以下のコマンドを使用してノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
VSphere にログインし、特定された仮想マシンを終了します。
重要
仮想マシンはインベントリーからのみ削除し、ディスクから削除しないでください。
必要なインフラストラクチャーで vSphere に新規の仮想マシンを作成します。プラットフォーム要件を参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

以下の手順を使用して、VMware のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作するノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

以下の手順に従って、VMware のユーザーによってプロビジョニングされるインフラストラクチャー (UPI) で失敗したノードを置き換えます。

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

置き換える必要があるノードとその仮想マシンを特定します。
以下のコマンドを使用してノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
VSphere にログインし、特定された仮想マシンを終了します。
重要
仮想マシンはインベントリーからのみ削除し、ディスクから削除しないでください。
必要なインフラストラクチャーで vSphere に新規の仮想マシンを作成します。プラットフォーム要件を参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の VMware のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作しない障害のあるノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
[オプション]: 失敗した VM インスタンスが自動的に削除されない場合、仮想マシンを vSphere で終了します。

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.3. Red Hat Virtualization にデプロイされた OpenShift Container Storage
リンクのコピー

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換え
リンクのコピー

以下の手順を使用して、Red Hat Virtualization のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作するノードを置き換えます。

手順

OpenShift Web コンソール にログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の Red Hat Virtualization のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作しない障害のあるノードを置き換えます。

手順

OpenShift Web コンソール にログインし、Compute → Nodes をクリックします。
障害のあるノードを特定します。その マシン名 をメモします。
Red Hat Virtualization 管理ポータル にログインし、mon および OSD に関連付けられた仮想ディスクを障害の発生した仮想マシンから削除します。
この手順は、仮想マシンインスタンスがマシンの削除ステップの一部として削除される際にディスクが削除されないようにするために必要です。
重要
ディスクの削除時に、Remove Permanently オプションを選択しないでください。
OpenShift Web コンソール で、Compute → Machines をクリックします。必要なマシンを検索します。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
(オプション) 失敗した仮想マシンが自動的に削除されない場合は、Red Hat Virtualization 管理ポータルから仮想マシンを削除します。

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.4. Microsoft Azure でデプロイされた OpenShift Container Storage
リンクのコピー

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

以下の手順を使用して、Azure のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作するノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の Azure のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作しない障害のあるノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
[オプション]: 失敗した Azure インスタンスが自動的に削除されない場合、インスタンスを Azure コンソールで終了します。

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

第2章ローカルストレージデバイスを使用した OpenShift Container Storage のデプロイ
リンクのコピー

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、「ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」を参照してください。
障害のあるノードを置き換えるには、「ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え」を参照してください。

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

NODE を特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規のベアメタルマシンを取得します。クラスターのベアメタルへのインストールについて参照してください。
新規ベアメタルマシンを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

NODE を特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規のベアメタルマシンを取得します。クラスターのベアメタルへのインストールについて参照してください。
新規ベアメタルマシンを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.2. IBM Z または LinuxONE インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

以下のいずれかの手順を選択して、ストレージノードを置き換えることができます。

「IBM Z または LinuxONE インフラストラクチャーでの動作するノードの置き換え」
「IBM Z または LinuxONE インフラストラクチャーでの障害のあるノードの置き換え」

2.2.1. IBM Z または LinuxONE インフラストラクチャーでの動作するノードの置き換え
リンクのコピー

以下の手順に従って、IBM Z または LinuxONE インフラストラクチャーで動作するノードを置き換えます。

手順

OpenShift Web コンソールにログインします。
Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
以下のコマンドを実行して、ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
以下のコマンドを使用してノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでデータの暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。

指定の OSD にバインドされる Persistent Volume Claim(永続ボリューム要求、PVC) を特定します。

oc describe pod/rook-ceph-osd-0-544db49d7f-qrgqm|grep pvc
ceph.rook.io/pvc=ocs-deviceset-thin-0-data-0lg6zp

$ oc describe pod/rook-ceph-osd-0-544db49d7f-qrgqm|grep pvc
ceph.rook.io/pvc=ocs-deviceset-thin-0-data-0lg6zp

Copy to Clipboard

Toggle word wrap

OSD Pod が実行される場所を特定します。

oc get -o=custom-columns=NODE:.spec.nodeName pod/rook-ceph-osd-0-544db49d7f-qrgqm

$ oc get -o=custom-columns=NODE:.spec.nodeName pod/rook-ceph-osd-0-544db49d7f-qrgqm

Copy to Clipboard

Toggle word wrap

デバッグ Pod を作成し、ホストの chroot 環境を開きます。
```
oc debug node/<node name>
chroot /host
```
```
$ oc debug node/<node name>
$ chroot /host
```
Copy to Clipboard Toggle word wrap

デバイスが暗号化されていることを確認します。

dmsetup ls | grep ocs-deviceset
ocs-deviceset-0-data-0-57snx-block-dmcrypt (253:1)

$ dmsetup ls | grep ocs-deviceset
ocs-deviceset-0-data-0-57snx-block-dmcrypt (253:1)

Copy to Clipboard

Toggle word wrap

lsblk | grep ocs-deviceset
`-ocs-deviceset-0-data-0-57snx-block-dmcrypt 253:1    0   512G  0 crypt

$ lsblk | grep ocs-deviceset
`-ocs-deviceset-0-data-0-57snx-block-dmcrypt 253:1    0   512G  0 crypt

Copy to Clipboard

Toggle word wrap

検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.2.2. IBM Z または LinuxONE インフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

以下の手順に従って、OpenShift Container Storage の IBM Z または LinuxONE インフラストラクチャーで動作しない障害のあるノードを置き換えます。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。この期間に生成される Ceph のエラーは一時的なもので、新規ノードにラベルが付けられ、これが機能すると自動的に解決されます。
Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
Web ユーザーインターフェイスの使用
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= | cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= | cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでデータの暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。

指定の OSD にバインドされる Persistent Volume Claim(永続ボリューム要求、PVC) を特定します。

oc describe pod/rook-ceph-osd-0-544db49d7f-qrgqm|grep pvc
ceph.rook.io/pvc=ocs-deviceset-thin-0-data-0lg6zp

$ oc describe pod/rook-ceph-osd-0-544db49d7f-qrgqm|grep pvc
ceph.rook.io/pvc=ocs-deviceset-thin-0-data-0lg6zp

Copy to Clipboard

Toggle word wrap

OSD Pod が実行される場所を特定します。

oc get -o=custom-columns=NODE:.spec.nodeName pod/rook-ceph-osd-0-544db49d7f-qrgqm

$ oc get -o=custom-columns=NODE:.spec.nodeName pod/rook-ceph-osd-0-544db49d7f-qrgqm

Copy to Clipboard

Toggle word wrap

デバッグ Pod を作成し、ホストの chroot 環境を開きます。
```
oc debug node/<node name>
chroot /host
```
```
$ oc debug node/<node name>
$ chroot /host
```
Copy to Clipboard Toggle word wrap

デバイスが暗号化されていることを確認します。

dmsetup ls | grep ocs-deviceset
ocs-deviceset-0-data-0-57snx-block-dmcrypt (253:1)

$ dmsetup ls | grep ocs-deviceset
ocs-deviceset-0-data-0-57snx-block-dmcrypt (253:1)

Copy to Clipboard

Toggle word wrap

lsblk | grep ocs-deviceset
`-ocs-deviceset-0-data-0-57snx-block-dmcrypt 253:1    0   512G  0 crypt

$ lsblk | grep ocs-deviceset
`-ocs-deviceset-0-data-0-57snx-block-dmcrypt 253:1    0   512G  0 crypt

Copy to Clipboard

Toggle word wrap

検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.3. Amazon EC2 インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

ユーザーによってプロビジョニングされるインフラストラクチャーおよびインストーラーでプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え」
ユーザーによってプロビジョニングされるインフラストラクチャーおよびインストーラーでプロビジョニングされるインフラストラクチャーで障害のある Amazon EC2 ノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のある Amazon EC2 ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した Amazon EC2 ノードの置き換え」

2.3.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え
リンクのコピー

以下の手順に従って、Amazon EC2 I3 のユーザーによってプロビジョニングされるインフラストラクチャー (UPI) で動作するノードを置き換えます。

重要

Amazon EC2 I3 インフラストラクチャーのストレージノードの置き換えはテクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat の実稼働環境のサービスレベルアグリーメント (SLA) ではサポートされていないため、Red Hat では実稼働環境での使用を推奨していません。Red Hat は実稼働環境でこれらを使用することを推奨していません。これらの機能は、近々発表予定の製品機能をリリースに先駆けてご提供することにより、お客様は機能性をテストし、開発プロセス中にフィードバックをお寄せいただくことができます。

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

ノードを特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規 Amazon EC2 I3 マシンインスタンスを作成します。サポートされるインフラストラクチャーおよびプラットフォームについて参照してください。
新規 Amazon EC2 I3 マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードで利用可能なローカルストレージデバイスを OpenShift Container Storage StorageCluster に追加します。

新規ディスクエントリーを LocalVolume CR に追加します。

LocalVolume CR を編集します。障害のあるデバイス /dev/disk/by-id/{id} を削除またはコメントアウトし、新規の /dev/disk/by-id/{id} を追加します。

oc get -n $local_storage_project localvolume

$ oc get -n $local_storage_project localvolume

Copy to Clipboard

Toggle word wrap

出力例:

NAME          AGE
local-block   25h

NAME          AGE
local-block   25h

Copy to Clipboard

Toggle word wrap

oc edit -n $local_storage_project localvolume local-block

$ oc edit -n $local_storage_project localvolume local-block

Copy to Clipboard

Toggle word wrap

出力例:

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

Copy to Clipboard

Toggle word wrap

CR の編集後に変更を保存するようにしてください。

この CR に by-id を使用する 2 つの新規デバイスが追加されていることを確認できます。

nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4

localblock と共に PV を表示します。

oc get pv | grep localblock

$ oc get pv | grep localblock

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

Copy to Clipboard

Toggle word wrap

障害のあるノードに関連付けられたストレージリソースを削除します。
1. 置き換える OSD に関連付けられた DeviceSet を特定します。
  $ osd_id_to_remove=0 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-0 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68 ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68
  Copy to Clipboard Toggle word wrap
2. PVC に関連付けられた PV を特定します。
  $ oc get -n openshift-storage pvc ocs-deviceset-<x>-<y>-<pvc-suffix>
  Copy to Clipboard Toggle word wrap
  ここで、x、y、および pvc-suffix は、前の手順で識別された DeviceSet の値です。
  出力例:
  NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE ocs-deviceset-0-0-nvs68 Bound local-pv-8176b2bf 2328Gi RWO localblock 4h49m
  Copy to Clipboard Toggle word wrap
  この例では、関連付けられた PV は local-pv-8176b2bf です。
3. openshift-storage プロジェクトを変更します。
  $ oc project openshift-storage
  Copy to Clipboard Toggle word wrap
4. 失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
  $ oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=${osd_id_to_remove} | oc create -f -
  Copy to Clipboard Toggle word wrap
5. ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されることを確認します。Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
  # oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
  Copy to Clipboard Toggle word wrap
  注記
  ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
  
  # oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
  
  Copy to Clipboard Toggle word wrap
6. 先のステップで特定された PV を削除します。この例では、物理ボリューム名は local-pv-8176b2bf です。
  $ oc delete pv local-pv-8176b2bf
  Copy to Clipboard Toggle word wrap
  出力例:
  persistentvolume "local-pv-8176b2bf" deleted
  Copy to Clipboard Toggle word wrap

先の手順で特定された crashcollector Pod デプロイメントを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

Copy to Clipboard

Toggle word wrap

OSD と mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え
リンクのコピー

以下の手順を使用して、Amazon EC2 I3 のインストーラーでプロビジョニングされるインフラストラクチャー (IPI) で動作するノードを置き換えます。

重要

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。そのマシン名をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードで利用可能なローカルストレージデバイスを OpenShift Container Storage StorageCluster に追加します。

新規ディスクエントリーを LocalVolume CR に追加します。

LocalVolume CR を編集します。障害のあるデバイス /dev/disk/by-id/{id} を削除またはコメントアウトし、新規の /dev/disk/by-id/{id} を追加します。

oc get -n $local_storage_project localvolume

$ oc get -n $local_storage_project localvolume

Copy to Clipboard

Toggle word wrap

出力例:

NAME          AGE
local-block   25h

NAME          AGE
local-block   25h

Copy to Clipboard

Toggle word wrap

oc edit -n $local_storage_project localvolume local-block

$ oc edit -n $local_storage_project localvolume local-block

Copy to Clipboard

Toggle word wrap

出力例:

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

Copy to Clipboard

Toggle word wrap

CR の編集後に変更を保存するようにしてください。

この CR に by-id を使用する 2 つの新規デバイスが追加されていることを確認できます。

nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4

localblock と共に PV を表示します。

oc get pv | grep localblock

$ oc get pv | grep localblock

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

Copy to Clipboard

Toggle word wrap

障害のあるノードに関連付けられたストレージリソースを削除します。
1. 置き換える OSD に関連付けられた DeviceSet を特定します。
  $ osd_id_to_remove=0 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-0 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68 ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68
  Copy to Clipboard Toggle word wrap
2. PVC に関連付けられた PV を特定します。
  $ oc get -n openshift-storage pvc ocs-deviceset-<x>-<y>-<pvc-suffix>
  Copy to Clipboard Toggle word wrap
  ここで、x、y、および pvc-suffix は、前の手順で識別された DeviceSet の値です。
  出力例:
  NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE ocs-deviceset-0-0-nvs68 Bound local-pv-8176b2bf 2328Gi RWO localblock 4h49m
  Copy to Clipboard Toggle word wrap
  この例では、関連付けられた PV は local-pv-8176b2bf です。
3. openshift-storage プロジェクトを変更します。
  $ oc project openshift-storage
  Copy to Clipboard Toggle word wrap
4. 失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
  $ oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=${osd_id_to_remove} | oc create -f -
  Copy to Clipboard Toggle word wrap
5. ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されることを確認します。Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
  # oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
  Copy to Clipboard Toggle word wrap
  注記
  ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
  
  # oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
  
  Copy to Clipboard Toggle word wrap
6. 先のステップで特定された PV を削除します。この例では、物理ボリューム名は local-pv-8176b2bf です。
  $ oc delete pv local-pv-8176b2bf
  Copy to Clipboard Toggle word wrap
  出力例:
  persistentvolume "local-pv-8176b2bf" deleted
  Copy to Clipboard Toggle word wrap

先の手順で特定された crashcollector Pod デプロイメントを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

rook-ceph-operator を削除します。

oc delete -n openshift-storage pod rook-ceph-operator-6f74fb5bff-2d982

$ oc delete -n openshift-storage pod rook-ceph-operator-6f74fb5bff-2d982

Copy to Clipboard

Toggle word wrap

出力例:

pod "rook-ceph-operator-6f74fb5bff-2d982" deleted

pod "rook-ceph-operator-6f74fb5bff-2d982" deleted

Copy to Clipboard

Toggle word wrap

rook-ceph-operator Pod が再起動していることを確認します。

oc get -n openshift-storage pod -l app=rook-ceph-operator

$ oc get -n openshift-storage pod -l app=rook-ceph-operator

Copy to Clipboard

Toggle word wrap

出力例:

NAME                                  READY   STATUS    RESTARTS   AGE
rook-ceph-operator-6f74fb5bff-7mvrq   1/1     Running   0          66s

NAME                                  READY   STATUS    RESTARTS   AGE
rook-ceph-operator-6f74fb5bff-7mvrq   1/1     Running   0          66s

Copy to Clipboard

Toggle word wrap

新規 OSD の作成には、Operator が起動するまでに数分かかる場合があります。

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

Copy to Clipboard

Toggle word wrap

OSD と mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.3.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のある Amazon EC2 ノードの置き換え
リンクのコピー

OpenShift Container Storage の Amazon EC2 I3 の一時ストレージにより、インスタンスの電源がオフにされる場合にデータが失われる可能性があります。以下の手順を使用して、Amazon EC2 インフラストラクチャーでのインスタンスの電源オフからのリカバリーを行います。

重要

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

ノードを特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規 Amazon EC2 I3 マシンインスタンスを作成します。サポートされるインフラストラクチャーおよびプラットフォームについて参照してください。
新規 Amazon EC2 I3 マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードで利用可能なローカルストレージデバイスを OpenShift Container Storage StorageCluster に追加します。

新規ディスクエントリーを LocalVolume CR に追加します。

LocalVolume CR を編集します。障害のあるデバイス /dev/disk/by-id/{id} を削除またはコメントアウトし、新規の /dev/disk/by-id/{id} を追加します。

oc get -n $local_storage_project localvolume

$ oc get -n $local_storage_project localvolume

Copy to Clipboard

Toggle word wrap

出力例:

NAME          AGE
local-block   25h

NAME          AGE
local-block   25h

Copy to Clipboard

Toggle word wrap

oc edit -n $local_storage_project localvolume local-block

$ oc edit -n $local_storage_project localvolume local-block

Copy to Clipboard

Toggle word wrap

出力例:

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

Copy to Clipboard

Toggle word wrap

CR の編集後に変更を保存するようにしてください。

この CR に by-id を使用する 2 つの新規デバイスが追加されていることを確認できます。

nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4

localblock と共に PV を表示します。

oc get pv | grep localblock

$ oc get pv | grep localblock

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

Copy to Clipboard

Toggle word wrap

障害のあるノードに関連付けられたストレージリソースを削除します。
1. 置き換える OSD に関連付けられた DeviceSet を特定します。
  $ osd_id_to_remove=0 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-0 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68 ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68
  Copy to Clipboard Toggle word wrap
2. PVC に関連付けられた PV を特定します。
  $ oc get -n openshift-storage pvc ocs-deviceset-<x>-<y>-<pvc-suffix>
  Copy to Clipboard Toggle word wrap
  ここで、x、y、および pvc-suffix は、前の手順で識別された DeviceSet の値です。
  出力例:
  NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE ocs-deviceset-0-0-nvs68 Bound local-pv-8176b2bf 2328Gi RWO localblock 4h49m
  Copy to Clipboard Toggle word wrap
  この例では、関連付けられた PV は local-pv-8176b2bf です。
3. openshift-storage プロジェクトに変更します。
  $ oc project openshift-storage
  Copy to Clipboard Toggle word wrap
4. 失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
  $ oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=${osd_ids_to_remove} | oc create -f -
  Copy to Clipboard Toggle word wrap
5. ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されることを確認します。Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
  # oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
  Copy to Clipboard Toggle word wrap
  注記
  ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
  
  # oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
  
  Copy to Clipboard Toggle word wrap
6. 先のステップで特定された PV を削除します。この例では、物理ボリューム名は local-pv-8176b2bf です。
  $ oc delete pv local-pv-8176b2bf
  Copy to Clipboard Toggle word wrap
  出力例:
  persistentvolume "local-pv-8176b2bf" deleted
  Copy to Clipboard Toggle word wrap

先の手順で特定された crashcollector Pod デプロイメントを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

Copy to Clipboard

Toggle word wrap

OSD と mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.3.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した Amazon EC2 ノードの置き換え
リンクのコピー

重要

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。そのマシン名をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードで利用可能なローカルストレージデバイスを OpenShift Container Storage StorageCluster に追加します。

新規ディスクエントリーを LocalVolume CR に追加します。

LocalVolume CR を編集します。障害のあるデバイス /dev/disk/by-id/{id} を削除またはコメントアウトし、新規の /dev/disk/by-id/{id} を追加します。

oc get -n $local_storage_project localvolume

$ oc get -n $local_storage_project localvolume

Copy to Clipboard

Toggle word wrap

出力例:

NAME          AGE
local-block   25h

NAME          AGE
local-block   25h

Copy to Clipboard

Toggle word wrap

oc edit -n $local_storage_project localvolume local-block

$ oc edit -n $local_storage_project localvolume local-block

Copy to Clipboard

Toggle word wrap

出力例:

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

[...]
    storageClassDevices:
    - devicePaths:
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441494EC
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE4
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS10382E5D7441464EP
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS1F45C01D7E84F43E7
  #   - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS136BC945B4ECB9AE8
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
      - /dev/disk/by-id/nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4
      storageClassName: localblock
      volumeMode: Block
[...]

Copy to Clipboard

Toggle word wrap

CR の編集後に変更を保存するようにしてください。

この CR に by-id を使用する 2 つの新規デバイスが追加されていることを確認できます。

nvme-Amazon_EC2_NVMe_Instance_Storage_AWS6F45C01D7E84FE3E9
nvme-Amazon_EC2_NVMe_Instance_Storage_AWS636BC945B4ECB9AE4

localblock と共に PV を表示します。

oc get pv | grep localblock

$ oc get pv | grep localblock

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

local-pv-3646185e   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-3933e86    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-1-v9jp4   localblock  5h1m
local-pv-8176b2bf   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-0-nvs68   localblock  5h1m
local-pv-ab7cabb3   2328Gi  RWO     Delete      Available                                               localblock  9s
local-pv-ac52e8a    2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-0-knrgr   localblock  5h1m
local-pv-b7e6fd37   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-2-0-rdm7m   localblock  5h1m
local-pv-cb454338   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-0-1-h9hfm   localblock  5h1m
local-pv-da5e3175   2328Gi  RWO     Delete      Bound       openshift-storage/ocs-deviceset-1-1-g97lq   localblock  5h
...

Copy to Clipboard

Toggle word wrap

障害のあるノードに関連付けられたストレージリソースを削除します。
1. 置き換える OSD に関連付けられた DeviceSet を特定します。
  $ osd_id_to_remove=0 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-0 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68 ceph.rook.io/pvc: ocs-deviceset-0-0-nvs68
  Copy to Clipboard Toggle word wrap
2. PVC に関連付けられた PV を特定します。
  $ oc get -n openshift-storage pvc ocs-deviceset-<x>-<y>-<pvc-suffix>
  Copy to Clipboard Toggle word wrap
  ここで、x、y、および pvc-suffix は、前の手順で識別された DeviceSet の値です。
  出力例:
  NAME STATUS VOLUME CAPACITY ACCESS MODES STORAGECLASS AGE ocs-deviceset-0-0-nvs68 Bound local-pv-8176b2bf 2328Gi RWO localblock 4h49m
  Copy to Clipboard Toggle word wrap
  この例では、関連付けられた PV は local-pv-8176b2bf です。
3. openshift-storage プロジェクトに変更します。
  $ oc project openshift-storage
  Copy to Clipboard Toggle word wrap
4. 失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
  $ oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=${osd_ids_to_remove} | oc create -f -
  Copy to Clipboard Toggle word wrap
5. ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されることを確認します。Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
  # oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
  Copy to Clipboard Toggle word wrap
  注記
  ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
  
  # oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
  
  Copy to Clipboard Toggle word wrap
6. 先のステップで特定された PV を削除します。この例では、物理ボリューム名は local-pv-8176b2bf です。
  $ oc delete pv local-pv-8176b2bf
  Copy to Clipboard Toggle word wrap
  出力例:
  persistentvolume "local-pv-8176b2bf" deleted
  Copy to Clipboard Toggle word wrap

先の手順で特定された crashcollector Pod デプロイメントを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<old_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

rook-ceph-mon-a-64556f7659-c2ngc    1/1     Running     0   5h1m
rook-ceph-mon-b-7c8b74dc4d-tt6hd    1/1     Running     0   5h1m
rook-ceph-mon-d-57fb8c657-wg5f2     1/1     Running     0   27m

Copy to Clipboard

Toggle word wrap

OSD と mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4. VMWare インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、以下を参照してください。
- 「VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」
- 「VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」
障害のあるノードを置き換えるには、以下を参照してください。
- 「VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え」
- 「VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え」

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

NODE を特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
VSphere にログインし、特定された仮想マシンを終了します。
必要なインフラストラクチャーで VMware に新規の仮想マシンを作成します。サポートされるインフラストラクチャーおよびプラットフォームについて参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
物理的に新規デバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

PVC に関連付けられた PV を特定します。

#oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

#oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

#oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d9c5cbd6" deleted

#oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

NODE を特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
VSphere にログインし、特定された仮想マシンを終了します。
必要なインフラストラクチャーで VMware に新規の仮想マシンを作成します。サポートされるインフラストラクチャーおよびプラットフォームについて参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソースおよびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更についての以下の手順に従って、これを実行します。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあるかどうかを確認します。
物理的に新規デバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。

$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

PVC に関連付けられた PV を特定します。

#oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

#oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

#oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d9c5cbd6" deleted

#oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、「Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」を参照してください。
障害のあるノードを置き換えるには、「Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え」を参照してください。

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソース、およびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更の手順に従って、いますぐそれを行うことができます。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更の手順に従って、いますぐそれを行うことができます。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
物理的に新しいデバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=_<failed_osd_id>_ FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=_<failed_osd_id>_ FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

PVC に関連付けられた PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d6bf175b" deleted

# oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d6bf175b" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod がある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal ジョブを削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャー、リソース、およびディスクで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、デバイスの自動プロビジョニングを有効にするために LocalVolumeSet オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更の手順に従って、いますぐそれを行うことができます。
以前のバージョンから OpenShift Container Storage 4.7 にアップグレードし、LocalVolumeDiscovery オブジェクトを作成していない場合は、ローカルストレージでサポートされるクラスターの更新後の設定の変更の手順に従って、いますぐそれを行うことができます。

手順

OpenShift Web コンソールにログインし、 Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには少なくとも 5-10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新規ノードが Ready 状態にあるかどうかを確認します。
物理的に新しいデバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

# oc get -n $local_storage_project localvolumeset
NAME          AGE
localblock   25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

$oc get pv | grep localblock | grep Available
local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=_<failed_osd_id>_ FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=_<failed_osd_id>_ FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

PVC に関連付けられた PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d6bf175b" deleted

# oc delete pv local-pv-d6bf175b
persistentvolume "local-pv-d6bf175b" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=failed-node-name -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal ジョブを削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0   38m

rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0   38m

rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0   4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0   38m

rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0   38m

rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0   4m8s

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
1. 直前の手順で特定された新規ノードごとに、以下を実行します。
  1. デバッグ Pod を作成し、選択したホストの chroot 環境を開きます。
    
    $ oc debug node/<node name> $ chroot /host
    
    Copy to Clipboard Toggle word wrap
  2. lsblk を実行し、ocs-deviceset 名の横にある crypt キーワードを確認します。
    
    $ lsblk
    
    Copy to Clipboard Toggle word wrap
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.6. IBM Power Systems インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

OpenShift Container Storage 4.3 では、ノード置き換えを、IBM Power Systems 関連のデプロイメントで動作するノードについてプロアクティブに実行し、失敗したノードのそれぞれについてリアクティブに実行することができます。

2.6.1. IBM Power Systems で動作するストレージまたは障害のあるストレージノードの置き換え
リンクのコピー

前提条件

Red Hat では、交換前のノードと同様のインフラストラクチャーおよびリソースで、交換後のノードを設定することを推奨します。
OpenShift Container Platform (RHOCP) クラスターにログインしている必要があります。

手順

ノードを特定し、置き換えるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon (ある場合) および OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-a --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-1 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-a --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-1 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod の削除

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-local-data --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規の IBM Power マシンを取得します。クラスターの IBM Power Systems へのインストールについて参照してください。
新規 IBM Power Systems マシンを使用して新規 OpenShift Container Platform Systems ノードを作成します。
Pending 状態の OpenShift Container Storage に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Storage CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
優先するインターフェイスを使用して、OpenShift Container Storage ラベルを新規ノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードについて、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenS+hift Container Storage ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)
echo $local_storage_project
openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規に追加されたワーカーノードを localVolumeSet に追加します。

編集する localVolumeSet を決定します。

oc get -n $local_storage_project localvolumeset
NAME           AGE
localblock    25h

# oc get -n $local_storage_project localvolumeset
NAME           AGE
localblock    25h

Copy to Clipboard

Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock
[...]
    nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            #- worker-0
            - worker-1
            - worker-2
            - worker-3
[...]

# oc edit -n $local_storage_project localvolumeset localblock
[...]
    nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            #- worker-0
            - worker-1
            - worker-2
            - worker-3
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、worker-0 が削除されて worker-3 が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

oc get pv | grep localblock
NAME              CAPACITY   ACCESSMODES RECLAIMPOLICY STATUS     CLAIM             STORAGECLASS                 AGE
local-pv-3e8964d3    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-2-data-0-mdbg9  localblock     25h
local-pv-414755e0    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-1-data-0-4cslf  localblock     25h
local-pv-b481410   500Gi     RWO        Delete       Available                                            localblock     3m24s
local-pv-5c9b8982    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-0-data-0-g2mmc  localblock     25h

$ oc get pv | grep localblock
NAME              CAPACITY   ACCESSMODES RECLAIMPOLICY STATUS     CLAIM             STORAGECLASS                 AGE
local-pv-3e8964d3    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-2-data-0-mdbg9  localblock     25h
local-pv-414755e0    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-1-data-0-4cslf  localblock     25h
local-pv-b481410   500Gi     RWO        Delete       Available                                            localblock     3m24s
local-pv-5c9b8982    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-0-data-0-g2mmc  localblock     25h

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
1. PVC を特定します。後に、その特定の PVC に関連付けられた PV を削除する必要があるためです。
  $ osd_id_to_remove=1 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-1 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc
  Copy to Clipboard Toggle word wrap
  この例では、PVC 名は ocs-deviceset-localblock-0-data-0-g2mmc です。
2. 失敗した OSD をクラスターから削除します。
  $ oc process -n openshift-storage ocs-osd-removal \ -p FAILED_OSD_IDS=<failed_osd_id> FORCE_OSD_REMOVAL=false | oc create -n openshift-storage -f -
  Copy to Clipboard Toggle word wrap
  コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます。(例: FAILED_OSD_IDS=0,1,2)
  OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
  警告
  この手順により、OSD はクラスターから完全に削除されます。osd_id_to_remove の正しい値が指定されていることを確認します。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されることを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage
Copy to Clipboard Toggle word wrap

障害のあるノードに関連付けられた PV を削除します。

PVC に関連付けられた PV を特定します。PVC 名は、手順 16(a) で取得した内容と同じでなければなりません。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-5c9b8982  500Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-localblock-0-data-0-g2mmc  localblock  24h  worker-0

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-5c9b8982  500Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-localblock-0-data-0-g2mmc  localblock  24h  worker-0

Copy to Clipboard

Toggle word wrap

PV を削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-5c9b8982
persistentvolume "local-pv-5c9b8982" deleted

# oc delete pv local-pv-5c9b8982
persistentvolume "local-pv-5c9b8982" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

以下のコマンドを実行して、出力で新規ノードが表示されていることを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックし、新規ノード上の少なくとも以下の Pod が Running 状態にあることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Container Storage Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-b-74f6dc9dd6-4llzq                                   1/1     Running     0          6h14m
rook-ceph-mon-c-74948755c-h7wtx                                  1/1     Running     0          4h24m
rook-ceph-mon-d-598f69869b-4bv49                                   1/1     Running     0          162m

rook-ceph-mon-b-74f6dc9dd6-4llzq                                   1/1     Running     0          6h14m
rook-ceph-mon-c-74948755c-h7wtx                                  1/1     Running     0          4h24m
rook-ceph-mon-d-598f69869b-4bv49                                   1/1     Running     0          162m

Copy to Clipboard

Toggle word wrap

OSD と Mon が Running 状態になるまで数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i new-node-name | egrep osd

Copy to Clipboard

Toggle word wrap

検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

ノードの置き換え

置き換え用のノードを準備し、障害が発生したノードを置き換える方法

多様性を受け入れるオープンソースの強化リンクのコピーリンクがクリップボードにコピーされました!

Red Hat ドキュメントへのフィードバックの提供リンクのコピーリンクがクリップボードにコピーされました!

はじめにリンクのコピーリンクがクリップボードにコピーされました!

第1章 動的デバイスを使用してデプロイされた OpenShift Container Storageリンクのコピーリンクがクリップボードにコピーされました!

1.1. AWS にデプロイされる OpenShift Container Storageリンクのコピーリンクがクリップボードにコピーされました!

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2. VMware にデプロイされる OpenShift Container Storageリンクのコピーリンクがクリップボードにコピーされました!

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.3. Red Hat Virtualization にデプロイされた OpenShift Container Storageリンクのコピーリンクがクリップボードにコピーされました!

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.4. Microsoft Azure でデプロイされた OpenShift Container Storageリンクのコピーリンクがクリップボードにコピーされました!

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

第2章 ローカルストレージデバイスを使用した OpenShift Container Storage のデプロイリンクのコピーリンクがクリップボードにコピーされました!

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2. IBM Z または LinuxONE インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2.1. IBM Z または LinuxONE インフラストラクチャーでの動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2.2. IBM Z または LinuxONE インフラストラクチャーでの障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3. Amazon EC2 インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のある Amazon EC2 ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した Amazon EC2 ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4. VMWare インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.6. IBM Power Systems インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.6.1. IBM Power Systems で動作するストレージまたは障害のあるストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

多様性を受け入れるオープンソースの強化
リンクのコピー

Red Hat ドキュメントへのフィードバックの提供
リンクのコピー

はじめに
リンクのコピー

第1章動的デバイスを使用してデプロイされた OpenShift Container Storage
リンクのコピー

1.1. AWS にデプロイされる OpenShift Container Storage
リンクのコピー

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

1.2. VMware にデプロイされる OpenShift Container Storage
リンクのコピー

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

1.3. Red Hat Virtualization にデプロイされた OpenShift Container Storage
リンクのコピー

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換え
リンクのコピー

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換え
リンクのコピー

1.4. Microsoft Azure でデプロイされた OpenShift Container Storage
リンクのコピー

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

第2章ローカルストレージデバイスを使用した OpenShift Container Storage のデプロイ
リンクのコピー

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

2.2. IBM Z または LinuxONE インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.2.1. IBM Z または LinuxONE インフラストラクチャーでの動作するノードの置き換え
リンクのコピー

2.2.2. IBM Z または LinuxONE インフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

2.3. Amazon EC2 インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.3.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え
リンクのコピー

2.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Amazon EC2 ノードの置き換え
リンクのコピー

2.3.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のある Amazon EC2 ノードの置き換え
リンクのコピー

2.3.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した Amazon EC2 ノードの置き換え
リンクのコピー

2.4. VMWare インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

2.6. IBM Power Systems インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.6.1. IBM Power Systems で動作するストレージまたは障害のあるストレージノードの置き換え
リンクのコピー