ノードの置き換え

Red Hat OpenShift Data Foundation 4.13

OpenShift Data Foundation クラスターのノードを安全に置き換える手順

Red Hat Storage Documentation Team

概要

このドキュメントでは、Red Hat OpenShift Data Foundation クラスターのノードを安全に置き換える方法を説明します。

多様性を受け入れるオープンソースの強化
リンクのコピー

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。まずは、マスター (master)、スレーブ (slave)、ブラックリスト (blacklist)、ホワイトリスト (whitelist) の 4 つの用語の置き換えから始めます。この取り組みは膨大な作業を要するため、用語の置き換えは、今後の複数のリリースにわたって段階的に実施されます。詳細は、Red Hat CTO である Chris Wright のメッセージをご覧ください。

Red Hat ドキュメントへのフィードバック (英語のみ)
リンクのコピー

Red Hat ドキュメントに対するご意見をお聞かせください。ドキュメントの改善点があれば、ぜひお知らせください。

フィードバックを送信するには、Bugzilla チケットを作成します。

Bugzilla の Web サイトに移動します。
Component セクションで、documentation を選択します。
Description フィールドに、ドキュメントの改善に向けたご提案を記入してください。ドキュメントの該当部分へのリンクも記載してください。
Submit Bug をクリックします。

はじめに
リンクのコピー

OpenShift Data Foundation では、動作ノードに対しては事前対応として、以下のデプロイメントで障害のあるノードに対しては事後対応として、ノードを交換できます。

Amazon Web Services (AWS)
- ユーザーによってプロビジョニングされるインフラストラクチャー
- インストーラーでプロビジョニングされるインフラストラクチャー
VMware
- ユーザーによってプロビジョニングされるインフラストラクチャー
- Installer-provisioned infrastructure
Red Hat Virtualization の場合:
- Installer-provisioned infrastructure
Microsoft Azure
- インストーラーでプロビジョニングされるインフラストラクチャー
ローカルストレージデバイスの場合
- ベアメタル
- VMware
- Red Hat Virtualization
- IBM Power
外部モードでストレージノードを置き換える場合は、Red Hat Ceph Storage のドキュメントを参照してください。

第1章動的デバイスを使用してデプロイされた OpenShift Data Foundation
リンクのコピー

1.1. AWS にデプロイされた OpenShift Data Foundation
リンクのコピー

動作するノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え」
障害のあるノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え」
- 「インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え」

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャーとリソースで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

注記

ユーザーがプロビジョニングしたインフラストラクチャー上の AWS ノードを交換する場合は、新しいノードを元のノードと同じ AWS ゾーンに作成する必要があります。

手順

置き換える必要のあるノードを特定します。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
ノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーを使用して、新しい Amazon Web Service (AWS) マシンインスタンスを作成します。プラットフォーム要件を参照してください。
新規 AWS マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャーとリソースで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

置き換える必要のあるノードの Amazon Web Service (AWS) マシンインスタンスを特定します。
AWS にログインし、特定した AWS マシンインスタンスを終了します。
必要なインフラストラクチャーで新規 AWS マシンインスタンスを作成します。プラットフォーム要件を参照してください。
新規 AWS マシンインスタンスを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新規ノードごとに、以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新規マシンが起動するのを待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。
オプション: 失敗した Amazon Web Service (AWS) インスタンスが自動的に削除されない場合は、AWS コンソールからインスタンスを終了します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2. VMware にデプロイされた OpenShift Data Foundation
リンクのコピー

動作するノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え」。
- 「インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え」.
障害のあるノードを置き換えるには、以下を参照してください。
- 「ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え」.
- 「インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え」.

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャーとリソースで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

置き換える必要のあるノードとその仮想マシン (VM) を特定します。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
ノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
VMware vSphere にログインし、特定した VM を終了します。
重要
VM はインベントリーからのみ削除し、ディスクからは削除しないでください。
必要なインフラストラクチャーを使用して、VMware vSphere 上に新しい VM を作成します。プラットフォーム要件を参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャーとリソースで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

置き換える必要のあるノードとその仮想マシン (VM) を特定します。
ノードを削除します。
```
oc delete nodes <node_name>
```
```
$ oc delete nodes <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
VMware vSphere にログインし、特定した VM を終了します。
重要
VM はインベントリーからのみ削除し、ディスクからは削除しないでください。
必要なインフラストラクチャーを使用して、VMware vSphere 上に新しい VM を作成します。プラットフォーム要件を参照してください。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新しいマシンが起動するのを待ちます。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。
オプション: 障害が発生した仮想マシン (VM) が自動的に削除されない場合は、VMware vSphere から VM を終了します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.3. Red Hat Virtualization にデプロイされた OpenShift Data Foundation
リンクのコピー

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソール にログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換え
リンクのコピー

手順

OpenShift Web コンソール にログインし、Compute → Nodes をクリックします。
障害のあるノードを特定します。その マシン名 をメモします。
仮想マシン (VM) インスタンスを削除するときに、ディスクが削除されていないことを確認してください。
- Red Hat Virtualization 管理ポータル にログインし、障害が発生した VM からモニター Pod とオブジェクトストレージデバイス (OSD) に関連付けられている仮想ディスクを削除します。
  重要
  1 つ以上のディスクを取り外すときは、Remove Permanently オプションを選択しないでください。
OpenShift Web コンソール で、Compute → Machines をクリックします。必要なマシンを検索します。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新しいマシンが起動するのを待ちます。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。
オプション: 失敗した仮想マシンが自動的に削除されない場合は、Red Hat Virtualization 管理ポータルから仮想マシンを削除します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.4. Microsoft Azure にデプロイされた OpenShift Data Foundation
リンクのコピー

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードをドレイン (解放) します。
```
oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
```
$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets
```
Copy to Clipboard Toggle word wrap
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads→ Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新しいマシンが起動するのを待ちます。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。
オプション: 失敗した Azure インスタンスが自動的に削除されない場合、インスタンスを Azure コンソールで終了します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

第2章ローカルストレージデバイスを使用してデプロイされた OpenShift Data Foundation
リンクのコピー

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、「ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」を参照します。
障害のあるノードを置き換えるには、「ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え」を参照します。

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

ノードを特定し、置き換える必要のあるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
モニター Pod (存在する場合)、および置き換える必要のあるノードで実行されている OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規のベアメタルマシンを取得します。ベアメタルへのインストールを参照します。
重要
OpenShift Data Foundation を 3 ノードの OpenShift のコンパクトなベアメタルクラスターにインストールした場合にマスターノードを置き換える方法については、OpenShift Container Platform ドキュメントのBackup and Restoreガイドを参照してください。
新規ベアメタルマシンを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリューム要求 (PVC) に関連付けられた永続ボリューム (PV) を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

ノードを特定し、置き換える必要のあるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
モニター Pod (存在する場合)、および置き換える必要のあるノードで実行されている OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規のベアメタルマシンを取得します。ベアメタルへのインストールを参照します。
重要
OpenShift Data Foundation を 3 ノードの OpenShift のコンパクトなベアメタルクラスターにインストールした場合にマスターノードを置き換える方法については、OpenShift Container Platform ドキュメントのBackup and Restoreガイドを参照してください。
新規ベアメタルマシンを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリューム要求 (PVC) に関連付けられた永続ボリューム (PV) を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

以下のいずれかの手順を選択して、ストレージノードを置き換えることができます。

「IBM Z または IBM® LinuxONE インフラストラクチャーでの動作するノードの置き換え」.
「IBM Z または IBM® LinuxONE インフラストラクチャーでの障害のあるノードの置き換え」.

2.2.1. IBM Z または IBM® LinuxONE インフラストラクチャーでの動作するノードの置き換え
リンクのコピー

以下の手順に従って、IBM Z または IBM® LinuxONE インフラストラクチャーで動作するノードを置き換えます。

手順

ノードを特定し、置き換えるノードのラベルを取得します。ラックラベルをメモします。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
置き換えるノードで実行されている mon(ある場合) およびオブジェクトストレージデバイス (OSD) Pod を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage
$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage
$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
新しい IBM Z ストレージノードを交換品として入手します。
Pending 状態の OpenShift Data Foundation に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Data Foundation CSR を承認します。
```
oc adm certificate approve <Certificate_Name>
```
```
$ oc adm certificate approve <Certificate_Name>
```
Copy to Clipboard Toggle word wrap
OpenShift Web コンソールで Compute → Nodes をクリックし、新規ノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、openshift-storage ラベルを新しいノードに適用します。
ユーザーインターフェイスを使用する場合
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
以下のコマンドを実行して、OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n local-storage-project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n local-storage-project localvolumediscovery auto-discover-devices
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

編集する localVolumeSet を決定します。
以下のコマンドの local-storage-project は、ローカルストレージプロジェクトの名前に置き換えます。OpenShift Data Foundation 4.6 以降では、デフォルトのプロジェクト名は openshift-local-storage です。以前のバージョンでは、デフォルトで local-storage を使用します。
```
oc get -n local-storage-project localvolumeset
NAME          AGE
localblock   25h
```
```
# oc get -n local-storage-project localvolumeset
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n local-storage-project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

# oc edit -n local-storage-project localvolumeset localblock
[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

上記の例では、server3.example.com が削除され、newnode.example.com が新規ノードになります。

新規 localblock PV が利用可能であることを確認します。

oc get pv | grep localblock
          CAPA- ACCESS RECLAIM                                STORAGE
NAME      CITY  MODES  POLICY  STATUS     CLAIM               CLASS       AGE
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
3e8964d3                                  ocs-deviceset-2-0
                                          -79j94
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
414755e0                                  ocs-deviceset-1-0
                                          -959rp
local-pv- 931Gi RWO Delete Available localblock 3m24s b481410
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
d9c5cbd6                                  ocs-deviceset-0-0
                                          -nvs68

$ oc get pv | grep localblock
          CAPA- ACCESS RECLAIM                                STORAGE
NAME      CITY  MODES  POLICY  STATUS     CLAIM               CLASS       AGE
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
3e8964d3                                  ocs-deviceset-2-0
                                          -79j94
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
414755e0                                  ocs-deviceset-1-0
                                          -959rp
local-pv- 931Gi RWO Delete Available localblock 3m24s b481410
local-pv- 931Gi  RWO   Delete  Bound      openshift-storage/  localblock  25h
d9c5cbd6                                  ocs-deviceset-0-0
                                          -nvs68

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトを変更します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
1. PVC を特定します。後に、その特定の PVC に関連付けられた PV を削除する必要があるためです。
  $ osd_id_to_remove=1 $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${osd_id_to_remove} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、osd_id_to_remove は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。この例では、デプロイメント名は rook-ceph-osd-1 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc
  Copy to Clipboard Toggle word wrap
  この例では、PVC 名は ocs-deviceset-localblock-0-data-0-g2mmc です。
2. 失敗した OSD をクラスターから削除します。
  $ oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=${osd_id_to_remove} |oc create -f -
  Copy to Clipboard Toggle word wrap
  コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます。(例: FAILED_OSD_IDS=0,1,2)
  警告
  この手順により、OSD はクラスターから完全に削除されます。osd_id_to_remove の正しい値が指定されていることを確認します。
ocs-osd-removal Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-osd_id_to_remove -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-osd_id_to_remove -n openshift-storage
```
Copy to Clipboard Toggle word wrap
注記
ocs-osd-removal が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。以下に例を示します。
# oc logs -l job-name=ocs-osd-removal-osd_id_to_remove -n openshift-storage --tail=-1
Copy to Clipboard Toggle word wrap
次のように、削除された OSD を手動でクリーンアップする必要がある場合があります。
```
ceph osd crush remove osd.osd_id_to_remove
ceph osd rm osd_id_to_remove
ceph auth del osd.osd_id_to_remove
ceph osd crush rm osd_id_to_remove
```
```
ceph osd crush remove osd.osd_id_to_remove
ceph osd rm osd_id_to_remove
ceph auth del osd.osd_id_to_remove
ceph osd crush rm osd_id_to_remove
```
Copy to Clipboard Toggle word wrap

障害のあるノードに関連付けられた PV を削除します。

PVC に関連付けられた PV を特定します。

PVC 名は、失敗した OSD をクラスターから削除する際に取得された名前と同じである必要があります。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-5c9b8982  500Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-localblock-0-data-0-g2mmc  localblock  24h  worker-0

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
local-pv-5c9b8982  500Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-localblock-0-data-0-g2mmc  localblock  24h  worker-0

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent-volume>

# oc delete pv <persistent-volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-5c9b8982
persistentvolume "local-pv-5c9b8982" deleted

# oc delete pv local-pv-5c9b8982
persistentvolume "local-pv-5c9b8982" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal ジョブを削除します。

oc delete job ocs-osd-removal-${osd_id_to_remove}

# oc delete job ocs-osd-removal-${osd_id_to_remove}

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-0" deleted

job.batch "ocs-osd-removal-0" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
オプション: クラスターでデータの暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
障害のあるノードを特定し、その Machine Name をクリックします。
Actions → Edit Annotations をクリックし、Add More をクリックします。
machine.openshift.io/exclude-node-draining を追加し、Save をクリックします。
Actions → Delete Machine をクリックしてから、Delete をクリックします。
新しいマシンが自動的に作成されます。新しいマシンが起動するのを待ちます。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。この期間中に生成された Ceph エラーは一時的なものであり、新しいノードにラベルを付けると自動的に解決され、機能します。
Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= | cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= | cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*
他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。
新しいオブジェクトストレージデバイス (OSD) Pod が置き換えるノードで実行されていることを確認します。
```
oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
```
$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd
```
Copy to Clipboard Toggle word wrap
オプション: クラスターでデータの暗号化が有効な場合には、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.3. IBM Power インフラストラクチャー上のストレージノードの置き換え
リンクのコピー

OpenShift Data Foundation の場合、IBM Power に関連するデプロイメントは、稼働中のノードに対してプロアクティブに、障害のあるノードに対してリアクティブにノードの置き換えを実行できます。

2.3.1. IBM Power で動作するストレージまたは障害のあるストレージノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャーとリソースで設定されていることを確認してください。
OpenShift Container Platform クラスターにログインしている。

手順

ノードを特定し、置き換える必要のあるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
置き換える必要のあるノードで実行されている mon (存在する場合) および Object Storage Device (OSD) Pod を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-a --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-a --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-1 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-1 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name> --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
必要なインフラストラクチャーで新規の IBM Power マシンを取得します。クラスターの IBM Power へのインストールを参照します。
新規 IBM Power マシンを使用して新規 OpenShift Container Platform ノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=''

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新しく追加されたワーカーノードを localVolume に追加します。

編集する必要のある localVolume を決定します。
```
oc get -n $local_storage_project localvolume
```
```
# oc get -n $local_storage_project localvolume
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME           AGE
localblock    25h
```
```
NAME           AGE
localblock    25h
```
Copy to Clipboard Toggle word wrap

localVolume 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolume localblock

# oc edit -n $local_storage_project localvolume localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
    nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            #- worker-0
            - worker-1
            - worker-2
            - worker-3
[...]

[...]
    nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            #- worker-0
            - worker-1
            - worker-2
            - worker-3
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、worker-0 が削除され、worker-3 が新しいノードです。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

oc get pv | grep localblock

$ oc get pv | grep localblock

Copy to Clipboard

Toggle word wrap

出力例:

NAME              CAPACITY   ACCESSMODES RECLAIMPOLICY STATUS     CLAIM             STORAGECLASS                 AGE
local-pv-3e8964d3    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-2-data-0-mdbg9  localblock     25h
local-pv-414755e0    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-1-data-0-4cslf  localblock     25h
local-pv-b481410    500Gi     RWO        Delete       Available                                            localblock     3m24s
local-pv-5c9b8982    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-0-data-0-g2mmc  localblock     25h

NAME              CAPACITY   ACCESSMODES RECLAIMPOLICY STATUS     CLAIM             STORAGECLASS                 AGE
local-pv-3e8964d3    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-2-data-0-mdbg9  localblock     25h
local-pv-414755e0    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-1-data-0-4cslf  localblock     25h
local-pv-b481410    500Gi     RWO        Delete       Available                                            localblock     3m24s
local-pv-5c9b8982    500Gi    RWO         Delete       Bound      ocs-deviceset-localblock-0-data-0-g2mmc  localblock     25h

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
1. 永続ボリュームクレーム (PVC) を特定します。
  $ osd_id_to_remove=1
  Copy to Clipboard Toggle word wrap
  $ oc get -n openshift-storage -o yaml deployment rook-ceph-osd-${<osd_id_to_remove>} | grep ceph.rook.io/pvc
  Copy to Clipboard Toggle word wrap
  ここで、<osd_id_to_remove> は rook-ceph-osd 接頭辞の直後にくる Pod 名の整数です。
  この例では、デプロイメント名は rook-ceph-osd-1 です。
  出力例:
  ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc ceph.rook.io/pvc: ocs-deviceset-localblock-0-data-0-g2mmc
  Copy to Clipboard Toggle word wrap
2. 失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
  $ oc process -n openshift-storage ocs-osd-removal \ -p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
  Copy to Clipboard Toggle word wrap
  <failed_osd_id>
  rook-ceph-osd 接頭辞の直後の Pod 名の整数です。コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
  OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
  警告
  この手順により、OSD はクラスターから完全に削除されます。osd_id_to_remove の正しい値が指定されていることを確認します。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

障害のあるノードに関連付けられた PV を削除します。
1. PVC に関連付けられた PV を特定します。
  # oc get pv -L kubernetes.io/hostname | grep localblock | grep Released
  Copy to Clipboard Toggle word wrap
  出力例:
  local-pv-5c9b8982 500Gi RWO Delete Released openshift-storage/ocs-deviceset-localblock-0-data-0-g2mmc localblock 24h worker-0
  Copy to Clipboard Toggle word wrap
  PVC 名は、失敗した OSD をクラスターから削除する際に取得された名前と同じである必要があります。
2. Released 状態の PV がある場合は、これを削除します。
  # oc delete pv <persistent_volume>
  Copy to Clipboard Toggle word wrap
  以下に例を示します。
  # oc delete pv local-pv-5c9b8982
  Copy to Clipboard Toggle word wrap
  出力例:
  persistentvolume "local-pv-5c9b8982" deleted
  Copy to Clipboard Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-b-74f6dc9dd6-4llzq                                   1/1     Running     0          6h14m
rook-ceph-mon-c-74948755c-h7wtx                                    1/1     Running     0          4h24m
rook-ceph-mon-d-598f69869b-4bv49                                   1/1     Running     0          162m

rook-ceph-mon-b-74f6dc9dd6-4llzq                                   1/1     Running     0          6h14m
rook-ceph-mon-c-74948755c-h7wtx                                    1/1     Running     0          4h24m
rook-ceph-mon-d-598f69869b-4bv49                                   1/1     Running     0          162m

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4. VMWare インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、以下を参照してください。
- 「VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」.
- 「VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」.
障害のあるノードを置き換えるには、以下を参照してください。
- 「VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え」.
- 「VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え」.

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

ノードを特定し、置き換える必要のあるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
モニター Pod (存在する場合)、および置き換える必要のあるノードで実行されている OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
VMware vSphere にログインし、特定した仮想マシン (VM) を終了します。
必要なインフラストラクチャーを使用して、VMware vSphere 上に新しい VM を作成します。インフラストラクチャーの要件を参照します。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリューム要求 (PVC) に関連付けられた永続ボリューム (PV) を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードで実行されている mon (存在する場合) と Object Storage Devices (OSD) を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

前の手順で特定した Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックしてマシンの削除を確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
物理的に新規デバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する必要がある localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

oc get pv | grep localblock | grep Available

$ oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリュームクレーム (PVC) に関連付けられている PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

ノードを特定し、置き換える必要のあるノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
モニター Pod (存在する場合)、および置き換える必要のあるノードで実行されている OSD を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

ノードを削除します。
```
oc delete node <node_name>
```
```
$ oc delete node <node_name>
```
Copy to Clipboard Toggle word wrap
VMware vSphere にログインし、特定した仮想マシン (VM) を終了します。
必要なインフラストラクチャーを使用して、VMware vSphere 上に新しい VM を作成します。インフラストラクチャーの要件を参照します。
新規の仮想マシンを使用して新規 OpenShift Container Platform ワーカーノードを作成します。
Pending 状態の OpenShift Container Platform に関連する証明書署名要求 (CSR) の有無を確認します。
```
oc get csr
```
```
$ oc get csr
```
Copy to Clipboard Toggle word wrap
新規ノードに必要なすべての OpenShift Container Platform CSR を承認します。
```
oc adm certificate approve <certificate_name>
```
```
$ oc adm certificate approve <certificate_name>
```
Copy to Clipboard Toggle word wrap
<certificate_name>
CSR の名前を指定します。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリューム要求 (PVC) に関連付けられた永続ボリューム (PV) を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードのラベルを取得します。
```
oc get nodes --show-labels | grep _<node_name>_
```
```
$ oc get nodes --show-labels | grep _<node_name>_
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードで実行されている mon (存在する場合) と Object Storage Devices (OSD) を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i _<node_name>_
```
```
$ oc get pods -n openshift-storage -o wide | grep -i _<node_name>_
```
Copy to Clipboard Toggle word wrap

先の手順で特定された Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon _<node_name>_
```
```
$ oc adm cordon _<node_name>_
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i _<node_name>_ |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i _<node_name>_ |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain _<node_name>_ --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain _<node_name>_ --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。
新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
物理的に新規デバイスをノードに追加します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node _<new_node_name>_ cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - **newnode.example.com**
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - **newnode.example.com**
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する必要がある localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - **newnode.example.com**
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - **newnode.example.com**
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新規 localblock PV が利用可能であることを確認します。

oc get pv | grep localblock | grep Available

$ oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリュームクレーム (PVC) に関連付けられている PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

local-pv-d6bf175b  1490Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  compute-1

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv _<persistent_volume>_

# oc delete pv _<persistent_volume>_

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d9c5cbd6" deleted

persistentvolume "local-pv-d9c5cbd6" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=_<failed_node_name>_ -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=_<failed_node_name>_ -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod デプロイメントがある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=_<failed_node_name>_ -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=_<failed_node_name>_ -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal-job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running
0          38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running
0          38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running
0          4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

動作するノードを置き換えるには、「Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え」を参照します。
障害のあるノードを置き換えるには、「Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え」を参照します。

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている必要がある。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードで実行されている mon (存在する場合) と Object Storage Devices (OSD) を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

前の手順で特定した Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
1 つ以上の新しいデバイスをノードに物理的に追加します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap
<new_node_name>
新しいノードの名前を指定します。

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する必要がある localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage -tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage -tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリュームクレーム (PVC) に関連付けられている PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d6bf175b" deleted

persistentvolume "local-pv-d6bf175b" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod がある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name>_ -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name>_ -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

前提条件

置き換えるノードが、置き換えるノードと同様のインフラストラクチャー、リソース、およびディスクで設定されていることを確認する必要がある。
OpenShift Container Platform クラスターにログインしている必要がある。

手順

OpenShift Web コンソールにログインし、Compute → Nodes をクリックします。
置き換える必要のあるノードを特定します。その マシン名 をメモします。
ノードのラベルを取得します。
```
oc get nodes --show-labels | grep <node_name>
```
```
$ oc get nodes --show-labels | grep <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>
置き換える必要のあるノードの名前を指定します。
ノードで実行されている mon (存在する場合) と Object Storage Devices (OSD) を特定します。
```
oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
```
$ oc get pods -n openshift-storage -o wide | grep -i <node_name>
```
Copy to Clipboard Toggle word wrap

前の手順で特定した Pod のデプロイメントをスケールダウンします。

以下に例を示します。

oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-mon-c --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

$ oc scale deployment rook-ceph-osd-0 --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

$ oc scale deployment --selector=app=rook-ceph-crashcollector,node_name=<node_name>  --replicas=0 -n openshift-storage

Copy to Clipboard

Toggle word wrap

ノードにスケジュール対象外 (unschedulable) のマークを付けます。
```
oc adm cordon <node_name>
```
```
$ oc adm cordon <node_name>
```
Copy to Clipboard Toggle word wrap

Terminating 状態の Pod を削除します。

oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

$ oc get pods -A -o wide | grep -i <node_name> |  awk '{if ($4 == "Terminating") system ("oc -n " $1 " delete pods " $2  " --grace-period=0 " " --force ")}'

Copy to Clipboard

Toggle word wrap

ノードをドレイン (解放) します。

oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

$ oc adm drain <node_name> --force --delete-emptydir-data=true --ignore-daemonsets

Copy to Clipboard

Toggle word wrap

Compute → Machines をクリックします。必要なマシンを検索します。
必要なマシンの横にある Action menu (⋮) → Delete Machine をクリックします。
Delete をクリックして、マシンが削除されたことを確認します。新しいマシンが自動的に作成されます。新規マシンが起動し、Running 状態に移行するまで待機します。
重要
このアクティビティーには、少なくとも 5〜10 分以上かかる場合があります。
OpenShift Web コンソールで Compute → Nodes をクリックします。新しいノードが Ready 状態にあることを確認します。
1 つ以上の新しいデバイスをノードに物理的に追加します。
以下のいずれかを使用して、OpenShift Data Foundation ラベルを新規ノードに適用します。
ユーザーインターフェイスから
新規ノードで、Action Menu (⋮) → Edit Labels をクリックします。
cluster.ocs.openshift.io/openshift-storage を追加し、Save をクリックします。
コマンドラインインターフェイスの使用
OpenShift Data Foundation ラベルを新規ノードに適用します。
$ oc label node <new_node_name> cluster.ocs.openshift.io/openshift-storage=""

Copy to Clipboard Toggle word wrap

OpenShift ローカルストレージ Operator がインストールされている namespace を特定し、これを local_storage_project 変数に割り当てます。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

以下に例を示します。

local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

$ local_storage_project=$(oc get csv --all-namespaces | awk '{print $1}' | grep local)

Copy to Clipboard

Toggle word wrap

echo $local_storage_project

echo $local_storage_project

Copy to Clipboard

Toggle word wrap

出力例:

openshift-local-storage

openshift-local-storage

Copy to Clipboard

Toggle word wrap

新規ワーカーノードを localVolumeDiscovery および localVolumeSet に追加します。

localVolumeDiscovery 定義を更新し、新規ノードを追加して失敗したノードを削除します。

oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

# oc edit -n $local_storage_project localvolumediscovery auto-discover-devices

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

編集する必要がある localVolumeSet を決定します。
```
oc get -n $local_storage_project localvolumeset
```
```
# oc get -n $local_storage_project localvolumeset
```
Copy to Clipboard Toggle word wrap
出力例:
```
NAME          AGE
localblock   25h
```
```
NAME          AGE
localblock   25h
```
Copy to Clipboard Toggle word wrap

localVolumeSet 定義を更新して、新規ノードを追加し、障害が発生したノードを削除します。

oc edit -n $local_storage_project localvolumeset localblock

# oc edit -n $local_storage_project localvolumeset localblock

Copy to Clipboard

Toggle word wrap

出力例:

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

[...]
   nodeSelector:
    nodeSelectorTerms:
      - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
            - server1.example.com
            - server2.example.com
            #- server3.example.com
            - newnode.example.com
[...]

Copy to Clipboard

Toggle word wrap

エディターを終了する前に必ず保存します。

この例では、server3.example.com が削除され、newnode.example.com が新しいノードになります。

新しい localblock 永続ボリューム (PV) が使用可能であることを確認します。

$oc get pv | grep localblock | grep Available

$oc get pv | grep localblock | grep Available

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

local-pv-551d950     512Gi    RWO    Delete  Available
localblock     26s

Copy to Clipboard

Toggle word wrap

openshift-storage プロジェクトに移動します。
```
oc project openshift-storage
```
```
$ oc project openshift-storage
```
Copy to Clipboard Toggle word wrap
失敗した OSD をクラスターから削除します。必要に応じて、複数の障害のある OSD を指定することができます。
```
oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
```
$ oc process -n openshift-storage ocs-osd-removal \
-p FAILED_OSD_IDS=<failed_osd_id> -p FORCE_OSD_REMOVAL=true | oc create -f -
```
Copy to Clipboard Toggle word wrap
<failed_osd_id>
rook-ceph-osd 接頭辞の直後の Pod 名の整数です。
コマンドにコンマ区切りの OSD ID を追加して、複数の OSD を削除できます (例: FAILED_OSD_IDS=0,1,2)
OSD が 3 つしかないクラスター、または OSD が削除された後にデータの 3 つのレプリカすべてを復元するにはスペースが不十分なクラスターでは、FORCE_OSD_REMOVAL 値を true に変更する必要があります。
ocs-osd-removal-job Pod のステータスをチェックして、OSD が正常に削除されたことを確認します。
Completed のステータスで、OSD の削除ジョブが正常に完了したことを確認します。
```
oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
```
# oc get pod -l job-name=ocs-osd-removal-job -n openshift-storage
```
Copy to Clipboard Toggle word wrap

OSD の取り外しが完了したことを確認します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

$ oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1 | egrep -i 'completed removal'

Copy to Clipboard

Toggle word wrap

出力例:

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

2022-05-10 06:50:04.501511 I | cephosd: completed removal of OSD 0

Copy to Clipboard

Toggle word wrap

重要

ocs-osd-removal-job が失敗し、Pod が予想される Completed の状態にない場合、追加のデバッグのために Pod ログを確認します。

以下に例を示します。

oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

# oc logs -l job-name=ocs-osd-removal-job -n openshift-storage --tail=-1

Copy to Clipboard

Toggle word wrap

永続ボリュームクレーム (PVC) に関連付けられている PV を特定します。

oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

# oc get pv -L kubernetes.io/hostname | grep localblock | grep Released

Copy to Clipboard

Toggle word wrap

出力例:

local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

local-pv-d6bf175b  512Gi  RWO  Delete  Released  openshift-storage/ocs-deviceset-0-data-0-6c5pw  localblock  2d22h  server3.example.com

Copy to Clipboard

Toggle word wrap

Released 状態の PV がある場合は、これを削除します。

oc delete pv <persistent_volume>

# oc delete pv <persistent_volume>

Copy to Clipboard

Toggle word wrap

以下に例を示します。

oc delete pv local-pv-d6bf175b

# oc delete pv local-pv-d6bf175b

Copy to Clipboard

Toggle word wrap

出力例:

persistentvolume "local-pv-d6bf175b" deleted

persistentvolume "local-pv-d6bf175b" deleted

Copy to Clipboard

Toggle word wrap

crashcollector Pod デプロイメントを特定します。

oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

$ oc get deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name> -n openshift-storage

Copy to Clipboard

Toggle word wrap

既存の crashcollector Pod がある場合は、これを削除します。

oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name>_ -n openshift-storage

$ oc delete deployment --selector=app=rook-ceph-crashcollector,node_name=<failed_node_name>_ -n openshift-storage

Copy to Clipboard

Toggle word wrap

ocs-osd-removal job を削除します。

oc delete -n openshift-storage job ocs-osd-removal-job

# oc delete -n openshift-storage job ocs-osd-removal-job

Copy to Clipboard

Toggle word wrap

出力例:

job.batch "ocs-osd-removal-job" deleted

job.batch "ocs-osd-removal-job" deleted

Copy to Clipboard

Toggle word wrap

検証手順

新しいノードが出力に存在することを確認します。

oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

$ oc get nodes --show-labels | grep cluster.ocs.openshift.io/openshift-storage= |cut -d' ' -f1

Copy to Clipboard

Toggle word wrap

Workloads → Pods をクリックします。新しいノードの少なくとも次の Pod が Running 状態になっていることを確認します。
- csi-cephfsplugin-*
- csi-rbdplugin-*

他の必要なすべての OpenShift Data Foundation Pod が Running 状態にあることを確認します。

また、増分の mon が新規に作成されており、Running 状態にあることを確認します。

oc get pod -n openshift-storage | grep mon

$ oc get pod -n openshift-storage | grep mon

Copy to Clipboard

Toggle word wrap

出力例:

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

rook-ceph-mon-a-cd575c89b-b6k66         2/2     Running  0  38m
rook-ceph-mon-b-6776bc469b-tzzt8        2/2     Running  0  38m
rook-ceph-mon-d-5ff5d488b5-7v8xh        2/2     Running  0  4m8s

Copy to Clipboard

Toggle word wrap

OSD とモニター Pod が Running 状態になるまでに数分かかる場合があります。

新規 OSD Pod が交換後のノードで実行されていることを確認します。

oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

$ oc get pods -o wide -n openshift-storage| egrep -i <new_node_name> | egrep osd

Copy to Clipboard

Toggle word wrap

(オプション) クラスターでクラスター全体の暗号化が有効な場合は、新規 OSD デバイスが暗号化されていることを確認します。
直前の手順で特定された新しい各ノードに以下を実行します。
1. デバッグ Pod を作成し、選択した 1 つ以上のホストの chroot 環境を開きます。
  $ oc debug node/<node_name>
  Copy to Clipboard Toggle word wrap
  $ chroot /host
  Copy to Clipboard Toggle word wrap
2. 使用可能なブロックデバイスのリストを表示します。
  $ lsblk
  Copy to Clipboard Toggle word wrap
  1 つ以上の ocs-deviceset 名の横にある crypt キーワードを確認します。
検証手順が失敗した場合は、Red Hat サポートにお問い合わせください。

トップに戻る

ノードの置き換え

OpenShift Data Foundation クラスターのノードを安全に置き換える手順

多様性を受け入れるオープンソースの強化リンクのコピーリンクがクリップボードにコピーされました!

Red Hat ドキュメントへのフィードバック (英語のみ)リンクのコピーリンクがクリップボードにコピーされました!

はじめにリンクのコピーリンクがクリップボードにコピーされました!

第1章 動的デバイスを使用してデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

1.1. AWS にデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2. VMware にデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.3. Red Hat Virtualization にデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.4. Microsoft Azure にデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

第2章 ローカルストレージデバイスを使用してデプロイされた OpenShift Data Foundationリンクのコピーリンクがクリップボードにコピーされました!

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2.1. IBM Z または IBM® LinuxONE インフラストラクチャーでの動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでの障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3. IBM Power インフラストラクチャー上のストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.3.1. IBM Power で動作するストレージまたは障害のあるストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4. VMWare インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換えリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

多様性を受け入れるオープンソースの強化
リンクのコピー

Red Hat ドキュメントへのフィードバック (英語のみ)
リンクのコピー

はじめに
リンクのコピー

第1章動的デバイスを使用してデプロイされた OpenShift Data Foundation
リンクのコピー

1.1. AWS にデプロイされた OpenShift Data Foundation
リンクのコピー

1.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

1.1.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する AWS ノードの置き換え
リンクのコピー

1.1.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

1.1.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した AWS ノードの置き換え
リンクのコピー

1.2. VMware にデプロイされた OpenShift Data Foundation
リンクのコピー

1.2.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

1.2.2. インストーラーでプロビジョニングされるインフラストラクチャーで動作する VMware ノードの置き換え
リンクのコピー

1.2.3. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

1.2.4. インストーラーでプロビジョニングされるインフラストラクチャーでの失敗した VMware ノードの置き換え
リンクのコピー

1.3. Red Hat Virtualization にデプロイされた OpenShift Data Foundation
リンクのコピー

1.3.1. インストーラーでプロビジョニングされるインフラストラクチャーで動作する Red Hat Virtualization ノードの置き換え
リンクのコピー

1.3.2. インストーラーでプロビジョニングされるインフラストラクチャーで障害のある Red Hat Virtualization ノードの置き換え
リンクのコピー

1.4. Microsoft Azure にデプロイされた OpenShift Data Foundation
リンクのコピー

1.4.1. Azure のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

1.4.2. Azure のインストーラーでプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

第2章ローカルストレージデバイスを使用してデプロイされた OpenShift Data Foundation
リンクのコピー

2.1. ベアメタルインフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.1.1. ユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.1.2. ユーザーによってプロビジョニングされるインフラストラクチャーでの失敗したノードの置き換え
リンクのコピー

2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.2.1. IBM Z または IBM® LinuxONE インフラストラクチャーでの動作するノードの置き換え
リンクのコピー

2.2.2. IBM Z または IBM® LinuxONE インフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

2.3. IBM Power インフラストラクチャー上のストレージノードの置き換え
リンクのコピー

2.3.1. IBM Power で動作するストレージまたは障害のあるストレージノードの置き換え
リンクのコピー

2.4. VMWare インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.4.1. VMware のユーザーによってプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.4.2. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.4.3. VMware ユーザーによってプロビジョニングされるインフラストラクチャーでの障害のあるノードの置き換え
リンクのコピー

2.4.4. VMware のインストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー

2.5. Red Hat Virtualization インフラストラクチャーでのストレージノードの置き換え
リンクのコピー

2.5.1. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで動作するノードの置き換え
リンクのコピー

2.5.2. Red Hat Virtualization インストーラーでプロビジョニングされるインフラストラクチャーで障害のあるノードの置き換え
リンクのコピー