4.3.4. 復元手順のテスト

自動化とワークロードが新しいクラスターの状態を適切に処理できるように、復元手順をテストすることが重要です。etcd クォーラムの複雑な性質と、etcd Operator による自動修復が原因で、クラスターを復元可能な状態に正しく戻すことが困難な場合がよくあります。

警告

クラスターへの SSH アクセス権が必要です。SSH アクセスがないと、クラスターが完全に失われる可能性があります。

前提条件

手順

SSH を使用してリカバリーノード以外の各ノードに接続し、次のコマンドを実行して etcd と kubelet サービスを無効にします。
1. 次のコマンドを実行して etcd を無効にします。
  $ sudo /usr/local/bin/disable-etcd.sh
2. 次のコマンドを実行して、etcd の変数データを削除します。
  $ sudo rm -rf /var/lib/etcd
3. 次のコマンドを実行して、kubelet サービスを無効にします。
  $ sudo systemctl disable kubelet.service
すべての SSH セッションを終了します。
次のコマンドを実行して、リカバリーノード以外のノードが NOT READY 状態であることを確認します。
```
$ oc get nodes
```
「以前のクラスター状態への復元」の手順に従い、クラスターを復元します。
クラスターを復元し、API が応答したら、SSH を使用してリカバリーノード以外の各ノードに接続し、kubelet サービスを有効にします。
```
$ sudo systemctl enable kubelet.service
```
すべての SSH セッションを終了します。
次のコマンドを実行して、ノードが READY 状態に戻ることを確認します。
```
$ oc get nodes
```
次のコマンドを実行して、etcd が利用可能であることを確認します。
```
$ oc get pods -n openshift-etcd
```