4.3.4. 復元手順のテスト
自動化とワークロードが新しいクラスターの状態を適切に処理できるように、復元手順をテストすることが重要です。etcd クォーラムの複雑な性質と、etcd Operator による自動修復が原因で、クラスターを復元可能な状態に正しく戻すことが困難な場合がよくあります。
クラスターへの SSH アクセス権が 必要 です。SSH アクセスがないと、クラスターが完全に失われる可能性があります。
前提条件
- コントロールプレーンホストへの SSH アクセス権がある。
-
OpenShift CLI (
oc) がインストールされている。
手順
SSH を使用してリカバリーノード以外の各ノードに接続し、次のコマンドを実行して etcd と
kubeletサービスを無効にします。次のコマンドを実行して etcd を無効にします。
$ sudo /usr/local/bin/disable-etcd.sh次のコマンドを実行して、etcd の変数データを削除します。
$ sudo rm -rf /var/lib/etcd次のコマンドを実行して、
kubeletサービスを無効にします。$ sudo systemctl disable kubelet.service
- すべての SSH セッションを終了します。
次のコマンドを実行して、リカバリーノード以外のノードが
NOT READY状態であることを確認します。$ oc get nodes- 「以前のクラスター状態への復元」の手順に従い、クラスターを復元します。
クラスターを復元し、API が応答したら、SSH を使用してリカバリーノード以外の各ノードに接続し、
kubeletサービスを有効にします。$ sudo systemctl enable kubelet.service- すべての SSH セッションを終了します。
次のコマンドを実行して、ノードが
READY状態に戻ることを確認します。$ oc get nodes次のコマンドを実行して、etcd が利用可能であることを確認します。
$ oc get pods -n openshift-etcd