5.2.4. ベアメタル上でマシンのヘルスチェックを有効にする
ベアメタル上でマシンのヘルスチェックを有効にして、異常なマネージドクラスターノードを自動的に修復および置き換えることができます。マネージドクラスターにインストールする準備ができている追加のエージェントマシンが必要です。
マシンのヘルスチェックを有効にする前に、次の制限を考慮してください。
-
MachineHealthCheckオブジェクトを変更することはできません。 -
マシンヘルスチェックでは、少なくとも 2 つのノードが 8 分以上
FalseまたはUnknownステータスのままである場合にのみ、ノードが置き換えられます。
マネージドクラスターノードのマシンヘルスチェックを有効にすると、ホステッドクラスターに MachineHealthCheck オブジェクトが作成されます。
手順
ホステッドクラスターでマシンのヘルスチェックを有効にするには、NodePool リソースを変更します。以下の手順を実行します。
NodePoolリソースのspec.nodeDrainTimeout値が0sより大きいことを確認します。<hosted_cluster_namespace>をホステッドクラスター namespace の名前に置き換え、<nodepool_name>をノードプール名に置き換えます。以下のコマンドを実行します。$ oc get nodepool -n <hosted_cluster_namespace> <nodepool_name> -o yaml | grep nodeDrainTimeout出力例
nodeDrainTimeout: 30sspec.nodeDrainTimeout値が0sより大きくない場合は、次のコマンドを実行して値を変更します。$ oc patch nodepool -n <hosted_cluster_namespace> <nodepool_name> -p '{"spec":{"nodeDrainTimeout": "30m"}}' --type=mergeNodePoolリソースでspec.management.autoRepairフィールドをtrueに設定して、マシンのヘルスチェックを有効にします。以下のコマンドを実行します。$ oc patch nodepool -n <hosted_cluster_namespace> <nodepool_name> -p '{"spec": {"management": {"autoRepair":true}}}' --type=merge次のコマンドを実行して、
NodePoolリソースがautoRepair: true値で更新されていることを確認します。$ oc get nodepool -n <hosted_cluster_namespace> <nodepool_name> -o yaml | grep autoRepair