ホーム
製品
OpenShift Container Platform
4.9
インストール後の設定
5.3. マシンヘルスチェックのデプロイ

5.3. マシンヘルスチェックのデプロイ

マシンヘルスチェックについて確認し、これをデプロイします。

重要

高度なマシン管理およびスケーリング機能は、マシン API が機能しているクラスターでのみ使用することができます。ユーザーがプロビジョニングしたインフラストラクチャーを持つクラスターでは、マシン API を使用するために追加の検証と設定が必要です。

インフラストラクチャープラットフォームタイプが none のクラスターは、マシン API を使用できません。この制限は、クラスターに接続されている計算マシンが、この機能をサポートするプラットフォームにインストールされている場合でも適用されます。このパラメーターは、インストール後に変更することはできません。

クラスターのプラットフォームタイプを表示するには、以下のコマンドを実行します。

$ oc get infrastructure cluster -o jsonpath='{.status.platform}'

5.3.1. マシンのヘルスチェック
リンクのコピー

マシンのヘルスチェックは特定のマシンプールの正常ではないマシンを自動的に修復します。

マシンの正常性を監視するには、リソースを作成し、コントローラーの設定を定義します。5 分間 NotReady ステータスにすることや、 node-problem-detector に永続的な条件を表示すること、および監視する一連のマシンのラベルなど、チェックする条件を設定します。

注記

マスターロールのあるマシンにマシンヘルスチェックを適用することはできません。

MachineHealthCheck リソースを監視するコントローラーは定義済みのステータスをチェックします。マシンがヘルスチェックに失敗した場合、このマシンは自動的に検出され、その代わりとなるマシンが作成されます。マシンが削除されると、machine deleted イベントが表示されます。

マシンの削除による破壊的な影響を制限するために、コントローラーは 1 度に 1 つのノードのみをドレイン (解放) し、これを削除します。マシンのターゲットプールで許可される maxUnhealthy しきい値を上回る数の正常でないマシンがある場合、修復が停止するため、手動による介入が可能になります。

注記

タイムアウトについて注意深い検討が必要であり、ワークロードと要件を考慮してください。

タイムアウトの時間が長くなると、正常でないマシンのワークロードのダウンタイムが長くなる可能性があります。
タイムアウトが短すぎると、修復ループが生じる可能性があります。たとえば、NotReady ステータスを確認するためのタイムアウトについては、マシンが起動プロセスを完了できるように十分な時間を設定する必要があります。

チェックを停止するには、リソースを削除します。

5.3.1.1. マシンヘルスチェックのデプロイ時の制限
リンクのコピー

マシンヘルスチェックをデプロイする前に考慮すべき制限事項があります。

マシンセットが所有するマシンのみがマシンヘルスチェックによって修復されます。
コントロールプレーンマシンは現在サポートされておらず、それらが正常でない場合にも修正されません。
マシンのノードがクラスターから削除される場合、マシンヘルスチェックはマシンが正常ではないとみなし、すぐにこれを修復します。
nodeStartupTimeout の後にマシンの対応するノードがクラスターに加わらない場合、マシンは修復されます。
Machine リソースフェーズが Failed の場合、マシンはすぐに修復されます。

5.3.2. サンプル MachineHealthCheck リソース
リンクのコピー

ベアメタルを除くすべてのクラウドベースのインストールタイプの MachineHealthCheck リソースは、以下の YAML ファイルのようになります。

apiVersion: machine.openshift.io/v1beta1
kind: MachineHealthCheck
metadata:
  name: example


  namespace: openshift-machine-api
spec:
  selector:
    matchLabels:
      machine.openshift.io/cluster-api-machine-role: <role>


      machine.openshift.io/cluster-api-machine-type: <role>


      machine.openshift.io/cluster-api-machineset: <cluster_name>-<label>-<zone>


  unhealthyConditions:
  - type:    "Ready"
    timeout: "300s"


    status: "False"
  - type:    "Ready"
    timeout: "300s"


    status: "Unknown"
  maxUnhealthy: "40%"


  nodeStartupTimeout: "10m"

1: デプロイするマシンヘルスチェックの名前を指定します。
2 3: チェックする必要のあるマシンプールのラベルを指定します。
4: 追跡するマシンセットを <cluster_name>-<label>-<zone> 形式で指定します。たとえば、prod-node-us-east-1a とします。
5 6: ノードの状態のタイムアウト期間を指定します。タイムアウト期間の条件が満たされると、マシンは修正されます。タイムアウトの時間が長くなると、正常でないマシンのワークロードのダウンタイムが長くなる可能性があります。
7: ターゲットプールで同時に修復できるマシンの数を指定します。これはパーセンテージまたは整数として設定できます。正常でないマシンの数が maxUnhealthy で設定された制限を超える場合、修復は実行されません。
8: マシンが正常でないと判別される前に、ノードがクラスターに参加するまでマシンヘルスチェックが待機する必要のあるタイムアウト期間を指定します。

注記

matchLabels はあくまでもサンプルであるため、特定のニーズに応じてマシングループをマッピングする必要があります。

5.3.2.1. マシンヘルスチェックによる修復の一時停止 (short-circuiting)
リンクのコピー

一時停止 (short-circuiting) が実行されることにより、マシンのヘルスチェックはクラスターが正常な場合にのみマシンを修復するようになります。一時停止 (short-circuiting) は、MachineHealthCheck リソースの maxUnhealthy フィールドで設定されます。

ユーザーがマシンの修復前に maxUnhealthy フィールドの値を定義する場合、MachineHealthCheck は maxUnhealthy の値を、正常でないと判別するターゲットプール内のマシン数と比較します。正常でないマシンの数が maxUnhealthy の制限を超える場合、修復は実行されません。

重要

maxUnhealthy が設定されていない場合、値は 100% にデフォルト設定され、マシンはクラスターの状態に関係なく修復されます。

適切な maxUnhealthy 値は、デプロイするクラスターの規模や、MachineHealthCheck が対応するマシンの数によって異なります。たとえば、maxUnhealthy 値を使用して複数のアベイラビリティーゾーン間で複数のマシンセットに対応でき、ゾーン全体が失われると、maxUnhealthy の設定によりクラスター内で追加の修復を防ぐことができます。

maxUnhealthy フィールドは整数またはパーセンテージのいずれかに設定できます。maxUnhealthy の値によって、修復の実装が異なります。

5.3.2.1.1. 絶対値を使用した maxUnhealthy の設定
リンクのコピー

maxUnhealthy が 2 に設定される場合:

2 つ以下のノードが正常でない場合に、修復が実行されます。
3 つ以上のノードが正常でない場合は、修復は実行されません。

これらの値は、マシンヘルスチェックによってチェックされるマシン数と別個の値です。

5.3.2.1.2. パーセンテージを使用した maxUnhealthy の設定
リンクのコピー

maxUnhealthy が 40% に設定され、25 のマシンがチェックされる場合:

10 以下のノードが正常でない場合に、修復が実行されます。
11 以上のノードが正常でない場合は、修復は実行されません。

maxUnhealthy が 40% に設定され、6 マシンがチェックされる場合:

2 つ以下のノードが正常でない場合に、修復が実行されます。
3 つ以上のノードが正常でない場合は、修復は実行されません。

注記

チェックされる maxUnhealthy マシンの割合が整数ではない場合、マシンの許可される数は切り捨てられます。

5.3.3. MachineHealthCheck リソースの作成
リンクのコピー

クラスターに、すべての MachineSets の MachineHealthCheck リソースを作成できます。コントロールプレーンマシンをターゲットとする MachineHealthCheck リソースを作成することはできません。

前提条件

oc コマンドラインインターフェイスをインストールします。

手順

マシンヘルスチェックの定義を含む healthcheck.yml ファイルを作成します。
healthcheck.yml ファイルをクラスターに適用します。
```
$ oc apply -f healthcheck.yml
```

5.3.4. マシンセットの手動によるスケーリング
リンクのコピー

マシンセットのマシンのインスタンスを追加したり、削除したりする必要がある場合、マシンセットを手動でスケーリングできます。

本書のガイダンスは、完全に自動化されたインストーラーでプロビジョニングされるインフラストラクチャーのインストールに関連します。ユーザーによってプロビジョニングされるインフラストラクチャーのカスタマイズされたインストールにはマシンセットがありません。

前提条件

OpenShift Container Platform クラスターおよび oc コマンドラインをインストールすること。
cluster-admin パーミッションを持つユーザーとして、oc にログインする。

手順

クラスターにあるマシンセットを表示します。
```
$ oc get machinesets -n openshift-machine-api
```
マシンセットは <clusterid>-worker-<aws-region-az> の形式で一覧表示されます。
クラスター内にあるマシンを表示します。
```
$ oc get machine -n openshift-machine-api
```

削除するマシンに注釈を設定します。

$ oc annotate machine/<machine_name> -n openshift-machine-api machine.openshift.io/cluster-api-delete-machine="true"

削除するノードを分離して解放します。

$ oc adm cordon <node_name>
$ oc adm drain <node_name>

マシンセットをスケーリングします。
```
$ oc scale --replicas=2 machineset <machineset> -n openshift-machine-api
```
または、以下を実行します。
```
$ oc edit machineset <machineset> -n openshift-machine-api
```
ヒント
または、以下の YAML を適用してマシンセットをスケーリングすることもできます。
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: <machineset> namespace: openshift-machine-api spec: replicas: 2
マシンセットをスケールアップまたはスケールダウンできます。新規マシンが利用可能になるまで数分の時間がかかります。

検証

目的のマシンの削除を確認します。
```
$ oc get machines
```

5.3.5. マシンセットとマシン設定プールの相違点について
リンクのコピー

MachineSet オブジェクトは、クラウドまたはマシンプロバイダーに関する OpenShift Container Platform ノードを記述します。

MachineConfigPool オブジェクトにより、MachineConfigController コンポーネントがアップグレードのコンテキストでマシンのステータスを定義し、提供できるようになります。

MachineConfigPool オブジェクトにより、ユーザーはマシン設定プールの OpenShift Container Platform ノードにアップグレードを展開する方法を設定できます。

NodeSelector オブジェクトは MachineSet オブジェクトへの参照に置き換えることができます。

5.3. マシンヘルスチェックのデプロイ

5.3.1. マシンのヘルスチェック
リンクのコピー

5.3.1.1. マシンヘルスチェックのデプロイ時の制限
リンクのコピー

5.3.2. サンプル MachineHealthCheck リソース
リンクのコピー

5.3.2.1. マシンヘルスチェックによる修復の一時停止 (short-circuiting)
リンクのコピー

5.3.2.1.1. 絶対値を使用した maxUnhealthy の設定
リンクのコピー

5.3.2.1.2. パーセンテージを使用した maxUnhealthy の設定
リンクのコピー

5.3.3. MachineHealthCheck リソースの作成
リンクのコピー

5.3.4. マシンセットの手動によるスケーリング
リンクのコピー

5.3.5. マシンセットとマシン設定プールの相違点について
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

5.3. マシンヘルスチェックのデプロイ

5.3.1. マシンのヘルスチェックリンクのコピーリンクがクリップボードにコピーされました!

5.3.1.1. マシンヘルスチェックのデプロイ時の制限リンクのコピーリンクがクリップボードにコピーされました!

5.3.2. サンプル MachineHealthCheck リソースリンクのコピーリンクがクリップボードにコピーされました!

5.3.2.1. マシンヘルスチェックによる修復の一時停止 (short-circuiting)リンクのコピーリンクがクリップボードにコピーされました!

5.3.2.1.1. 絶対値を使用した maxUnhealthy の設定リンクのコピーリンクがクリップボードにコピーされました!

5.3.2.1.2. パーセンテージを使用した maxUnhealthy の設定リンクのコピーリンクがクリップボードにコピーされました!

5.3.3. MachineHealthCheck リソースの作成リンクのコピーリンクがクリップボードにコピーされました!

5.3.4. マシンセットの手動によるスケーリングリンクのコピーリンクがクリップボードにコピーされました!

5.3.5. マシンセットとマシン設定プールの相違点についてリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

5.3.1. マシンのヘルスチェック
リンクのコピー

5.3.1.1. マシンヘルスチェックのデプロイ時の制限
リンクのコピー

5.3.2. サンプル MachineHealthCheck リソース
リンクのコピー

5.3.2.1. マシンヘルスチェックによる修復の一時停止 (short-circuiting)
リンクのコピー

5.3.2.1.1. 絶対値を使用した maxUnhealthy の設定
リンクのコピー

5.3.2.1.2. パーセンテージを使用した maxUnhealthy の設定
リンクのコピー

5.3.3. MachineHealthCheck リソースの作成
リンクのコピー

5.3.4. マシンセットの手動によるスケーリング
リンクのコピー

5.3.5. マシンセットとマシン設定プールの相違点について
リンクのコピー