1.7. フェンシングと修復のイベントフロー


ノードが健全でなくなると、ワークロード、そして理想的にはノードを健全な状態に復元するために、ノードを検出、隔離、修復する複数のイベントが発生します。OpenShift クラスターによってトリガーされるイベントや、Workload Availability Operator による反応で発生するイベントがあります。情報に基づいた意思決定を行うには、この一連のイベントとイベント間の期間を理解することが重要です。意思決定とは、使用する修復プロバイダー、Node Health Check Operator と選択した修復プロバイダーの設定方法などを指します。

注記

次に示す例は、イベントの段階的なフローを概説する一般的なユースケースです。Node Health Check Operator が Ready=Unknown の異常な状態にある場合にのみ、フェーズは次のように動作します。

1.7.1. フェーズ 1 - Kubernetes ヘルスチェック (コア OpenShift)

異常なノードは API サーバーとの通信を停止します。約 50 秒後、API サーバーはノードの "Ready" 状態を "Unknown" (Ready=Unknown) に設定します。

1.7.2. フェーズ 2 - ノードヘルスチェック (NHC)

Ready=Unknown の状態が設定した期間よりも長くなると、修復が開始されます。

このフェーズ内でユーザーが設定した期間とは、不健全な状態にある期間に対して、Operator が許容できる範囲を表します。ワークロードが要求どおりに再起動している間は、リソースが "Unready" の状態になることを考慮します。

以下に例を示します。

  • 再起動に時間がかかるワークロードがある場合は、タイムアウトを長くする必要があります。
  • 同様に、ワークロードの再起動が短い場合、必要なタイムアウトも短くなります。

1.7.3. フェーズ 3 - ホストの修復/API の修復 (設定された修復 Operator に応じて)

Machine Deletion Remediation (MDR)、Self Node Remediation (SNR) または Fence Agents Remediation (FAR) を使用して、remediator はノードを再起動してフェンスし、安全な状態に到達するためにノードを分離します。

このフェーズの詳細はユーザーによって設定され、ワークロード要件によって異なります。

以下に例を示します。

  • Machine Deletion Remediation - プラットフォームの選択は、マシンの再プロビジョニングにかかる時間と、修復の期間に影響します。MDR は、Machine API を使用するクラスターにのみ適用されます。
  • Self Node Remediation - 修復時間は、不健全なノードを自動的に再起動するのにかかる安全な時間や、エラー状態が検出されたときにマシンが安全な状態になるようにするために使用されるウォッチドッグデバイスなど、多くのパラメーターによって異なります。
  • Fence Agents Remediation - フェンスエージェントの時間は、クラスターノード、管理インターフェイス、エージェントパラメーターなど、多くのパラメーターによって異なります。

1.7.4. フェーズ 4 - ワークロードの開始

MDR を使用すると、remediator はリソースを削除します。FAR と SNR を使用する場合、さまざまな修復ストラテジーを使用できます。1 つのストラテジーは、OutOfServiceTaint で、out-of-service taint を使用してクラスター内のリソースの削除を許可します。どちらの場合も、リソースを削除すると、影響を受けるワークロードの再スケジュールがより速くなります。その後、ワークロードは再スケジュールされ、再開されます。

このフェーズは、フェンシングが完了すると remediator によって自動的に開始されます。フェンシングが完了せず、エスカレーション修復が必要な場合、ユーザーは修復プロセス全体のタイムアウトを秒単位で設定する必要があります。タイムアウトが経過してもノードがまだ正常でない場合、NHC は次の remediator を試して、異常なノードを修復します。

トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2025 Red Hat