3.4. Fence Agent Remediation Operator の設定
Fence Agents Remediation Operator を使用して、Node Health Check Operator (NHC) によって使用される FenceAgentsRemediationTemplate カスタムリソース (CR) を作成できます。この CR は、ノードを修復するために必要なすべてのパラメーターを備えたクラスターで使用されるフェンスエージェントを定義します。FenceAgentsRemediationTemplate CR は多数存在する可能性があり (フェンスエージェントごとに最大 1 つ)、NHC が使用されている場合、ノードの電源を再投入するために使用する remediationTemplate として FenceAgentsRemediationTemplate を選択できます。
FenceAgentsRemediationTemplate CR は以下の YAML ファイルのようになります。
apiVersion: fence-agents-remediation.medik8s.io/v1alpha1
kind: FenceAgentsRemediationTemplate
metadata:
name: fence-agents-remediation-template-fence-ipmilan
namespace: openshift-workload-availability
spec:
template:
spec:
agent: fence_ipmilan
nodeparameters:
--ipport:
master-0-0: '6230'
master-0-1: '6231'
master-0-2: '6232'
worker-0-0: '6233'
worker-0-1: '6234'
worker-0-2: '6235'
nodeSecretNames:
master-0-0: fence-agents-credentials-master-0-0
worker-0-0: fence-agents-credentials-worker-0-0
worker-0-1: fence-agents-credentials-worker-0-1
sharedparameters:
'--action': reboot
'--ip': 192.168.123.1
'--lanplus': ''
'--password': password
'--username': admin
retrycount: '5'
retryinterval: '5s'
sharedSecretName: 'fence-agents-credentials-shared'
timeout: '60s'
- 1
- 実行されるフェンス エージェント の名前を表示します (例:
fence_ipmilan)。 - 2
ipportなど、フェンスエージェントを実行するためのノード固有のパラメーターを表示します。- 3
- ノード名と Secret 名のマッピングを表示します。ノードに関連するパラメーターが含まれています。
- 4
usernameなど、フェンスエージェントを実行するためのクラスター全体のパラメーターを表示します。- 5
- 正常でないノードをフェンシングするために使用する必要のあるアクションパラメーター (
rebootまたはoff) を表示します。rebootアクションは特定のノードを再起動するため、フェンシングが完了するとクラスターに再参加します。offアクションは、ノードをシャットダウンして停止させ、ノードを回復させることなくフェンシングを確実に実行します。offアクションを使用する場合、管理者は手動でノードをオンにしてクラスターに再参加する必要があります。注記現在、
offアクションは、クラウドベースの環境でのみサポートされています。 - 6
- 障害が発生した場合のフェンスエージェントコマンドを再試行する回数を表示します。デフォルトの試行回数は 5 です。
- 7
- 再試行の間隔を秒単位で表示します。デフォルトは 5 秒です。
- 8
- クラスター全体のパラメーターを含む Secret の名前を表示します。デフォルト名は
fence-agents-credentials-sharedです。 - 9
- フェンスエージェントコマンドのタイムアウト値を表示します。デフォルトは 60 秒です。タイムアウト値が 60 秒以上の場合、YAML ファイルではその値が分と秒の両方で表記されます。
3.4.1. フェンスエージェント修復テンプレートの設定を理解する リンクのコピーリンクがクリップボードにコピーされました!
Fence Agents Remediation Operator は、FenceAgentsRemediationTemplate カスタムリソース定義 (CRD) も作成します。この CRD は、ワークロードをより速く回復することを目的としたノードの修復ストラテジーを定義します。次の修復ストラテジーが利用できます。
ResourceDeletion- この修復ストラテジーにより、ノード上の Pod が削除されます。
OutOfServiceTaint-
この修復ストラテジーにより、ノード上の Pod と関連するボリュームアタッチメントが暗黙的に削除されます。これは、ノードに
OutOfServiceTaintテイントを配置することによって実現されます。OutOfServiceTaintストラテジーは、グレースフルではないノードシャットダウンも表します。グレースフルではないノードシャットダウンは、オペレーティングシステム内のシャットダウンをトリガーするのではなく、ノードがシャットダウンされても検出されない場合に発生します。このストラテジーは、OpenShift Container Platform バージョン 4.13 以降のテクノロジープレビューでサポートされており、OpenShift Container Platform バージョン 4.15 以降の一般提供ではサポートされています。
FenceAgentsRemediationTemplate CR は以下の YAML ファイルのようになります。
apiVersion: fence-agents-remediation.medik8s.io/v1alpha1
kind: FenceAgentsRemediationTemplate
metadata:
name: fence-agents-remediation-<remediation_object>-deletion-template
namespace: openshift-workload-availability
spec:
template:
spec:
remediationStrategy: <remediation_strategy>