3.4. 配置隔离代理修复 Operator
您可以使用 Fence Agents Remediation Operator 创建 FenceAgentsRemediationTemplate 自定义资源(CR),由 Node Health Check Operator (NHC)使用。此 CR 定义集群中要使用的隔离代理,以及修复节点所需的所有参数。每个隔离代理可能会有许多 FenceAgentsRemediationTemplate CR,对于每个隔离代理来说,当 NHC 被使用时,可以选择 FenceAgentsRemediationTemplate 作为用于电源循环节点的 remediationTemplate。
FenceAgentsRemediationTemplate CR 类似于以下 YAML 文件:
apiVersion: fence-agents-remediation.medik8s.io/v1alpha1
kind: FenceAgentsRemediationTemplate
metadata:
name: fence-agents-remediation-template-fence-ipmilan
namespace: openshift-workload-availability
spec:
template:
spec:
agent: fence_ipmilan
nodeparameters:
--ipport:
master-0-0: '6230'
master-0-1: '6231'
master-0-2: '6232'
worker-0-0: '6233'
worker-0-1: '6234'
worker-0-2: '6235'
sharedparameters:
'--action': reboot
'--ip': 192.168.123.1
'--lanplus': ''
'--password': password
'--username': admin
retryCount: '5'
retryInterval: '5s'
timeout: '60s'
3.4.1. 了解隔离代理修复模板配置 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Fence Agents Remediation Operator 还会创建 FenceAgentsRemediationTemplate 自定义资源定义(CRD)。此 CRD 为旨在更快地恢复工作负载的节点定义补救策略。可用的补救策略如下:
ResourceDeletion- 此补救策略移除节点上的 pod。
OutOfServiceTaint-
此补救策略隐式会导致移除节点上的 pod 和关联的卷附加。它通过将
OutOfServiceTaint污点放在节点上来实现此目的。OutOfServiceTaint策略也代表一个非正常节点关闭。当节点关闭且没有检测到时,会进行非正常节点关闭,而不是触发操作系统关闭。自 OpenShift Container Platform 版本 4.13 起,此策略在技术预览上被支持,从 OpenShift Container Platform 版本 4.15 开始正式发布。
FenceAgentsRemediationTemplate CR 类似于以下 YAML 文件:
apiVersion: fence-agents-remediation.medik8s.io/v1alpha1
kind: FenceAgentsRemediationTemplate
metadata:
name: fence-agents-remediation-<remediation_object>-deletion-template
namespace: openshift-workload-availability
spec:
template:
spec:
remediationStrategy: <remediation_strategy>