3.5. 对 Fence Agents Remediation Operator 进行故障排除
3.5.1. 常规故障排除 复制链接链接已复制到粘贴板!
- 问题
- 您需要排除 Fence Agents Remediation Operator 的问题。
- 解决方案
检查 Operator 日志。
$ oc logs <fence-agents-remediation-controller-manager-name> -c manager -n <namespace-name>
3.5.2. 失败的补救 复制链接链接已复制到粘贴板!
- 问题
- 一个不健康的节点没有被修复。
- 解决方案
运行以下命令验证
FenceAgentsRemediationCR 是否已创建:$ oc get far -A如果节点处于不健康状态时,如果
NodeHealthCheck控制器没有创建FenceAgentsRemediationCR,请检查NodeHealthCheck控制器的日志。另外,请确保NodeHealthCheckCR 包含使用补救模板所需的规格。如果创建了
FenceAgentsRemediationCR,请确保其名称与不健康的节点对象匹配。
- 问题
- 卸载 Operator 后会存在 Fence Agents Remediation Operator 资源,如补救 CR 和补救模板 CR。
- 解决方案
要删除 Fence Agents Remediation Operator 资源,您可以在卸载前选择 "Delete all operand instance for this operator" 复选框来删除资源。此复选框功能仅在 Red Hat OpenShift 版本 4.13 起可用。对于所有版本的 Red Hat OpenShift,您可以通过为每个资源类型运行以下命令来删除资源:
$ oc delete far <fence-agents-remediation> -n <namespace>$ oc delete fartemplate <fence-agents-remediation-template> -n <namespace>目前的补救 CR 必须由同一实体创建和删除,如 NHC。如果补救 CR 仍然存在,它将与 FAR 操作器一起删除。只有在 NHC 中使用 FAR 时,补救模板 CR
fartemplate才存在。当使用 Web 控制台删除 FAR Operator 时,补救模板 CRfartemplate也会被删除。