3.5. 对隔离代理修复 Operator 进行故障排除
3.5.1. 常规故障排除 复制链接链接已复制到粘贴板!
- 问题
- 您希望排除 Fence Agents Remediation Operator 的问题。
- 解决方案
检查 Operator 日志。
$ oc logs <fence-agents-remediation-controller-manager-name> -c manager -n <namespace-name>
3.5.2. 失败的补救 复制链接链接已复制到粘贴板!
- 问题
- 一个不健康的节点没有被修复。
- 解决方案
运行以下命令验证
FenceAgentsRemediationCR 是否已创建:$ oc get far -A如果
NodeHealthCheck控制器在节点关闭不健康时没有创建FenceAgentsRemediationCR,请检查NodeHealthCheck控制器的日志。另外,请确保NodeHealthCheckCR 包含使用补救模板所需的规格。如果创建了
FenceAgentsRemediationCR,请确保其名称与不健康的节点对象匹配。
- 问题
- 卸载 Operator 后,存在 Fence Agents Remediation Operator 资源,如补救 CR 和补救模板 CR。
- 解决方案
要删除 Fence Agents Remediation Operator 资源,您可以在卸载前选择 "Delete all operand instance for this operator" 复选框来删除资源。自版本 4.13 起,此复选框功能仅适用于 Red Hat OpenShift。对于所有版本的 Red Hat OpenShift,您可以通过为每个资源类型运行以下相关命令来删除资源:
$ oc delete far <fence-agents-remediation> -n <namespace>$ oc delete fartemplate <fence-agents-remediation-template> -n <namespace>补救 CR
目前必须由同一实体创建和删除,如 NHC。如果补救 CR 仍然存在,它将与 FAR operator 一起删除。只有在 NHC 中使用 FAR 时,补救模板 CR
fartemplate才存在。使用 Web 控制台删除 FAR Operator 时,也会删除补救模板 CRfartemplate。