4.5. 对 Machine Deletion Remediation Operator 进行故障排除
4.5.1. 常规故障排除 复制链接链接已复制到粘贴板!
- 问题
- 您需要使用 Machine Deletion Remediation Operator 排除问题。
- 解决方案
检查 Operator 日志。
$ oc logs <machine-deletion-remediation-controller-manager-name> -c manager -n <namespace-name>
4.5.2. 失败的补救 复制链接链接已复制到粘贴板!
- 问题
- 一个不健康的节点没有被修复。
- 解决方案
运行以下命令验证
MachineDeletionRemediationCR 是否已创建:$ oc get mdr -A如果
NodeHealthCheck控制器在节点不健康时没有创建MachineDeletionRemediationCR,请检查NodeHealthCheck控制器的日志。另外,请确保NodeHealthCheckCR 包含使用补救模板所需的规格。如果创建了
MachineDeletionRemediationCR,请确保其名称与不健康的节点对象匹配。
4.5.3. 即使卸载 Operator 后也会存在机器删除修复 Operator 资源 复制链接链接已复制到粘贴板!
- 问题
- Machine Deletion Remediation Operator 资源(如补救 CR 和补救模板 CR )在卸载 Operator 后也存在。
- 解决方案
要删除 Machine Deletion Remediation Operator 资源,您可以在卸载前选择 Delete all operand instances for this operator 复选框来删除资源。自版本 4.13 起,此复选框功能仅适用于 Red Hat OpenShift。对于所有版本的 Red Hat OpenShift,您可以通过为每个资源类型运行以下相关命令来删除资源:
$ oc delete mdr <machine-deletion-remediation> -n <namespace>$ oc delete mdrt <machine-deletion-remediation-template> -n <namespace>补救 CR
mdr必须被同一实体创建和删除,如 NHC。如果补救 CRmdr仍然存在,它将与 MDR operator 一起删除。只有在 NHC 中使用 MDR 时,补救模板 CR
mdrt才存在。使用 Web 控制台删除 MDR Operator 时,也会删除补救模板 CRmdrt。