4.5. Machine Deletion Remediation Operator 故障排除
4.5.1. 常规故障排除 复制链接链接已复制到粘贴板!
- 问题
- 您需要排除 Machine Deletion Remediation Operator 的问题。
- 解决方案
检查 Operator 日志。
$ oc logs <machine-deletion-remediation-controller-manager-name> -c manager -n <namespace-name>
4.5.2. 失败的补救 复制链接链接已复制到粘贴板!
- 问题
- 一个不健康的节点没有被修复。
- 解决方案
运行以下命令验证
MachineDeletionRemediationCR 是否已创建:$ oc get mdr -A如果节点处于不健康状态时,如果
NodeHealthCheck控制器没有创建MachineDeletionRemediationCR,请检查NodeHealthCheck控制器的日志。另外,请确保NodeHealthCheckCR 包含使用补救模板所需的规格。如果创建了
MachineDeletionRemediationCR,请确保其名称与不健康的节点对象匹配。
4.5.3. 即使卸载 Operator 后也会存在机器删除修复 Operator 资源 复制链接链接已复制到粘贴板!
- 问题
- 即使卸载 Operator 后,Machine Deletion Remediation Operator 资源(如补救 CR 和补救模板 CR)也会存在。
- 解决方案
要删除 Machine Deletion Remediation Operator 资源,您可以在卸载前选择 Delete all operand instance for this operator 复选框来删除资源。此复选框功能仅在 Red Hat OpenShift 版本 4.13 起可用。对于所有版本的 Red Hat OpenShift,您可以通过为每个资源类型运行以下命令来删除资源:
$ oc delete mdr <machine-deletion-remediation> -n <namespace>$ oc delete mdrt <machine-deletion-remediation-template> -n <namespace>补救 CR
mdr必须由同一实体创建和删除,例如 NHC。如果补救 CRmdr仍然存在,它将与 MDR operator 一起删除。只有在 NHC 中使用 MDR 时,补救模板 CR
mdrt才存在。当使用 Web 控制台删除 MDR Operator 时,补救模板 CRmdrt也会被删除。