4.5. 对 Machine Deletion Remediation Operator 进行故障排除


4.5.1. 常规故障排除

问题
您需要使用 Machine Deletion Remediation Operator 排除问题。
解决方案

检查 Operator 日志。

$ oc logs <machine-deletion-remediation-controller-manager-name> -c manager -n <namespace-name>

4.5.2. 失败的补救

问题
一个不健康的节点没有被修复。
解决方案

运行以下命令验证 MachineDeletionRemediation CR 是否已创建:

$ oc get mdr -A

如果 NodeHealthCheck 控制器在节点不健康时没有创建 MachineDeletionRemediation CR,请检查 NodeHealthCheck 控制器的日志。另外,请确保 NodeHealthCheck CR 包含使用补救模板所需的规格。

如果创建了 MachineDeletionRemediation CR,请确保其名称与不健康的节点对象匹配。

问题
Machine Deletion Remediation Operator 资源(如补救 CR 和补救模板 CR )在卸载 Operator 后也存在。
解决方案

要删除 Machine Deletion Remediation Operator 资源,您可以在卸载前选择 Delete all operand instances for this operator 复选框来删除资源。自版本 4.13 起,此复选框功能仅适用于 Red Hat OpenShift。对于所有版本的 Red Hat OpenShift,您可以通过为每个资源类型运行以下相关命令来删除资源:

$ oc delete mdr <machine-deletion-remediation> -n <namespace>
$ oc delete mdrt <machine-deletion-remediation-template> -n <namespace>

补救 CR mdr 必须被同一实体创建和删除,如 NHC。如果补救 CR mdr 仍然存在,它将与 MDR operator 一起删除。

只有在 NHC 中使用 MDR 时,补救模板 CR mdrt 才存在。使用 Web 控制台删除 MDR Operator 时,也会删除补救模板 CR mdrt

Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部