第 4 章 使用机器删除修复
您可以使用 Machine Deletion Remediation Operator 使用 Machine API 重新置备不健康的节点。您可以将 Machine Deletion Remediation Operator 与 Node Health Check Operator 搭配使用。
4.1. 关于 Machine Deletion Remediation Operator 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Machine Deletion Remediation (MDR)操作器可用于 NodeHealthCheck 控制器,以使用 Machine API 重新置备不健康的节点。MDR 遵循节点上的注解到关联的机器对象,确认它拥有自己的控制器(如 MachineSetController),并删除它。删除机器 CR 后,拥有的控制器会创建一个替换。
MDR 的先决条件包括:
- 基于 Machine API 的集群,可以通过编程方式销毁并创建集群节点,
- 与机器关联的节点,以及
- 声明性管理的机器。
然后,您可以修改 NodeHealthCheck CR,以使用 MDR 作为其补救器。文档中提供了 MDR 模板对象和 NodeHealthCheck 配置示例。
MDR 进程按如下方式工作:
- Node Health Check Operator 检测到不健康的节点并创建 MDR CR。
- MDR Operator 会监视与不健康节点关联的 MDR CR,并在机器有自己的控制器时删除它。
-
当节点再次处于健康状态时,NodeHealthCheck 控制器会删除 MDR CR。