27.2. 使用 pod 注解执行滚动更新
此流程描述了如何使用 OpenShift Pod
注解手动触发现有 Kafka、Kafka Connect、MirrorMaker 2 或 ZooKeeper 集群的滚动更新。注解多个 pod 时,会在同一协调运行中执行连续的滚动更新。
先决条件
要执行手动滚动更新,您需要一个正在运行的 Cluster Operator。您更新的组件的集群(无论是 Kafka、Kafka Connect、MirrorMaker 2 或 ZooKeeper)也必须正在运行。
您可以在 Kafka 集群上执行滚动更新,无论所使用的主题复制因素是什么。但是,要让 Kafka 在更新过程中正常工作,您需要以下内容:
- 使用您要更新的节点运行高可用性 Kafka 集群部署。
为高可用性复制的主题。
主题配置指定至少 3 个复制因素,最小同步副本的数量为复制因素的数量减 1。
为高可用性复制 Kafka 主题
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
流程
查找您要手动更新的
Pod
的名称。Pod 命名惯例如下:
-
<cluster_name>-kafka-<index_number>
用于 Kafka 集群 -
<cluster_name>-zookeeper-<index_number>
用于 ZooKeeper 集群 -
<cluster_name>-connect-<index_number>
用于 Kafka Connect 集群 -
<cluster_name>-mirrormaker2-<index_number>
用于 MirrorMaker 2 集群
分配给 pod 的
<index_number>
从零开始,并以副本总数减一 结束。-
使用
oc annotate
注解 OpenShift 中的Pod
资源:Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
等待下一个协调发生(默认为两分钟)。当在协调过程检测到注解时,就会触发被注解的
Pod
的滚动更新。当 Pod 的滚动更新完成后,注解会自动从Pod
中删除。
如果启用了 ContinueReconciliationOnManualRollingUpdateFailure
功能门,即使集群的手动滚动更新失败也是如此。这允许 Cluster Operator 从协调稍后可以解决的某些可恢复的情况中恢复。例如,它可以重新创建导致更新失败的缺失的持久性卷声明(PVC)或持久性卷(PV)。