第 11 章 SR-IOV 网络上的 pod 级别绑定的高可用性
对于使用与 SR-IOV 虚拟功能(VF)的 pod 级别绑定的工作负载,尽管上游交换机失败,底层的物理功能(PF)可能仍然报告了状态。这会创建一个静默失败,因为附加的 VF 会保持启动,pod 继续将流量发送到死端点,从而导致数据包丢失。
PF Status Relay Operator 通过将链路聚合控制协议(LACP)用作活跃的健康检查来解决这个问题。在这个配置中,每个物理功能(PF)都放在其自身的单成员 LACP 绑定中。当 Operator 在 PF 绑定中检测到 LACP 失败时,它会将附加的 VF 的链接状态从 auto
改为 disabled
。此操作会触发 pod 的 active-backup
绑定使其备份网络路径切换到其备份网络路径,从而保持高可用性。
为 SR-IOV 网络配置 LACP 状态监控只是一个技术预览功能。技术预览功能不受红帽产品服务等级协议(SLA)支持,且功能可能并不完整。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。
有关红帽技术预览功能支持范围的更多信息,请参阅技术预览功能支持范围。
11.1. 使用 CLI 安装 PF Status Relay Operator 复制链接链接已复制到粘贴板!
安装 PF Status Relay Operator,以启用 OpenShift Container Platform 使用链路聚合控制协议(LACP)作为物理功能(PF)的活动健康检查。
先决条件
- 您已在上游交换机上配置了 LACP。
- 为 SR-IOV 网络配置了 pod 级别绑定。
-
已安装 OpenShift CLI(
oc
)。 - 有 cluster-admin 权限。
流程
输入以下命令来创建
openshift-pf-status-relay-operator
命名空间:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输入以下命令来创建
OperatorGroup
自定义资源 (CR):Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输入以下命令为 PF Status Relay Operator 创建
Subscription
CR:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
要验证是否已安装 Operator,请输入以下命令,然后检查 Operator 的输出显示
Succeeded
:oc get csv -n openshift-pf-status-relay-operator -o custom-columns=Name:.metadata.name,Phase:.status.phase
$ oc get csv -n openshift-pf-status-relay-operator -o custom-columns=Name:.metadata.name,Phase:.status.phase
Copy to Clipboard Copied! Toggle word wrap Toggle overflow