第11章 SR-IOV ネットワークにおける Pod レベルボンディングの高可用性
SR-IOV Virtual Function (VF) を使用する Pod レベルのボンディングを使用するワークロードの場合、アップストリームスイッチの障害にもかかわらず、基盤となる Physical Function (PF) が引き続き up 状態を報告することがあります。これにより、アタッチされた VF が稼働状態のまま Pod がデッドエンドポイントにトラフィックを送信し続けるため、サイレント障害が発生し、パケットロスが発生します。
PF Status Relay Operator は、Link Aggregation Control Protocol (LACP) をアクティブヘルスチェックとして使用することでこの問題を解決します。この設定では、各 Physical Function (PF) は、アップストリームスイッチとの独自の単一メンバー LACP ボンディングに配置されます。Operator は、PF のボンディングで LACP 障害を検出すると、アタッチされている VF のリンク状態を auto から disabled に変更します。このアクションにより、Pod の active-backup ボンディングがトリガーされ、バックアップネットワークパスへのフェイルオーバーが発生し、高可用性が維持されます。
SR-IOV ネットワークの LACP 状態監視の設定は、テクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
11.1. CLI を使用して PF Status Relay Operator をインストールする リンクのコピーリンクがクリップボードにコピーされました!
PF Status Relay Operator をインストールして、OpenShift Container Platform が Link Aggregation Control Protocol (LACP) を Physical Function (PF) のアクティブヘルスチェックとして使用できるようにします。
前提条件
- アップストリームスイッチで LACP を設定した。
- SR-IOV ネットワークの Pod レベルのボンディングを設定した。
-
OpenShift CLI (
oc) がインストールされている。 - cluster-admin 特権がある。
手順
次のコマンドを入力して、
openshift-pf-status-relay-operatornamespace を作成します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを入力して、
OperatorGroupカスタムリソース (CR) を作成します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを入力して、PF Status Relay Operator の
SubscriptionCR を作成します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow
検証
Operator がインストールされていることを確認するには、次のコマンドを入力し、Operator に対して出力に
Succeededと表示されていることを確認します。oc get csv -n openshift-pf-status-relay-operator -o custom-columns=Name:.metadata.name,Phase:.status.phase
$ oc get csv -n openshift-pf-status-relay-operator -o custom-columns=Name:.metadata.name,Phase:.status.phaseCopy to Clipboard Copied! Toggle word wrap Toggle overflow