第10章 ライブマイグレーション
10.1. ライブマイグレーションについて
ライブマイグレーションは、仮想ワークロードに支障を与えることなく、実行中の仮想マシンをクラスター内の別のノードに移行するプロセスです。ライブマイグレーションにより、クラスターのアップグレード中や、メンテナンスや設定の変更のためにノードをドレインする必要があるときに、スムーズな移行が可能になります。
デフォルトでは、ライブマイグレーショントラフィックは Transport Layer Security (TLS) を使用して暗号化されます。
10.1.1. ライブマイグレーションの要件
ライブマイグレーションには次の要件があります。
-
クラスターには、
ReadWriteMany
(RWX) アクセスモードの共有ストレージが必要です。 クラスターには十分な RAM とネットワーク帯域幅が必要です。
注記ライブマイグレーションを引き起こすノードドレインをサポートするために、クラスター内に十分なメモリーリクエスト容量があることを確認する必要があります。以下の計算を使用して、必要な予備のメモリーを把握できます。
Product of (Maximum number of nodes that can drain in parallel) and (Highest total VM memory request allocations across nodes)
クラスターで並行して実行できるデフォルトの移行数は 5 です。
- 仮想マシンがホストモデル CPU を使用する場合、ノードはその CPU をサポートする必要があります。
- ライブマイグレーション用に 専用の Multus ネットワークを設定すること を強く推奨します。専用ネットワークは、移行中のテナントワークロードに対するネットワークの飽和状態の影響を最小限に抑えます。
10.1.2. 仮想マシン移行のチューニング
ワークロードのタイプと移行シナリオに基づき、クラスター全体のライブマイグレーション設定を調整できます。これにより、同時に移行する仮想マシンの数、各移行に使用するネットワーク帯域幅、プロセスをキャンセルするまでに OpenShift Virtualization が移行を完了しようと試みる時間を制御できます。これらの設定は、HyperConverged
カスタムリソース (CR) で行います。
ノードごとに複数の仮想マシンを同時に移行する場合は、bandwidthPerMigration
制限を設定して、大規模またはビジー状態の仮想マシンがノードのネットワーク帯域幅の大部分を使用しないようにします。デフォルトでは、bandwidthPerMigration
の値は 0
で、無制限を意味します。
メモリーのダーティー率が高く、負荷の高いワークロード (データベース処理など) を実行する大規模な仮想マシンでは、移行を完了するためにより高い帯域幅が必要になります。
ポストコピーモードを有効にすると、定義されたタイムアウト内に最初のプレコピーフェーズが完了しない場合にトリガーされます。ポストコピーの期間において、必要最小限のメモリーページの転送中に仮想マシン CPU はソースホスト上で一時停止します。その後、仮想マシン CPU が宛先ホスト上でアクティブになり、実行時に残りのメモリーページが宛先ノードに転送されます。これにより、転送中のパフォーマンスに影響が出る可能性があります。
ポストコピーモードは、重要なデータや不安定なネットワークで使用しないでください。
10.1.3. 一般的なライブマイグレーションタスク
次のライブマイグレーションタスクを実行できます。
- ライブマイグレーションの設定
- 負荷の高いワークロード向けのライブマイグレーション設定
- ライブマイグレーションの開始とキャンセル
- OpenShift Virtualization Web コンソールの Migration タブで、すべてのライブマイグレーションの進行状況を監視する。
- Web コンソールの Metrics タブで仮想マシン移行メトリクスを表示する。