7.2. 障害復旧
ハードリフレッシュ時の ACM コンソールビューの永続性
以前は、ACM コンソールからのハードリフレッシュにより、ビューが OCP (local-cluster) コンソールに戻っていました。これは、Multicluster Orchestrator コンソールルートが ACM (すべてのクラスター)ビューで適切に登録されていなかったことが原因で、想定されるナビゲーション動作が中断されたためです。ルーティングロジックが修正され、ブラウザーを更新してもアクティブビューが変更されなくなりました。ユーザーは、目的どおりに ACM コンソールに残ります。
仮想マシンの DR ステータスが表示されるようになりました
仮想マシン一覧ページに DR Status がありませんでした。ラベルセレクターを使用して VM を管理する際に、Remove disaster recovery オプションを利用できませんでした。これは、UI が仮想マシンのクラスターとその DRPC を正しく識別できなかったために発生しました。
この問題は、正しいフィールドから仮想マシンクラスターを読み取り、ラベルセレクターが使用されるときに DRPC を解析する方法を改善することで修正されました。現在、DR ステータス と 障害復旧の削除 オプションの両方が期待どおりに動作するようになりました。
整合性グループが有効になっている CephFS アプリケーションの DR を無効にしても、一部のリソースが残らなくなりました。
整合性グループが有効な CephFS アプリケーションの DR を無効にすると、リソースが遅れなくなりました。手動でのクリーンアップは不要になりました。
4.18 から 4.19 にアップグレードした後の ramen-hub-operator-config の s3StoreProfile
以前は、4.18 から 4.19 にアップグレードした後、
ramen-hub-operator-configConfigMap は Ramen-hub CSV からのデフォルト値で上書きされていました。これにより、カスタム S3Profiles と Multicluster Orchestrator (MCO) Operator によって追加された他の設定が失われました。この問題は、アップグレード中にカスタムエントリーを保持するように修正され、S3 プロファイル設定の中断を防ぎます。
再配置時の MAC 割り当ての失敗により VirtualMachines
.kubevirt.ioリソースが復元に失敗しなくなりました。以前は、仮想マシンが優先クラスターに戻されると、その MAC アドレスが利用できないため、再配置が失敗する可能性がありました。これは、フェイルオーバークラスターにフェイルオーバーされた後に、仮想マシンが優先クラスターで完全にクリーンアップされなかった場合に発生しました。このクリーンアッププロセスが修正され、優先クラスターへの再配置が正常に実行されるようになりました。
ReplicationDestinationリソースがまだ作成されていない場合にフェイルオーバープロセスが失敗しなくなりました。以前は、
LastGroupSyncTimeの更新前にユーザーがフェイルオーバーを開始した場合、フェイルオーバープロセスに失敗していました。この失敗には、ReplicationDestinationが存在しないことを示すエラーメッセージが表示されます。この問題は解決され、フェイルオーバーは予想通りに機能するようになりました。
整合性グループベースのワークロードの再配置後に同期が停止しなくなる
以前は、ボリューム整合性グループを持つ CephRBD ボリュームを使用するアプリケーションが実行され、セカンダリーマネージドクラスターがオフラインになると、セカンダリークラスターがオンラインになった後、これらのボリュームのレプリケーションが無期限に停止する可能性がありました。この状態の間、
Volume SynchronizationDelayアラートがトリガーされ、次にWarningステータスからエスカレートされ、影響を受けるボリュームに対してレプリケーションが停止したことを示すCriticalにエスカレートされました。この問題は解決され、セカンダリークラスターが復元されたときにレプリケーションが自動的に再開されるようになりました。