2.4. このセットアップが耐えられる障害
障害 | 復元 | RPO1 | RTO2 |
---|---|---|---|
データベースノード | ライターインスタンスに障害が発生した場合、データベースは同じサイトまたは別のサイトのリーダーインスタンスを新しいライターにプロモートすることができます。 | データ損失なし | 数秒から数分 (データベースによって異なる) |
Red Hat build of Keycloak ノード | 複数の Red Hat build of Keycloak インスタンスが各サイトで実行されます。1 つのインスタンスに障害が発生した場合、他のノードが変化を認識するまでに数秒かかり、一部の受信リクエストがエラーメッセージを受信するか、数秒遅延する場合があります。 | データ損失なし | 1 分未満 |
Data Grid ノード | 複数の Data Grid インスタンスが各サイトで実行されます。1 つのインスタンスに障害が発生した場合、他のノードが変化を認識するまでに数秒かかります。セッションが少なくとも 2 つの Data Grid ノードに保存されるため、1 つのノードの障害によってデータが失われることはありません。 | データ損失なし | 1 分未満 |
Data Grid クラスターの障害 |
アクティブサイトで Data Grid クラスターに障害が発生すると、Red Hat build of Keycloak が外部 Data Grid と通信できなくなり、Red Hat build of Keycloak サービスが使用できなくなります。 Data Grid クラスターが復元され、セッションデータがプライマリーに再同期されるまで、セットアップの機能が低下します。 | データ損失なし 3 | 数秒から数分 (ロードバランサーの設定によって異なる) |
接続性 Data Grid | 2 つのサイト間の接続が失われると、セッション情報を他方のサイトに送信できなくなります。受信リクエストがエラーメッセージを受信するか、数秒遅延する場合があります。プライマリーサイトがセカンダリーサイトをオフラインとマークし、セカンダリーへのデータの送信を停止します。接続が復元され、セッションデータがセカンダリーサイトに再同期されるまで、セットアップの機能が低下します。 | データ損失なし 3 | 1 分未満 |
接続性データベース | 2 つのサイト間の接続が失われると、同期レプリケーションが失敗し、プライマリーサイトがセカンダリーサイトをオフラインとマークするまでに時間がかかることがあります。一部のリクエストがエラーメッセージを受信するか、数秒遅延する場合があります。データベースによっては手動操作が必要な場合があります。 | データ損失なし 3 | 数秒から数分 (データベースによって異なる) |
プライマリーサイト | Red Hat build of Keycloak ノードが利用できない場合、ロードバランサーは停止を検出し、トラフィックをセカンダリーサイトにリダイレクトします。ロードバランサーがプライマリーサイトの障害を検出していないときに、一部のリクエストがエラーメッセージを受信する場合があります。プライマリーサイトがバックアップされ、セカンダリーサイトからプライマリーサイトにセッション状態が手動で同期されるまで、セットアップの機能が低下します。 | データ損失なし 3 | 1 分未満 |
セカンダリーサイト | セカンダリーサイトが利用できない場合、プライマリーの Data Grid とデータベースがセカンダリーサイトをオフラインとマークするまでに少し時間がかかります。検出中、一部のリクエストがエラーメッセージを受信する場合があります。セカンダリーサイトが再び稼働したら、セッション状態をプライマリーサイトからセカンダリーサイトに手動で同期する必要があります。 | データ損失なし 3 | 1 分未満 |
表の脚注:
1 目標復旧時点。この障害が発生した時点でセットアップのすべての部分が健全であると仮定した場合。
2 目標復旧時間。
3 機能が低下したセットアップを復元するには手動操作が必要です。
“データ損失なし” は、以前の障害によってセットアップの機能が低下していないことを条件としています。これには、サイト間の状態を再同期する保留中の手動操作が完了していることも含まれます。