第6章 障害復旧の準備とデータ損失からの復旧
Red Hat では、中断イベントが発生した場合に Satellite サービスの継続性を確保するために、障害復旧計画を準備することを推奨しています。これらのガイドラインは、インシデント発生後に Satellite のデプロイメントを運用状態に復元できるようにするために役立ちます。
6.1. 推奨される障害復旧計画の概要 リンクのコピーリンクがクリップボードにコピーされました!
デプロイメント内の Satellite サービスの継続性を確保するのに最も適した障害復旧計画を選択します。
- 仮想化された Satellite Server のスナップショット
- どのようにバックアップするのですか?
- Satellite Server を仮想化し、ハイパーバイザーツールを使用してサーバーの仮想マシンのスナップショットを取得します。この方法は、仮想マシンで Satellite を実行できる場合に適しています。
- 業務やサービス提供を中断するイベントが発生した場合にどのように復旧しますか?
- Satellite サービスを回復するには、仮想マシンのスナップショットを復元します。
- デメリットと予想される影響
- 最後のスナップショットがどの程度古いかによって、復元後のデータが整合性に欠ける場合があります。復元に使用しているスナップショットの作成後に発生したデータの変更は失われます。
- アクティブおよびパッシブな Satellite Server (外部ストレージ付き)
- どのようにバックアップするのですか?
-
重要なデータ (
/var/lib/pulp
のコンテンツおよび、/var/lib/pgsql
のデータベース) をネットワーク接続ストレージに保存します。このストレージを別のデータセンターに複製します。プライマリー Satellite Server のクローンであるがパッシブに実行される Satellite Server にストレージをアタッチします。 - 業務やサービス提供を中断するイベントが発生した場合にどのように復旧しますか?
- Satellite サービスを復旧するには、アクティブな Satellite Server の DNS レコードをパッシブな Satellite Server に切り替えます。これにより、パッシブサーバーがアクティブサーバーになります。すべてのホストは設定の更新なしで接続されたままになります。
- デメリットと予想される影響
- ネットワークがアタッチされたストレージが別の場所に複製される場合、同期間隔によって復元後に、若干データの不整合が発生する可能性があります。
- アクティブおよびパッシブな Satellite Server (バックアップとリストア機能付き)
- どのようにバックアップするのですか?
- Satellite Server のバックアップを定期的に作成するようにしてください。このバックアップをパッシブ Satellite Server にコピーし、パッシブサーバーで復元します。
- 業務やサービス提供を中断するイベントが発生した場合にどのように復旧しますか?
- Satellite サービスを復旧するには、アクティブな Satellite Server の DNS レコードをパッシブな Satellite Server に切り替えます。これにより、パッシブサーバーがアクティブサーバーになります。すべてのホストは設定の更新なしで接続されたままになります。
- デメリットと予想される影響
- バックアップの作成頻度およびバックアップの復元頻度、および復元プロセスまでの完了時間によって、復元後にデータが不整合になる可能性があります。
- デュアルアクティブ Satellite Server
- どのようにバックアップするのですか?
アクティブで、データセンターごとに独立した Satellite Server を運用します。各データセンターのホストは、そのデータセンターの Satellite Server に登録されます。次に、業務やサービスが中断されるような事象が発生した場合に確実に回復できるように自動化を設定します。たとえば、定期的にヘルスチェックを実行し、ヘルスチェックによってホストが登録されている現在の Satellite Server が解決されないことが検出された場合、ホストは他の Satellite Server に再登録されます。
ダウンタイムを最小限に抑えるために、さまざまな方法でリカバリーを自動化できます。たとえば、Satellite Ansible コレクションを使用できます。詳細は、Red Hat Satellite の管理 の Satellite Ansible Collection を使用した Satellite 管理の自動化 を参照してください。
- 業務やサービス提供を中断するイベントが発生した場合にどのように復旧しますか?
- Satellite サービスを復元するには、すべてのホストを他のデータセンターの Satellite Server に再登録します。
- デメリットと予想される影響
- 各 Satellite で同じコンテンツビューを作成し、コンテンツのドリフトを防ぐには、コンテンツの同期とコンテンツビューの作成が同期されていることを確認する必要があります。コンテンツドリフトは、利用可能なコンテンツが、コンテンツビューで定義された目的の状態とは異なる場合に発生します。コンテンツのドリフトを防止できない場合は、ホストで利用できるコンテンツに不整合が生じることが予想されます。