6.5. 2 台のアクティブな Satellite Server による障害復旧
障害復旧に備えるために、2 台の Satellite Server を設定し、サーバーごとに別のデータセンターで運用できます。いずれかのサーバーに障害が発生した場合、障害の発生したサーバーから他のサーバーにすべてのホストを再登録できます。
6.5.1. 前提条件 リンクのコピーリンクがクリップボードにコピーされました!
- 「推奨される障害復旧計画の概要」 を参照して、この障害復旧プランが有効であることを確認する。
- Satellite Server がインストールされている。
6.5.2. 2 台のアクティブな Satellite Server で障害復旧の準備をする リンクのコピーリンクがクリップボードにコピーされました!
最初の Satellite Server のバックアップを復元して、2 番目の Satellite Server を作成します。両方のサーバーをそれぞれのデータセンターで独立して動作するように設定しますが、時間の経過とともにコンテンツがばらばらにならないようにします。
手順
- Satellite Server をバックアップします。詳細は、11章Satellite Server および Capsule Server のバックアップ を参照してください。
他の Satellite Server として機能するシステムでバックアップを復元します。詳細は、12章バックアップからの Satellite Server または Capsule Server の復元 を参照してください。
注記各サーバーには異なるホスト名と IP アドレスが必要です。これにより、1 台のサーバーに障害が発生した場合にホストを再登録できるようになります。
サーバーにあるコンテンツの一貫性が保たれていることを確認します。
両方のサーバーでコンテンツの同期とコンテンツビューの作成を管理する場合は、コンテンツのドリフトを防ぐために次のガイドラインに従ってください。
-
両方のサーバーのリポジトリーを定期的に同期します。リポジトリーの同期を自動化するには、
redhat.satellite.repository_sync
およびredhat.satellite.sync_plan
の Ansible モジュールを使用できます。 - 両方のサーバーのコンテンツビューが一致していることを確認します。
-
両方のサーバーのリポジトリーを定期的に同期します。リポジトリーの同期を自動化するには、
1 台のサーバーでコンテンツの同期とコンテンツビューの作成を管理する場合は、次のいずれかの機能を使用してコンテンツのドリフトを防止します。
- 障害復旧サイトがプライマリーサイトへのネットワークアクセスできる場合は、Inter-Satellite Synchronization (ISS) を使用して、障害復旧サーバーがプライマリーサーバーのコンテンツを同期するようにします。
- プライマリーサイトに対するネットワークアクセス権が障害復旧サイトにない場合は、エクスポートとインポートを使用してコンテンツを同期します。
- 1 台のサーバーでコンテンツビューの作成のみを管理してコンテンツの同期は管理しない場合、他のサーバーまたは複数の他のサーバーを設定して、最初のサーバーからコンテンツビューをインポートし、リポジトリーからのコンテンツを同期するように設定できます。
- 各サーバーがそれぞれのデータセンター内のホストを管理できるように、ホストをサーバーに登録します。たとえば、My_Data_Center_1 内のすべてのホストを 1 台の Satellite Server に登録し、My_Data_Center_2 内のすべてのホストを別の Satellite Server に登録します。
-
両方のサーバーで
satellite-maintain health check
コマンドの実行を自動化します。ヘルスチェックでは、サーバーが完全に動作しているかどうかを確認します。
検証
分離されたステージング環境で、このテストを実行します。
- サーバーの 1 台で完全にダウンした状態を再現します。サーバーにアクセスできないことを確認するには、マシンの電源をオフにするか、サーバーが仮想マシン (VM) 上で実行されている場合は仮想マシンを停止するか、ファイアウォールを使用してマシンを分離します。
-
satellite-maintain health check
の自動化でエラーが報告されたことを確認します。 - アクセスできないサーバーからアクセス可能なサーバーにすべてのホストを再登録します。
- ホストがアクセス可能なサーバーに適切に再登録されていることを確認します。
- これらの検証チェックを定期的に実行してください。
関連情報
- Ansible Playbook は、フェイルオーバー、再登録、同期を自動化するのに役立ちます。詳細は、Red Hat Satellite の管理 の Satellite Ansible Collection を使用した Satellite 管理の自動化 を参照してください。
- リポジトリーの同期の詳細は、コンテンツの管理 の リポジトリーの同期 を参照してください。
- ISS、エクスポート、インポートなど、Satellite Server 間でのコンテンツの同期の詳細は、コンテンツの管理 の Satellite Server 間でのコンテンツの同期 を参照してください。
6.5.3. 2 台のアクティブな Satellite Server を使用して障害から復旧する リンクのコピーリンクがクリップボードにコピーされました!
「2 台のアクティブな Satellite Server で障害復旧の準備をする」 で実装されているヘルスチェクが Satellite Server で問題を報告した場合、サーバーに障害が発生している可能性があります。サーバーがダウンしている場合は、ホストを他のサーバーに再登録する必要があります。
手順
サーバーのステータスを確認します。
satellite-maintain health check
# satellite-maintain health check
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
satellite-maintain health check
で問題が報告された場合は、サーバーの電源がオフになっていることを確認してください。 - 障害が発生したサーバーによって管理されているデータセンターのすべてのホストを、他の正常に機能しているサーバーに再登録します。
検証
- ホストが適切に再登録されていることを確認します。
関連情報
- Ansible Playbook は、フェイルオーバー、再登録、同期を自動化するのに役立ちます。詳細は、Red Hat Satellite の管理 の Satellite Ansible Collection を使用した Satellite 管理の自動化 を参照してください。