6.4. 使用备份和恢复进行主动和被动 Satellite 服务器的灾难恢复
要准备灾难恢复,您可以配置两个 Satellite 服务器:一个主动主服务器和一个被动次要服务器。您可以配置主服务器的定期备份。如果主服务器失败,您可以在次要服务器上恢复备份,使它变为新的主服务器。
6.4.1. 先决条件 复制链接链接已复制到粘贴板!
- 查看 第 6.1 节 “推荐的灾难恢复计划概述” 以确保此灾难恢复计划适合您。
- 已安装 Satellite 服务器。
6.4.2. 准备使用主动和被动 Satellite 服务器进行灾难恢复,以及备份和恢复 复制链接链接已复制到粘贴板!
通过恢复主动 Satellite 服务器的备份来创建被动 Satellite 服务器。配置活动服务器的定期备份。
流程
为活跃 Satellite 服务器的定期离线备份定义调度。为潜在的数据丢失和您的存储选项考虑您的容错能力:在出现灾难时,频繁进行备份将导致较少的数据丢失,但备份需要大量的存储空间。有关 Satellite 备份大小的详情,请参考 第 11.1 节 “估算备份的大小”。
您可以将完整备份与增量备份合并。有关确保常规备份的
cron
作业示例,请参考 第 6.4.5 节 “每周完整备份示例,后跟每日增量备份”。- 根据您定义的时间表,调度活跃 Satellite 服务器的定期离线备份。有关执行备份的详情,请参考 第 11 章 备份 Satellite 服务器和 Capsule 服务器。
确保备份目录已加密,并定期同步到安全位置。默认情况下,Satellite 将备份存储在
/var/satellite-backup
目录中。重要Satellite 服务器备份包含
/root/ssl-build
目录中的敏感信息。例如,它们可以包含主机名、ssh 密钥、请求文件和 SSL 证书。加密或将备份移动到安全位置有助于最大程度降低对主机的损坏或未授权访问的风险。- 在充当您的被动 Satellite 服务器的系统上恢复最新的备份。有关恢复备份的详情,请参考 第 12 章 从备份中恢复 Satellite 服务器或 Capsule 服务器。
可选:自动备份恢复,以使用最新的备份定期更新被动服务器。如果活动服务器失败,定期恢复的被动服务器有助于缩短切换时间。
考虑要恢复备份的频率:更频繁的更新会降低潜在的数据丢失,但提高了基础架构和自动化成本。
- 关闭被动服务器。保持活动服务器开机。
- 定义备份保留策略。考虑您要存储多少个备份:常规删除过时的备份有助于优化存储使用。
验证
- 根据您定义的调度来验证 Satellite 是否进行了备份。
在隔离的暂存环境中执行进一步测试步骤:
- 模拟活动服务器上的完全中断。为确保活动服务器无法访问,您可以关闭机器,如果服务器在虚拟机上运行,则停止虚拟机(VM),或使用防火墙隔离机器。
- 使用被动服务器的 DNS 记录切换活动服务器的 DNS 记录。
- 评估测试 Satellite 服务器的功能。如需更多信息,请参阅 第 6.4.4 节 “检索服务状态”。
- 定期执行这些验证检查。
6.4.3. 使用主动和被动服务器以及备份和恢复从灾难中恢复 复制链接链接已复制到粘贴板!
如果您的主动 Satellite 服务器失败,请激活您的被动次要服务器。
流程
- 验证失败的活动服务器是否已关闭,并且备份不再同步到您的被动服务器。
- 使用被动服务器的 DNS 记录切换活动服务器的 DNS 记录。这样可确保主机保持连接,您不需要重新注册它们。
- 评估您的新 Satellite 服务器的功能。如需更多信息,请参阅 第 6.4.4 节 “检索服务状态”。
6.4.4. 检索服务状态 复制链接链接已复制到粘贴板!
Satellite 使用一组后端服务。在进行故障排除时,您可以检查 Satellite 服务的状态。
流程
在 Satellite Web UI 中,进入到 Administer > About。
- 在 Smart Proxies 选项卡上,查看所有 Capsules 的状态。
- 在 Compute Resources 选项卡中,查看附加的计算资源提供程序的状态。
- 在 Backend System Status 表中,查看所有后端服务的状态。
CLI 过程
从数据库和 Satellite 服务获取信息:
hammer ping
$ hammer ping
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 检查 systemd 中运行的服务的状态:
satellite-maintain service status
# satellite-maintain service status
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 运行
satellite-maintain service --help
了解更多信息。执行健康检查:
satellite-maintain health check
$ satellite-maintain health check
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 运行
satellite-maintain health --help
了解更多信息。
6.4.5. 每周完整备份示例,后跟每日增量备份 复制链接链接已复制到粘贴板!
以下脚本在星期日执行完整备份,后跟以下每个天的增量备份:每天执行增量备份都会创建一个新子目录。该脚本需要一个每日 cron 作业。
请注意,satellite-maintain backup
命令需要 /sbin
和 /usr/sbin
目录在 PATH
中,并使用-- assumeyes
选项跳过确认提示。