搜索

第 13 章 处理节点故障

download PDF

作为存储管理员,您可以在存储集群中遇到整个节点故障,处理节点故障与处理磁盘故障类似。当节点出现故障时,而不是 Ceph 对只有一个磁盘恢复放置组(PG),必须恢复该节点上的磁盘上的所有 PG。Ceph 将检测 OSD 是否都停止,并且自动启动恢复过程,称为自我修复。

有三个节点故障场景。

  • 使用故障节点的 root 和 Ceph OSD 磁盘替换节点。
  • 通过重新安装操作系统和使用来自故障节点的 Ceph OSD 磁盘来替换节点。
  • 通过重新安装操作系统和使用所有新的 Ceph OSD 磁盘来替换节点。

有关每个节点替换场景的高级工作流,请参阅 link:https://access.redhat.com/documentation/zh-cn/red_hat_ceph_storage/7/html-single/operations_guide/#ops_workflow-for replace-a-node[用于替换节点 ] 的工作流

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。
  • 一个出现故障的节点。

13.1. 在添加或删除节点前的注意事项

Ceph 的其中一个未完成功能是能够在运行时添加或删除 Ceph OSD 节点。这意味着,您可以在不关闭存储集群的情况下调整存储集群容量或替换硬件的大小。

在存储集群 处于降级状态 时为 Ceph 客户端提供服务,也具有操作优势。例如,您可以在常规工作时间内添加或删除硬件,而不是在工作时间外或周末操作。但是,添加和删除 Ceph OSD 节点可能会对性能产生重大影响。

在添加或删除 Ceph OSD 节点前,请考虑以下对存储集群性能的影响:

  • 无论您要扩展或减少存储容量,添加或删除 Ceph OSD 节点,都会降低回填存储集群重新平衡。在进行重新平衡期间,Ceph 使用额外的资源,这可能会影响存储集群性能。
  • 在生产环境的 Ceph 存储集群中,Ceph OSD 节点具有特定的硬件配置,有助于实现特定类型的存储策略。
  • 由于 Ceph OSD 节点是 CRUSH 层次结构中的一部分,因此添加或删除节点的性能通常会影响使用 CRUSH 规则集的池的性能。

其它资源

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.