第 2 章 处理磁盘失败
作为存储管理员,您必须在存储群集的生命周期内处理磁盘故障。在发生实际故障前,测试和模拟磁盘失败将确保您为实际情况做好准备。
以下是替换故障磁盘的高级别工作流:
- 查找失败的 OSD。
- 将 OSD 变为 out。
- 停止节点上的 OSD 守护进程。
- 检查 Ceph 的状态。
- 从 CRUSH map 移除 OSD。
- 删除 OSD 授权。
- 从存储集群中移除 OSD。
- 卸载节点上的文件系统。
- 替换失败的驱动器。
- 将 OSD 重新添加到存储集群。
- 检查 Ceph 的状态。
2.1. 先决条件
- 一个正在运行的 Red Hat Ceph Storage 集群。
- 失败的磁盘。