11.3. 替换 Ceph 仪表板上的故障 OSD
您可以将 Red Hat Ceph Storage 集群中的故障 OSD 替换为仪表板上访问的 cluster-manager
级别。控制面板中的这一功能的亮点之一是,在替换故障 OSD 时可以保留 OSD ID。
先决条件
- 一个正在运行的 Red Hat Ceph Storage 集群。
-
至少需要
cluster-manager
级别访问 Ceph 控制面板。 -
至少一个 OSD 为
down
流程
在仪表板中,您可以使用以下方法识别失败的 OSD:
- 仪表板 AlertManager 弹出通知。
- 仪表板登录页面,显示 HEALTH_WARN 状态。
- 显示故障 OSD 的仪表板登录页面。
显示故障 OSD 的仪表板 OSD 页面。
在本例中,您可以看到其中一个 OSD 在仪表板的登录页面上停机。
除了物理驱动器上,您还可以查看其中一个 OSD 停机时的 LED 光盘。
- 点 OSD。
选择
out
和down
OSD:- 在 Edit 下拉菜单中选择 Flags 并选择 No Up 并点 Update。
- 在 Edit 下拉菜单中选择 Delete。
- 在 Delete OSD 对话框中,选择 Preserve OSD ID for replacement 和 Yes, I am sure 复选框。
- 点 Delete OSD。
-
等待 OSD 的状态更改为
out
和destroyed
状态。
可选: 如果要更改整个集群的 No Up Flag,在 Cluster-wide 配置 下拉菜单中选择 Flags。
- 在集群范围的 OSD 标记对话框中,选择 No Up 并点 Update。
可选:如果 OSD 由于硬盘失败而停机,请替换物理驱动器:
- 如果驱动器支持热插拔,请将失败的驱动器替换为新驱动器。
- 如果驱动器不可热插拔并且主机包含多个 OSD,您可能需要关闭整个主机并替换物理驱动器。考虑防止集群回填。详情请参阅 Red Hat Ceph Storage 故障排除指南中的停止和启动重新平衡 章节。
-
当驱动器出现在
/dev/
目录下时,请注意驱动器路径。 - 如果要手动添加 OSD,找到 OSD 驱动器并格式化磁盘。
如果新磁盘有数据,则 zap 磁盘:
语法
ceph orch device zap HOST_NAME PATH --force
示例
ceph orch device zap ceph-adm2 /dev/sdc --force
- 在 Create 下拉菜单中选择 Create。
在 Create OSD 窗口中,点主设备的 +Add。
在 主要设备 对话框中,从 Hostname 下拉列表中选择一个过滤器。从 Any 下拉列表中,选择对应的选项。
注意您必须首先选择 Hostname,然后至少一个过滤器来添加设备。
例如,从 Hostname 列表中选择
Type
和 Any 列表中,选择hdd
。选择 Vendor 和 from any 列表中,选择ATA
- 点击 Add。
- 在 Create OSD 窗口 中,点 Preview 按钮。
- 在 OSD Creation Preview 对话框中,单击 Create。
-
您将获得该 OSD 创建的通知。OSD 将处于
out
状态和down
状态。
选择新创建的具有 out 和 down 状态的 OSD。
- 在 Edit 下拉菜单中,选择 Mark-in。
- 在 Mark OSD in 窗口中,选择 Mark in。
- 在 Edit 下拉菜单中,选择 Flags。
- 取消选择 No Up 并点 Update。
可选: 如果您在集群范围的配置前更改了 No Up Flag,在 集群范围的配置菜单中选择 Flags。
- 在集群范围的 OSD 标记对话框中,取消选择 No Up 并点 Update。
验证
验证已销毁的 OSD 是否在设备上创建,并且 OSD ID 已被保留。
其它资源
- 有关故障 OSD 的更多信息,请参阅 Red Hat Ceph Storage 故障排除指南中的 Down OSDs 部分。
- 如需了解更多帮助,请参阅 Red Hat Ceph Storage 故障排除指南中的红帽对服务的支持 章节。
- 如需有关系统角色的更多信息,请参阅 Red Hat Ceph Storage Dashboard 指南中的 Ceph 仪表板上的用户角色和权限部分。