11.3. 替换 Ceph 仪表板上的故障 OSD


您可以将 Red Hat Ceph Storage 集群中的故障 OSD 替换为仪表板上访问的 cluster-manager 级别。控制面板中的这一功能的亮点之一是,在替换故障 OSD 时可以保留 OSD ID。

先决条件

  • 一个正在运行的 Red Hat Ceph Storage 集群。
  • 至少需要 cluster-manager 级别访问 Ceph 控制面板。
  • 至少一个 OSD 为 down

流程

  1. 在仪表板中,您可以使用以下方法识别失败的 OSD:

    • 仪表板 AlertManager 弹出通知。
    • 仪表板登录页面,显示 HEALTH_WARN 状态。
    • 显示故障 OSD 的仪表板登录页面。
    • 显示故障 OSD 的仪表板 OSD 页面。

      OSD 的健康状况

      在本例中,您可以看到其中一个 OSD 在仪表板的登录页面上停机。

      除了物理驱动器上,您还可以查看其中一个 OSD 停机时的 LED 光盘。

  2. OSD
  3. 选择 outdown OSD:

    1. Edit 下拉菜单中选择 Flags 并选择 No Up 并点 Update
    2. Edit 下拉菜单中选择 Delete
    3. Delete OSD 对话框中,选择 Preserve OSD ID for replacementYes, I am sure 复选框。
    4. Delete OSD
    5. 等待 OSD 的状态更改为 outdestroyed 状态。
  4. 可选: 如果要更改整个集群的 No Up Flag,在 Cluster-wide 配置 下拉菜单中选择 Flags

    1. 集群范围的 OSD 标记对话框中,选择 No Up 并点 Update。
  5. 可选:如果 OSD 由于硬盘失败而停机,请替换物理驱动器:

    • 如果驱动器支持热插拔,请将失败的驱动器替换为新驱动器。
    • 如果驱动器不可热插拔并且主机包含多个 OSD,您可能需要关闭整个主机并替换物理驱动器。考虑防止集群回填。详情请参阅 Red Hat Ceph Storage 故障排除指南中的停止和启动重新平衡 章节。
    • 当驱动器出现在 /dev/ 目录下时,请注意驱动器路径。
    • 如果要手动添加 OSD,找到 OSD 驱动器并格式化磁盘。
    • 如果新磁盘有数据,则 zap 磁盘:

      语法

      ceph orch device zap HOST_NAME PATH --force

      示例

      ceph orch device zap ceph-adm2 /dev/sdc --force

  6. Create 下拉菜单中选择 Create
  7. Create OSD 窗口中,点主设备的 +Add

    1. 主要设备 对话框中,从 Hostname 下拉列表中选择一个过滤器。从 Any 下拉列表中,选择对应的选项。

      注意

      您必须首先选择 Hostname,然后至少一个过滤器来添加设备。

      例如,从 Hostname 列表中选择 TypeAny 列表中,选择 hdd。选择 Vendor 和 from any 列表中,选择 ATA

      为 OSD 添加设备
    2. 点击 Add
    3. Create OSD 窗口 中,点 Preview 按钮。
    4. OSD Creation Preview 对话框中,单击 Create
    5. 您将获得该 OSD 创建的通知。OSD 将处于 out 状态和 down 状态。
  8. 选择新创建的具有 outdown 状态的 OSD。

    1. Edit 下拉菜单中,选择 Mark-in
    2. Mark OSD in 窗口中,选择 Mark in
    3. Edit 下拉菜单中,选择 Flags
    4. 取消选择 No Up 并点 Update
  9. 可选: 如果您在集群范围的配置前更改了 No Up Flag,在 集群范围的配置菜单中选择 Flags

    1. 集群范围的 OSD 标记对话框中,取消选择 No Up 并点 Update

验证

  1. 验证已销毁的 OSD 是否在设备上创建,并且 OSD ID 已被保留。

    OSD 已创建

其它资源

  • 有关故障 OSD 的更多信息,请参阅 Red Hat Ceph Storage 故障排除指南中的 Down OSDs 部分。
  • 如需了解更多帮助,请参阅 Red Hat Ceph Storage 故障排除指南中的红帽对服务的支持 章节。
  • 如需有关系统角色的更多信息,请参阅 Red Hat Ceph Storage Dashboard 指南中的 Ceph 仪表板上的用户角色和权限部分。
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.