搜索

8.2. 在动态置备的 Red Hat OpenShift Data Foundation 中删除失败的或不需要的 Ceph OSD

download PDF

按照流程中的步骤,在动态置备的 Red Hat OpenShift Data Foundation 中删除失败或不需要的 Ceph 对象存储设备(OSD)。

重要

只有红帽支持团队才支持缩减集群。

警告
  • 当 Ceph 组件没有处于健康状态时,删除 OSD 可能会导致数据丢失。
  • 同时删除两个或多个 OSD 会导致数据丢失。

先决条件

流程

  1. 缩减 OSD 部署。

    # oc scale deployment rook-ceph-osd-<osd-id> --replicas=0
  2. 获取要删除的 Ceph OSD 的 osd-prepare pod。

    # oc get deployment rook-ceph-osd-<osd-id> -oyaml | grep ceph.rook.io/pvc
  3. 删除 osd-prepare pod。

    # oc delete -n openshift-storage pod rook-ceph-osd-prepare-<pvc-from-above-command>-<pod-suffix>
  4. 从集群移除出现故障的 OSD。

    # failed_osd_id=<osd-id>
    
    # oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=$<failed_osd_id> | oc create -f -

    其中,FAILED_OSD_ID 是 pod 名称中紧接在 rook-ceph-osd 前缀后面的整数。

  5. 通过检查日志来验证 OSD 是否已成功移除。

    # oc logs -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>
  6. 可选:如果您遇到 cephosd:osd.0 is not ok to destroy to destroy to destroy from the ocs-osd-removal-job pod in OpenShift Container Platform 的错误,请参阅 对 cephosd:osd.0 错误进行故障排除,同时删除失败或不需要的 Ceph OSD
  7. 删除 OSD 部署。

    # oc delete deployment rook-ceph-osd-<osd-id>

验证步骤

  • 要检查 OSD 是否已成功删除,请运行:

    # oc get pod -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>

    此命令必须将状态返回为 Completed

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.