9.2. 在动态置备的 Red Hat OpenShift Data Foundation 中删除失败或不需要的 Ceph OSD

按照以下步骤在动态置备的 Red Hat OpenShift Data Foundation 中删除失败或不需要的 Ceph 对象存储设备(OSD)。

重要

只有在红帽支持团队的帮助中才支持缩减集群。

警告

先决条件

流程

缩减 OSD 部署。

oc scale deployment rook-ceph-osd-<osd-id> --replicas=0

# oc scale deployment rook-ceph-osd-<osd-id> --replicas=0

Copy to Clipboard

Toggle word wrap

获取要删除的 Ceph OSD 的 osd-prepare pod。

oc get deployment rook-ceph-osd-<osd-id> -oyaml | grep ceph.rook.io/pvc

# oc get deployment rook-ceph-osd-<osd-id> -oyaml | grep ceph.rook.io/pvc

Copy to Clipboard

Toggle word wrap

删除 osd-prepare pod。

oc delete -n openshift-storage pod rook-ceph-osd-prepare-<pvc-from-above-command>-<pod-suffix>

# oc delete -n openshift-storage pod rook-ceph-osd-prepare-<pvc-from-above-command>-<pod-suffix>

Copy to Clipboard

Toggle word wrap

从集群中移除失败的 OSD。

failed_osd_id=<osd-id>
oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=$failed_osd_id | oc create -f -

# failed_osd_id=<osd-id>

# oc process -n openshift-storage ocs-osd-removal -p FAILED_OSD_IDS=$failed_osd_id | oc create -f -

Copy to Clipboard

Toggle word wrap

其中，FAILED_OSD_ID 是 pod 名称中紧接在 rook-ceph-osd 前缀后面的整数。

通过检查日志来验证 OSD 是否已成功移除。

oc logs -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>

# oc logs -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>

Copy to Clipboard

Toggle word wrap

可选：如果您遇到错误 cephosd:osd.0 is not ok to destroy from the ocs-osd-removal-job pod in OpenShift Container Platform，请参阅在删除失败或不需要的 Ceph OSD 时对错误 cephosd:osd.0 进行故障排除。

删除 OSD 部署。

oc delete deployment rook-ceph-osd-<osd-id>

# oc delete deployment rook-ceph-osd-<osd-id>

Copy to Clipboard

Toggle word wrap

验证步骤

要检查 OSD 是否已成功删除，请运行：

oc get pod -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>

# oc get pod -n openshift-storage ocs-osd-removal-$<failed_osd_id>-<pod-suffix>

Copy to Clipboard

Toggle word wrap

这个命令必须将状态返回为 Completed。

返回顶部