12.3. 从系统中删除旧磁盘并安装替换磁盘
在容器主机上,使用您要替换的 OSD,从系统中删除旧磁盘并安装替换磁盘。
先决条件:
- 验证设备 ID 是否已更改。更多信息请参阅 第 12.1 节 “确定设备名称是否有变化”。
ceph-volume 命令存在于 Ceph 容器中,但不安装在 overcloud 节点上。创建一个别名,以便 ceph-volume 命令在 Ceph 容器内运行 ceph-volume 二进制文件。然后,使用 ceph-volume 命令清理新磁盘,并将它添加为 OSD。
流程
确保失败的 OSD 没有运行:
systemctl stop ceph-osd@27识别 ceph 容器镜像的镜像 ID,并将其存储在名为
IMG的环境变量中:IMG=$(podman images | grep ceph | awk {'print $3'})别名
ceph-volume命令,使其在$IMGCeph 容器中运行,以及ceph-volume入口点和相关目录:alias ceph-volume="podman run --rm --privileged --net=host --ipc=host -v /run/lock/lvm:/run/lock/lvm:z -v /var/run/udev/:/var/run/udev/:z -v /dev:/dev -v /etc/ceph:/etc/ceph:z -v /var/lib/ceph/:/var/lib/ceph/:z -v /var/log/ceph/:/var/log/ceph/:z --entrypoint=ceph-volume $IMG --cluster ceph"验证 aliased 命令是否成功运行:
ceph-volume lvm list检查您的新 OSD 设备是否尚未是 LVM 的一部分。使用
pvdisplay命令检查设备,并确保VG Name字段为空。将<NEW_DEVICE> 替换为新 OSD 设备的/devö 路径:[root@overcloud-computehci-2 ~]# pvdisplay <NEW_DEVICE> --- Physical volume --- PV Name /dev/sdj VG Name ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2 PV Size 50.00 GiB / not usable 1.00 GiB Allocatable yes (but full) PE Size 1.00 GiB Total PE 49 Free PE 0 Allocated PE 49 PV UUID kOO0If-ge2F-UH44-6S1z-9tAv-7ypT-7by4cp [root@overcloud-computehci-2 ~]#如果
VG Name字段不为空,则该设备属于您必须删除的卷组。如果设备属于卷组,请使用
lvdisplay命令检查卷组中是否存在逻辑卷。将<VOLUME_GROUP> 替换为您从pvdisplay命令检索的VG Name字段的值:[root@overcloud-computehci-2 ~]# lvdisplay | grep <VOLUME_GROUP> LV Path /dev/ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2/osd-data-a0810722-7673-43c7-8511-2fd9db1dbbc6 VG Name ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2 [root@overcloud-computehci-2 ~]#如果
LV Path字段不为空,则该设备包含必须删除的逻辑卷。如果新设备是逻辑卷或卷组的一部分,请删除逻辑卷、卷组和逻辑卷作为 LVM 系统中的物理卷关联的设备。
-
将
<LV_PATH> 替换为LV Path字段的值。 -
将
<VOLUME_GROUP> 替换为VG Name字段的值。 将
<NEW_DEVICE> 替换为新 OSD 设备的/devö 路径。[root@overcloud-computehci-2 ~]# lvremove --force <LV_PATH> Logical volume "osd-data-a0810722-7673-43c7-8511-2fd9db1dbbc6" successfully removed[root@overcloud-computehci-2 ~]# vgremove --force <VOLUME_GROUP> Volume group "ceph-0fb0de13-fc8e-44c8-99ea-911e343191d2" successfully removed[root@overcloud-computehci-2 ~]# pvremove <NEW_DEVICE> Labels on physical volume "/dev/sdj" successfully wiped.
-
将
确保新 OSD 设备清理干净。在以下示例中,设备为
/dev/sdj:[root@overcloud-computehci-2 ~]# ceph-volume lvm zap /dev/sdj --> Zapping: /dev/sdj --> --destroy was not specified, but zapping a whole device will remove the partition table Running command: /usr/sbin/wipefs --all /dev/sdj Running command: /bin/dd if=/dev/zero of=/dev/sdj bs=1M count=10 stderr: 10+0 records in 10+0 records out 10485760 bytes (10 MB, 10 MiB) copied, 0.010618 s, 988 MB/s --> Zapping successful for: <Raw Device: /dev/sdj> [root@overcloud-computehci-2 ~]#使用新设备创建具有现有 OSD ID 的新 OSD,但传递
--no-systemd,以便ceph-volume不会尝试启动 OSD。无法从容器内实现:ceph-volume lvm create --osd-id 27 --data /dev/sdj --no-systemd重要如果您使用自定义参数部署 Ceph,如单独的
block.db,请确保在替换 OSD 时使用自定义参数。在容器外启动 OSD:
systemctl start ceph-osd@27