10장. 환경 재부팅
환경을 재부팅해야 하는 경우 발생할 수 있습니다. 예를 들어 물리적 서버를 수정해야 하거나 정전으로부터 복구해야 할 수 있습니다. 이 경우 Ceph Storage 노드가 올바르게 부팅되어야 합니다.
다음 순서로 노드를 부팅해야 합니다.
- 먼저 모든 Ceph Monitor 노드를 부팅합니다. 그러면 고가용성 클러스터에서 Ceph Monitor 서비스가 활성화됩니다. 기본적으로 Ceph Monitor 서비스는 컨트롤러 노드에 설치됩니다. Ceph Monitor가 사용자 지정 역할의 컨트롤러와 별개인 경우 이 사용자 지정 Ceph Monitor 역할이 활성 상태인지 확인합니다.
- 모든 Ceph Storage 노드 부팅 - 이렇게 하면 Ceph OSD 클러스터가 컨트롤러 노드의 활성 Ceph Monitor 클러스터에 연결할 수 있습니다.
10.1. Ceph Storage(OSD) 클러스터 재부팅 링크 복사링크가 클립보드에 복사되었습니다!
Ceph Storage(OSD) 노드 클러스터를 재부팅하려면 다음 단계를 완료합니다.
사전 요구 사항
ceph-mon서비스를 실행하는 Ceph Monitor 또는 컨트롤러 노드에서 Red Hat Ceph Storage 클러스터 상태가 정상이고 pg 상태가active+clean인지 확인합니다.sudo podman exec -it ceph-mon-controller-0 ceph -s
$ sudo podman exec -it ceph-mon-controller-0 ceph -sCopy to Clipboard Copied! Toggle word wrap Toggle overflow Ceph 클러스터가 정상이면
HEALTH_OK상태를 반환합니다.Ceph 클러스터 상태가 비정상인 경우
HEALTH_WARN또는HEALTH_ERR의 상태를 반환합니다. 문제 해결 지침은 Red Hat Ceph Storage 4 문제 해결 가이드를 참조하십시오.
절차
ceph-mon서비스를 실행하는 Ceph Monitor 또는 컨트롤러 노드에 로그인하고 Ceph Storage 클러스터 재조정을 일시적으로 비활성화합니다.sudo podman exec -it ceph-mon-controller-0 ceph osd set noout sudo podman exec -it ceph-mon-controller-0 ceph osd set norebalance
$ sudo podman exec -it ceph-mon-controller-0 ceph osd set noout $ sudo podman exec -it ceph-mon-controller-0 ceph osd set norebalanceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 참고다중 스택 또는 DCN(Distributed Compute node) 아키텍처가 있는 경우
noout및norebalance플래그를 설정할 때 클러스터 이름을 지정해야 합니다. 예:sudo podman exec -it ceph-mon-controller-0 ceph osd set noout --cluster_name>- 재부팅할 첫 번째 Ceph Storage 노드를 선택하고 노드에 로그인합니다.
노드를 재부팅합니다.
sudo reboot
$ sudo rebootCopy to Clipboard Copied! Toggle word wrap Toggle overflow - 노드가 부팅될 때까지 기다립니다.
노드에 로그인하고 클러스터 상태를 확인합니다.
sudo podman exec -it ceph-mon-controller-0 ceph status
$ sudo podman exec -it ceph-mon-controller-0 ceph statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow pgmap이 모든pgs를 정상(active+clean)으로 보고하는지 확인합니다.- 노드에서 로그아웃하고, 다음 노드를 재부팅한 후 상태를 확인합니다. 모든 Ceph Storage 노드가 재부팅될 때까지 이 프로세스를 반복합니다.
완료되면
ceph-mon서비스를 실행하는 Ceph Monitor 또는 컨트롤러 노드에 로그인하고 클러스터 재조정을 다시 활성화합니다.sudo podman exec -it ceph-mon-controller-0 ceph osd unset noout sudo podman exec -it ceph-mon-controller-0 ceph osd unset norebalance
$ sudo podman exec -it ceph-mon-controller-0 ceph osd unset noout $ sudo podman exec -it ceph-mon-controller-0 ceph osd unset norebalanceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 참고다중 스택 또는 DCN(Distributed Compute node) 아키텍처가 있는 경우
noout및norebalance플래그를 설정할 때 클러스터 이름을 지정해야 합니다. 예:sudo podman exec -it ceph-mon-controller-0 ceph osd set noout --cluster_name>최종 상태 검사를 수행하여 클러스터가
HEALTH_OK를 보고하는지 확인합니다.sudo podman exec -it ceph-mon-controller-0 ceph status
$ sudo podman exec -it ceph-mon-controller-0 ceph statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow
모든 Overcloud 노드가 동시에 부팅되는 경우 Ceph OSD 서비스가 Ceph Storage 노드에서 올바르게 시작되지 않을 수 있습니다. 이 경우 Ceph Storage OSD를 재부팅하여 Ceph Monitor 서비스에 연결할 수 있습니다.
다음 명령을 사용하여 Ceph Storage 노드 클러스터의 HEALTH_OK 상태를 확인합니다.
sudo ceph status
$ sudo ceph status