5.5. 대규모 Ceph 클러스터의 재시작 지연 증가
업그레이드 중에 각 Ceph 모니터 및 OSD가 순차적으로 중지됩니다. 중지된 동일한 서비스가 성공적으로 재시작될 때까지 마이그레이션이 계속되지 않습니다. Ansible은 15초(분기)을 대기하고 서비스가 시작될 때까지 5배(다시 시도)를 확인합니다. 서비스가 다시 시작되지 않으면 마이그레이션이 중지되어 운영자가 개입할 수 있습니다.
Ceph 클러스터 크기에 따라 재시도 또는 지연 값을 늘려야 할 수 있습니다. 이러한 매개변수와 해당 기본값은 다음과 같습니다.
health_mon_check_retries: 5
health_mon_check_delay: 15
health_osd_check_retries: 5
health_osd_check_delay: 15
이러한 매개변수의 기본값을 업데이트할 수 있습니다. 예를 들어, Ceph OSD를 점검할 때마다 클러스터가 30초 동안 기다렸다가 Ceph MON을 점검할 때마다 10초 동안 기다린 후 openstack overcloud deploy 명령을 사용하여 yaml 파일에 다음 매개변수를 전달합니다.
parameter_defaults:
CephAnsibleExtraConfig:
health_osd_check_delay: 40
health_osd_check_retries: 30
health_mon_check_retries: 10
health_mon_check_delay: 20