5.6. 대규모 Ceph 클러스터의 재시작 지연 증가
배포하는 동안 OSD 및 모니터와 같은 Ceph 서비스가 다시 시작되고 서비스가 다시 실행될 때까지 배포가 계속되지 않습니다. Ansible은 15초 동안 대기하고 서비스가 시작될 때까지 5번(재시도) 확인합니다. 서비스를 다시 시작하지 않으면 운영자가 개입할 수 있도록 배포가 중지됩니다.
Ceph 클러스터의 크기에 따라 재시도 또는 지연 값을 늘려야 할 수 있습니다. 이러한 매개변수 및 기본값의 정확한 이름은 다음과 같습니다.
health_mon_check_retries: 5
health_mon_check_delay: 15
health_osd_check_retries: 5
health_osd_check_delay: 15
절차
CephAnsibleExtraConfig매개변수를 업데이트하여 기본 지연 및 재시도 값을 변경합니다.parameter_defaults: CephAnsibleExtraConfig: health_osd_check_delay: 40 health_osd_check_retries: 30 health_mon_check_delay: 20 health_mon_check_retries: 10이 예제에서는 클러스터가 30번 검사하고 Ceph OSD를 검사할 때마다 40초 동안 기다린 다음, 각 Ceph MON이 확인될 때까지 10초 동안 20번 기다렸다가 10초 동안 기다립니다.
-
변경 사항을 통합하려면
openstack overcloud deploy를 사용하여-e로 업데이트된yaml파일을 전달합니다.