3.6. RADOS
ping 시간을 사용하여 네트워크 성능을 추적하도록 업데이트
이전에는 네트워크 문제가 발생하면 다른 성능 문제와 구별하기 어려웠습니다. 이번 릴리스에서는 평균 Red Hat Ceph Storage OSD 하트비트가 계산된 간격에 대해 구성 가능한 임계값을 초과하면 heath 경고가 생성됩니다. Red Hat Ceph Storage OSD는 평균, 최소 및 최대 값을 사용하여 1분,5분 및 15분 간격을 계산합니다.
대시보드에 BlueStore 압축 통계 추가
이번 릴리스에서는 BlueStore OSD의 압축 관련 성능 지표가 대시보드에 표시됩니다.
대시보드에 대한 자세한 내용은 대시보드 가이드를 참조하십시오.
Ceph OSD에 I/O 오류가 발생하면 스토리지 클러스터 상태가 변경됩니다.
이번 릴리스에서는 Ceph Monitor에 기본적으로 10
으로 설정된 mon_osd_warn_num_repaired
옵션이 있습니다. Ceph OSD가 저장된 데이터에 이러한 많은 I/O 오류를 복구한 경우 OSD_TOO_MANY_REPAIRS
상태 경고가 생성됩니다. 이 경고를 지우기 위해 새로운 clear_shards_repaired
옵션이 ceph tell
명령에 추가되었습니다. 예를 들면 다음과 같습니다.
ceph tell osd.NUMBER clear_shards_repaired [COUNT]
기본적으로 clear_shards_repaired
옵션은 복구 수를 0
으로 설정합니다. 추가 Ceph OSD 복구가 수행되는 경우 다시 경고하려면 mon_osd_warn_num_repaired
옵션의 값을 지정할 수 있습니다.
하트비트 유예 기간으로 업데이트
이전에는 48시간 이상 Ceph OSD 오류가 없는 경우 유예 타이머를 기본값으로 다시 재설정할 수 있는 메커니즘이 없었습니다. 이번 릴리스에서는 Ceph OSD에서 48시간 동안 오류가 없는 경우 하트비트 유예 타이머가 기본값인 20초로 재설정됩니다. 마지막 실패와 최신 실패 사이의 실패 간격이 48 시간을 초과하면 유예 타이머가 기본값인 20초로 재설정됩니다.
유예 시간은 Ceph 스토리지 클러스터가 하트비트가 없으면 Ceph OSD를 다운로 간주하는 간격입니다. 유예 시간은 지연 추정 또는 Ceph ODS가 실패하는 빈도에 따라 조정됩니다.
osd_client_message_cap
옵션이 다시 추가되었습니다.
이전에는 osd_client_message_cap
옵션이 제거되었지만 이번 릴리스에서는 osd_client_message_cap
옵션이 다시 도입되었습니다. 이 옵션을 사용하면 해당 요청을 제한하여 최대 진행 중인 클라이언트 요청 수를 제어할 수 있습니다. 이 작업은 클라이언트 기반 트래픽의 압도적인 양으로 인해 Ceph OSD가 날카롭게 될 때 유용할 수 있습니다.