3.4. etcd의 예상 대기 시간 모니터링
etcdctl CLI를 사용하면 etcd에서 경험한 것처럼 예상치 못한 결과에 도달하기 위해 대기 시간을 모니터링할 수 있습니다. etcd pod 중 하나를 확인한 다음 엔드포인트 상태를 검색해야합니다.
클러스터 상태를 검증하고 모니터링하는 이 절차는 활성 클러스터에서만 실행할 수 있습니다.
사전 요구 사항
- 클러스터 배포를 계획하는 동안 디스크 및 네트워크 테스트를 완료했습니다.
프로세스
다음 명령을 실행합니다.
# oc get pods -n openshift-etcd -l app=etcd출력 예
NAME READY STATUS RESTARTS AGE etcd-m0 4/4 Running 4 8h etcd-m1 4/4 Running 4 8h etcd-m2 4/4 Running 4 8h다음 명령을 입력합니다. 합의에 대한 etcd 대기 시간을 더 잘 이해하기 위해 몇 분 동안 정확한 감시 주기에서 이 명령을 실행하여 숫자가 ~66ms 임계값 아래로 유지되는지 확인할 수 있습니다. 합의된 시간은 100ms에 가까울수록 클러스터가 서비스 영향을 미치는 이벤트 및 불안정성을 경험할 가능성이 높아집니다.
# oc exec -ti etcd-m0 -- etcdctl endpoint health -w table출력 예
+----------------------------+--------+-------------+-------+ | ENDPOINT | HEALTH | TOOK | ERROR | +----------------------------+--------+-------------+-------+ | https://198.18.111.12:2379 | true | 3.798349ms | | | https://198.18.111.14:2379 | true | 7.389608ms | | | https://198.18.111.13:2379 | true | 6.263117ms | | +----------------------------+--------+-------------+-------+다음 명령을 실행합니다.
# oc exec -ti etcd-m0 -- watch -dp -c etcdctl endpoint health -w table출력 예
+----------------------------+--------+-------------+-------+ | ENDPOINT | HEALTH | TOOK | ERROR | +----------------------------+--------+-------------+-------+ | https://198.18.111.12:2379 | true | 9.533405ms | | | https://198.18.111.13:2379 | true | 4.628054ms | | | https://198.18.111.14:2379 | true | 5.803378ms | | +----------------------------+--------+-------------+-------+