4.10. 배포된 모델에 대한 HTTP 요청 메트릭 보기
다중 모델 제공 플랫폼에 배포된 특정 모델에 대해 실패했거나 성공한 HTTP 요청을 보여주는 그래프를 볼 수 있습니다.
사전 요구 사항
- Red Hat OpenShift AI를 설치했습니다.
- OpenShift AI가 설치된 OpenShift 클러스터에서 사용자 워크로드 모니터링이 활성화됩니다.
다음 대시보드 구성 옵션은 다음과 같이 기본값으로 설정됩니다.
disablePerformanceMetrics:false disableKServeMetrics:false
disablePerformanceMetrics:false disableKServeMetrics:falseCopy to Clipboard Copied! Toggle word wrap Toggle overflow 대시보드 구성 옵션 설정에 대한 자세한 내용은 대시보드 사용자 지정을 참조하십시오.
- Red Hat OpenShift AI에 로그인했습니다.
- 다중 모델 서비스 플랫폼에 모델을 배포했습니다.
프로세스
-
OpenShift AI 대시보드에서 AI 허브
배포를 클릭합니다. - Deployments 페이지에서 관심 있는 모델을 선택합니다.
선택 사항: 끝점 성능 탭에서 다음 옵션을 설정합니다.
- 시간 범위 - 메트릭을 추적하는 기간을 지정합니다. 이 값 중 하나를 선택할 수 있습니다. 1 시간, 24 시간, 7 일 및 30 일.
- 새로 고침 간격 - 메트릭 페이지의 그래프가 새로 고쳐지는 빈도를 지정합니다(최신 데이터를 표시). 이 값 중 하나를 선택할 수 있습니다: 15 초, 30 초, 1 분, 5 분, 15 분, 30 분, 1 시간, 2 시간, 1 일.
검증
끝점 성능 탭에는 모델의 HTTP 메트릭 그래프가 표시됩니다.