5.2. 배포된 모델의 유추 끝점에 액세스
배포된 모델에 대한 유추 요청을 만들려면 사용 가능한 유추 엔드포인트에 액세스하는 방법을 알아야 합니다.
지원되는 런타임 및 예제 명령과 함께 사용할 경로 목록은 유추 끝점을 참조하십시오.
사전 요구 사항
- Red Hat OpenShift AI에 로그인했습니다.
- 단일 모델 제공 플랫폼을 사용하여 모델을 배포했습니다.
- 배포된 모델에 대한 토큰 인증을 활성화한 경우 연결된 토큰 값이 있습니다.
프로세스
OpenShift AI 대시보드에서 AI 허브
배포를 클릭합니다. 모델의 유추 끝점은 유추 끝점 필드에 표시됩니다.
- 모델에서 수행하려는 동작에 따라(및 모델이 해당 작업을 지원하는 경우) 유추 끝점을 복사한 다음 URL 끝에 경로를 추가합니다.
- 배포된 모델에 API 요청을 만들려면 끝점을 사용합니다.