4.3. 다중 모델 서비스 플랫폼을 사용하여 모델 배포
OpenShift AI에 숙련된 모델을 배포하여 지능형 애플리케이션에 테스트하고 구현할 수 있습니다. 모델을 배포하면 API를 사용하여 액세스할 수 있는 서비스로 사용할 수 있습니다. 이를 통해 데이터 입력을 기반으로 예측을 반환할 수 있습니다.
다중 모델 서비스 플랫폼을 활성화하면 플랫폼에 모델을 배포할 수 있습니다.
사전 요구 사항
- Red Hat OpenShift AI에 로그인했습니다.
- 다중 모델 서비스 플랫폼을 활성화했습니다.
- 프로젝트를 생성하고 모델 서버를 추가했습니다.
- S3 호환 오브젝트 스토리지에 액세스할 수 있습니다.
- 배포하려는 모델의 경우 S3 호환 오브젝트 스토리지 버킷의 관련 폴더 경로를 알고 있습니다.
프로세스
OpenShift AI 대시보드의 왼쪽 메뉴에서 프로젝트를 클릭합니다.
프로젝트 페이지가 열립니다.
모델을 배포할 프로젝트의 이름을 클릭합니다.
프로젝트 세부 정보 페이지가 열립니다.
- Deployments 탭을 클릭합니다.
- 모델 배포를 클릭합니다.
다음과 같이 모델 배포를 위한 속성을 구성합니다.
- 모델 이름 필드에 배포하려는 모델의 고유 이름을 입력합니다.
모델 프레임워크 목록에서 모델의 프레임워크를 선택합니다.
참고모델 프레임워크 목록은 모델 서버를 구성할 때 지정한 model-serving 런타임에서 지원하는 프레임워크만 표시합니다.
S3 호환 오브젝트 스토리지에서 배포할 모델의 위치를 지정하려면 다음 작업 세트 중 하나를 수행합니다.
기존 연결을 사용하려면 다음을 수행합니다.
- 기존 연결을 선택합니다.
- 이름 목록에서 이전에 정의한 연결을 선택합니다.
경로 필드에서 지정된 데이터 소스에 모델이 포함된 폴더 경로를 입력합니다.
참고기존 S3 또는 URI 데이터 연결을 사용하여 등록된 모델 버전을 배포하는 경우 일부 연결 세부 정보가 자동으로 입력될 수 있습니다. 이는 데이터 연결 유형 및 프로젝트에서 사용할 수 있는 일치하는 연결 수에 따라 달라집니다. 예를 들어 일치하는 연결이 하나만 있는 경우 경로, URI, 끝점, 버킷 및 리전과 같은 필드가 자동으로 채워질 수 있습니다. 일치하는 연결의 레이블이 Recommended 로 지정됩니다.
새 연결 사용
- 모델에 액세스할 수 있는 새 연결을 정의하려면 새 연결을 선택합니다.
연결 추가 모달에서 연결 유형을 선택합니다. S3 호환 오브젝트 스토리지 및 URI 옵션은 사전 설치된 연결 유형입니다. OpenShift AI 관리자가 이를 추가한 경우 추가 옵션을 사용할 수 있습니다.
연결 추가 양식은 선택한 연결 유형과 관련된 필드를 사용하여 열립니다.
- 연결 세부 정보 필드를 입력합니다.
(선택 사항) 구성 매개변수 섹션에서 런타임 매개변수를 사용자 지정합니다.
- 배포된 모델의 작동 방식을 정의하도록 추가 제공 런타임 인수 의 값을 수정합니다.
- 추가 환경 변수 의 값을 수정하여 모델의 환경에서 변수를 정의합니다.
- Deploy 를 클릭합니다.
검증
- 배포된 모델이 프로젝트의 Deployments (배포) 탭과 Status (상태) 열에 확인 표시를 사용하여 대시보드의 Deployments (배포) 페이지에 표시되는지 확인합니다.