1장. model-serving 런타임 관리


클러스터 관리자는 사용자 지정 모델 제공 런타임을 생성하고 OpenShift AI에 배포된 모델의 유추 서비스를 편집할 수 있습니다.

모델 서비스 런타임은 지정된 모델 프레임워크 세트 및 해당 프레임워크에서 지원하는 모델 형식에 대한 지원을 추가합니다. OpenShift AI에 포함된 사전 설치된 런타임 을 사용할 수 있습니다. 기본 런타임이 요구 사항을 충족하지 않는 경우 자체 사용자 지정 런타임을 추가할 수도 있습니다.

관리자는 OpenShift AI 인터페이스를 사용하여 사용자 지정 모델 제공 런타임을 추가하고 활성화할 수 있습니다. 그런 다음 단일 모델 제공 플랫폼에 모델을 배포할 때 사용자 지정 런타임을 선택할 수 있습니다.

참고

Red Hat은 사용자 지정 런타임을 지원하지 않습니다. 사용자가 추가한 모든 사용자 지정 런타임을 사용하고 올바르게 구성 및 유지 관리를 수행할 수 있는지 확인해야 합니다.

사전 요구 사항

  • OpenShift AI 관리자 권한이 있는 사용자로 OpenShift AI에 로그인했습니다.
  • 사용자 지정 런타임을 빌드하고 Quay 와 같은 컨테이너 이미지 리포지토리에 이미지를 추가했습니다.

프로세스

  1. OpenShift AI 대시보드에서 설정 Serving 런타임 을 클릭합니다.

    Serving 런타임 페이지가 열리고 이미 설치 및 활성화된 모델 제공 런타임이 표시됩니다.

  2. 사용자 지정 런타임을 추가하려면 다음 옵션 중 하나를 선택합니다.

    • 기존 런타임(예: KServe의 경우 vLLM NVIDIA GPU ServingRuntime)으로 시작하려면 기존 런타임 옆에 있는 작업 메뉴(예: vLLM NVIDIA GPU ServingRuntime)를 클릭한 다음 중복 을 클릭합니다.
    • 새 사용자 지정 런타임을 추가하려면 제공 런타임 추가 를 클릭합니다.
  3. Select the model serving platforms this runtime supports list, select Single-model serving platform.
  4. Select the API protocol this runtime supports list에서 지원하는 REST 또는 gRPC 를 선택합니다.
  5. 선택 사항: 새 런타임을 시작한 경우(기존 런타임을 복제하지 않고) 다음 옵션 중 하나를 선택하여 코드를 추가합니다.

    • YAML 파일 업로드

      1. 파일 업로드 를 클릭합니다.
      2. 파일 브라우저에서 컴퓨터에서 YAML 파일을 선택합니다.

        포함된 YAML 편집기가 열리고 업로드한 파일의 내용이 표시됩니다.

    • 편집기에서 직접 YAML 코드를 입력합니다.

      1. 처음부터 시작을 클릭합니다.
      2. 포함된 편집기에서 YAML 코드를 직접 입력하거나 붙여넣습니다.
    참고

    대부분의 경우 사용자 지정 런타임을 생성하려면 ServingRuntime 사양의 env 섹션에 새 또는 사용자 지정 매개변수를 추가해야 합니다.

  6. 추가를 클릭합니다.

    Serving 런타임 페이지가 열리고 설치된 업데이트된 런타임 목록이 표시됩니다. 추가한 사용자 지정 런타임이 자동으로 활성화되어 있는지 확인합니다. 런타임을 생성할 때 지정한 API 프로토콜이 표시됩니다.

  7. 선택 사항: 사용자 지정 런타임을 편집하려면 작업 메뉴( Cryostat)를 클릭하고 편집을 선택합니다.

검증

  • 추가한 사용자 정의 모델 제공 런타임은 Serving 런타임 페이지에 활성화된 상태로 표시됩니다.
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat
맨 위로 이동