2.7. 지원되는 model-serving 런타임


OpenShift AI에는 사전 설치된 여러 모델 제공 런타임이 포함되어 있습니다. 사전 설치된 model-serving 런타임을 사용하여 런타임을 직접 수정하거나 정의하지 않고도 모델 서비스를 시작할 수 있습니다. 사용자 지정 런타임을 추가하여 모델을 지원할 수도 있습니다.

사용자 지정 런타임을 추가하는 방법에 대한 자세한 내용은 단일 모델 제공 플랫폼에 대한 사용자 지정 모델 제공 런타임 추가를 참조하십시오.

Expand
표 2.1. model-serving 런타임
이름설명내보낸 모델 형식

KServe (1)에 대한 Cainitiatort text Generation Inference Server (Caikit-TGIS) ServingRuntime

Cakeygent 형식으로 모델을 제공하기 위한 복합 런타임

Ca#159t text Generation

KServe 용 카피네트 Standalone ServingRuntime (2)

작업 포함을 위한 Cakeygent embeddings 형식으로 모델을 제공하는 런타임

Ca#159t Embeddings

OpenVino Model Server

Intel 아키텍처에 최적화된 모델을 제공하기 위한 확장 가능한 고성능 런타임

PyTorch, TensorFlow, OpenVINO IR, PaddlePaddle, MXNet, Caffe, Kaldi

[더 이상 사용되지 않음] TGIS(TGIS) Standalone ServingRuntime for KServe (3)

TGI 지원 모델을 제공하는 런타임

PyTorch 모델 형식

vLLM NVIDIA GPU ServingRuntime for KServe

NVIDIA GPU 액셀러레이터를 지원하는 대규모 언어 모델에 대한 처리량 및 메모리 효율적인 제공 런타임

지원되는 모델

KServe 용 vLLM Intel Gaudi Accelerator ServingRuntime

Intel Gaudi 액셀러레이터를 지원하는 높은 처리량 및 메모리 효율적인 추론 및 제공 런타임

지원되는 모델

KServe용 vLLM AMD GPU ServingRuntime

AMD GPU 액셀러레이터를 지원하는 높은 처리량 및 메모리 효율적인 추론 및 제공 런타임

지원되는 모델

KServe의 vLLM CPU ServingRuntime

IBM Power(ppc64le) 및 IBM Z(s390x)를 지원하는 처리량 및 메모리 효율적인 추론 및 제공 런타임입니다.

지원되는 모델

  1. Comuppletion-TGIS 런타임은 T GIS (Chill Generation Inference Server) 를 기반으로 합니다. 이 런타임을 사용하려면 모델을 Caroutet 형식으로 변환해야 합니다. 예를 들어 caovnt-tgis-serving 리포지토리의 cakeyt 형식으로의 Hugging faces Hub 모델 변환을 참조하십시오.
  2. Ca#159t Standalone 런타임은 Caovnt NLP를 기반으로 합니다. 이 런타임을 사용하려면 모델을 Cakeygent 포함 형식으로 변환해야 합니다. 예를 들어 텍스트 포함 모듈에 대한 테스트를 참조하십시오.
  3. KServe의 text Generation Inference Server (TGIS) Standalone ServingRuntime 은 더 이상 사용되지 않습니다. 자세한 내용은 Red Hat OpenShift AI 릴리스 노트를 참조하십시오.
Expand
표 2.2. 배포 요구 사항
이름기본 프로토콜Additonal 프로토콜모델 메시 지원단일 노드 OpenShift 지원배포 모드

KServe의 Cainitiatort text Generation Inference Server (Caikit-TGIS) ServingRuntime

REST

gRPC

없음

제공됨

원시 및 서버리스

KServe 용 카피네트 Standalone ServingRuntime

REST

gRPC

없음

제공됨

원시 및 서버리스

OpenVino Model Server

REST

없음

제공됨

제공됨

원시 및 서버리스

[더 이상 사용되지 않음] KServe의 텍스트 생성 유추 서버(TGIS) Standalone ServingRuntime

gRPC

없음

없음

제공됨

원시 및 서버리스

vLLM NVIDIA GPU ServingRuntime for KServe

REST

없음

없음

제공됨

원시 및 서버리스

KServe 용 vLLM Intel Gaudi Accelerator ServingRuntime

REST

없음

없음

제공됨

원시 및 서버리스

KServe용 vLLM AMD GPU ServingRuntime

REST

없음

없음

제공됨

원시 및 서버리스

KServe의 vLLM CPU ServingRuntime[1]

REST

없음

없음

제공됨

Raw

[1] IBM Z 및 IBM Power 아키텍처를 사용하는 경우 표준 배포 모드에서 모델만 배포할 수 있습니다.



[1] KServe의 vLLM CPU ServingRuntime
맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat