1장. OpenShift Container Platform의 AI 워크로드 개요
OpenShift Container Platform은 훈련, 추론 및 데이터 과학 워크플로우 전반에서 인공 지능(AI) 워크로드를 실행하기 위한 안전하고 확장 가능한 기반을 제공합니다.
1.1. AI 워크로드를 실행하기 위한 연산자 링크 복사링크가 클립보드에 복사되었습니다!
Operator를 사용하면 OpenShift Container Platform에서 인공 지능(AI) 및 머신 러닝(ML) 워크로드를 실행할 수 있습니다. Operators를 사용하면 OpenShift Container Platform을 애플리케이션의 핵심 플랫폼으로 계속 사용하면서 특정 AI/ML 요구 사항을 충족하는 맞춤형 환경을 구축할 수 있습니다.
OpenShift Container Platform은 AI 워크로드를 실행하는 데 도움이 되는 여러 연산자를 제공합니다.
- Kueue의 Red Hat 빌드
Kueue의 Red Hat 빌드를 사용하면 구조화된 대기열과 우선순위를 제공하여 작업 부하가 공정하고 효율적으로 처리되도록 할 수 있습니다. 적절한 우선순위가 없다면 중요한 작업은 지연되고, 덜 중요한 작업은 리소스를 차지하게 될 수 있습니다.
자세한 내용은 "Kueue의 Red Hat 빌드 소개"를 참조하세요.
- 리더 작업자 세트 운영자
Leader Worker Set Operator를 사용하면 리더와 워커 프로세스 간의 동기화를 통해 대규모 AI 추론 워크로드를 여러 노드에서 안정적으로 실행할 수 있습니다. 적절한 조정이 없다면 대규모 훈련이 실패하거나 중단될 수 있습니다.
자세한 내용은 "리더 워커 세트 연산자 개요"를 참조하세요.