1장. OpenShift Container Platform의 AI 워크로드 개요
OpenShift Container Platform은 교육, 추론 및 데이터 사이언스 워크플로우 전반에 AI(인공 지능) 워크로드를 실행하기 위한 안전하고 확장 가능한 기반을 제공합니다.
1.1. AI 워크로드 실행을 위한 Operator 링크 복사링크가 클립보드에 복사되었습니다!
Operator를 사용하여 OpenShift Container Platform에서 AI(인공 지능) 및 머신러닝(ML) 워크로드를 실행할 수 있습니다. Operator를 사용하면 특정 AI/ML 요구 사항을 충족하는 사용자 지정 환경을 빌드하는 동시에 OpenShift Container Platform을 애플리케이션의 핵심 플랫폼으로 계속 사용할 수 있습니다.
OpenShift Container Platform은 AI 워크로드를 실행하는 데 도움이 되는 여러 Operator를 제공합니다.
- Red Hat build of Kueue
Red Hat build of Kueue를 사용하여 워크로드가 공정하고 효율적으로 처리되도록 구조화된 대기열 및 우선 순위를 제공할 수 있습니다. 적절한 우선 순위를 지정하지 않으면 중요한 작업이 지연될 수 있지만 덜 중요한 작업이 리소스를 차지할 수 있습니다.
자세한 내용은 "Red Hat 빌드에 대한 소개"를 참조하십시오.
- leader Worker Set Operator
Leader Worker Set Operator를 사용하여 대규모 AI 유추 워크로드를 통해 리더와 작업자 프로세스 간의 동기화를 통해 노드 간에 안정적으로 실행할 수 있습니다. 적절한 조정이 없으면 대규모 교육 실행이 실패하거나 중단될 수 있습니다.
자세한 내용은 "Leader Worker Set Operator 개요"를 참조하십시오.