5장. 서버리스 애플리케이션과 함께 NVIDIA GPU 리소스 사용
NVIDIA는 OpenShift Container Platform에서 GPU 리소스 사용을 지원합니다. OpenShift Container Platform에서 GPU 리소스를 설정하는 방법에 대한 자세한 내용은 OpenShift의 GPU Operator 를 참조하십시오.
5.1. 서비스에 대한 GPU 요구 사항 지정
OpenShift Container Platform 클러스터에 GPU 리소스가 활성화된 후 Knative(kn
) CLI를 사용하여 Knative 서비스에 대한 GPU 요구 사항을 지정할 수 있습니다.
사전 요구 사항
- OpenShift Serverless Operator, Knative Serving 및 Knative Eventing이 클러스터에 설치되어 있습니다.
-
Knative(
kn
) CLI가 설치되어 있습니다. - OpenShift Container Platform 클러스터에 GPU 리소스가 활성화되어 있습니다.
- 프로젝트를 생성했거나 OpenShift Container Platform에서 애플리케이션 및 기타 워크로드를 생성하는 데 적절한 역할 및 권한이 있는 프로젝트에 액세스할 수 있습니다.
OpenShift Container Platform 또는 OpenShift Dedicated의 IBM zSystems 및 IBM Power에서는 NVIDIA GPU 리소스를 사용할 수 없습니다.
프로세스
Knative 서비스를 생성하고
--limit nvidia.com/gpu=1
플래그를 사용하여 GPU 리소스 요구 사항 제한을1
로 설정합니다.$ kn service create hello --image <service-image> --limit nvidia.com/gpu=1
GPU 리소스 요구 사항 제한이
1
이면 서비스의 전용 GPU 리소스가 1개임을 나타냅니다. 서비스에서는 GPU 리소스를 공유하지 않습니다. GPU 리소스가 필요한 기타 서비스는 GPU 리소스를 더 이상 사용하지 않을 때까지 기다려야 합니다.또한 GPU가 1개로 제한되면 GPU 리소스를 2개 이상 사용하는 애플리케이션이 제한됩니다. 서비스에서 GPU 리소스를 1개 이상 요청하는 경우 GPU 리소스 요구 사항을 충족할 수 있는 노드에 배포됩니다.
선택 사항: 기존 서비스의 경우
--limit nvidia.com/gpu=3
플래그를 사용하여 GPU 리소스 요구 사항 제한을3
으로 변경할 수 있습니다.$ kn service update hello --limit nvidia.com/gpu=3