7장. LAB-tuning에 대한 하드웨어 프로필 생성
LAB 튜닝 실행을 시작할 때 선택할 수 있는 OpenShift AI에서 GPU 하드웨어 프로필을 구성합니다.
OpenShift AI에서 LAB-tuning 워크로드를 실행하려면 GPU 하드웨어 프로필이 필요합니다. LAB-tuning은 GPU 리소스가 있는 노드에 예약해야 하는 분산 교육을 사용합니다. GPU 하드웨어 프로필을 사용하면 파이프라인을 시작할 때 특정 GPU 지원 작업자 노드를 대상으로 지정하여 워크로드가 호환되는 하드웨어에서 실행되도록 할 수 있습니다.
사전 요구 사항
- 관리자 권한이 있는 사용자로 OpenShift AI에 로그인되어 있습니다.
- 관련 하드웨어가 설치되고 사용자 환경에서 감지되었음을 확인했습니다.
프로세스
하드웨어 프로필 생성에 설명된 단계에 따라
LAB 튜닝하드웨어 프로필 을 생성하고 다음 구성을 특정 클러스터 설정에 맞게 조정합니다.Expand 설정 현재의 cpu: default
4개의 코어
CPU: 허용된 최소 수
2개의 코어
CPU: 최대 허용
4개의 코어
메모리: 최대 허용
250GiB 이상
리소스 레이블
nvidia.com/gpu리소스 식별자
nvidia.com/gpu리소스 유형
액셀러레이터노드 선택기 키(선택 사항)
node.kubernetes.io/instance-type노드 선택기 값
a2-ultragpu-2gtoleration operator (선택 사항)
Exists허용 오차 키
nvidia.com/gpu허용 오차 효과
NoSchedule- 새 하드웨어 프로필을 Enable 열의 확인 표시와 함께 사용할 수 있는지 확인합니다.