1.5. 확인된 문제
MMLU 평가 실행
RHEL AI 버전 1.5에서는 MMLU를 실행할 때 --skip-server 플래그를 사용해야 합니다.
일부 NVIDIA A100 시스템에서 잘못된 자동 감지
RHEL AI는 A100 액셀러레이터를 사용하여 시스템에서 잘못된 시스템 프로파일을 자동 감지하는 경우가 있습니다.
올바른 시스템 프로파일을 다시 초기화하고 전달하여 올바른 프로필을 선택할 수 있습니다.
ilab config init --profile <path-to-system-profile>
$ ilab config init --profile <path-to-system-profile>
Fabric Manager가 NVIDIA 가속기에서 항상 시작되지는 않습니다.
NVIDIA 시스템에 Red Hat Enterprise Linux AI를 설치한 후 모델을 제공하거나 교육할 때 다음과 같은 오류가 표시될 수 있습니다.
이 문제를 해결하려면 다음 명령을 실행해야 합니다.
sudo systemctl stop nvidia-persistenced.service sudo systemctl start nvidia-fabricmanager.service sudo systemctl start nvidia-persistenced.service
$ sudo systemctl stop nvidia-persistenced.service
$ sudo systemctl start nvidia-fabricmanager.service
$ sudo systemctl start nvidia-persistenced.service
UI AMD 기술 프리뷰 설치
Red Hat Enterprise Linux AI 버전 1.5는 현재 프리뷰된 AMD ISO 기술을 사용한 그래픽 기반 설치를 지원하지 않습니다. Kickstart 파일의 텍스트 매개변수가 비대화형 설치용으로 구성되어 있는지 확인합니다. 대화형 설치 중에 쉘에 inst.text 를 전달하여 설치 시간 충돌을 방지할 수도 있습니다.
SDG는 4xL40에서 실패할 수 있습니다
SDG가 4xL40s에서 실행하려면 --num-cpus 플래그를 사용하여 SDG를 실행하고 4 값으로 설정해야합니다.
ilab data generate --num-cpus 4
$ ilab data generate --num-cpus 4
granite-8b-starter-v1 모델의 MMLU 및 MMLU_BRANCH
granite-8b-starter-v1 Cryostat에서 빌드된 모델을 평가할 때 MMLU 및 MMLU_BRANCH 벤치마크를 실행할 때 vLLM이 시작되지 않을 수 있습니다.
vLLM이 시작되지 않으면 config.yaml 파일의 serve 섹션에 다음 매개변수를 추가합니다.
serve:
vllm:
vllm_args: [--dtype bfloat16]
serve:
vllm:
vllm_args: [--dtype bfloat16]
nfs를 통한 kdump
Red Hat Enterprise Linux AI 버전 1.5는 구성없이 nfs를 통해 kdump를 지원하지 않습니다. 이 기능을 사용하려면 다음 명령을 실행합니다.
mkdir -p /var/lib/kdump/dracut.conf.d echo "dracutmodules=''" > /var/lib/kdump/dracut.conf.d/99-kdump.conf echo "omit_dracutmodules=''" >> /var/lib/kdump/dracut.conf.d/99-kdump.conf echo "dracut_args --confdir /var/lib/kdump/dracut.conf.d --install /usr/lib/passwd --install /usr/lib/group" >> /etc/kdump.conf systemctl restart kdump
mkdir -p /var/lib/kdump/dracut.conf.d
echo "dracutmodules=''" > /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "omit_dracutmodules=''" >> /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "dracut_args --confdir /var/lib/kdump/dracut.conf.d --install /usr/lib/passwd --install /usr/lib/group" >> /etc/kdump.conf
systemctl restart kdump