1.5. 확인된 문제

MMLU 평가 실행

RHEL AI 버전 1.5에서는 MMLU를 실행할 때 --skip-server 플래그를 사용해야 합니다.

일부 NVIDIA A100 시스템에서 잘못된 자동 감지

RHEL AI는 A100 액셀러레이터를 사용하여 시스템에서 잘못된 시스템 프로파일을 자동 감지하는 경우가 있습니다.

올바른 시스템 프로파일을 다시 초기화하고 전달하여 올바른 프로필을 선택할 수 있습니다.

$ ilab config init --profile <path-to-system-profile>

Fabric Manager가 NVIDIA 가속기에서 항상 시작되지는 않습니다.

NVIDIA 시스템에 Red Hat Enterprise Linux AI를 설치한 후 모델을 제공하거나 교육할 때 다음과 같은 오류가 표시될 수 있습니다.

INFO 2024-11-26 22:18:04,244 instructlab.model.serve_backend:56: Using model '/var/home/cloud-user/.local/share/instructlab/phased/phase2/checkpoints/hf_format/samples_29117' with -1 gpu-lay
ers and 4096 max context size.
INFO 2024-11-26 22:18:04,244 instructlab.model.serve_backend:88: '--gpus' flag used alongside '--tensor-parallel-size' in the vllm_args section of the config file. Using value of the --gpus

File "/opt/app-root/lib64/python3.11/site-packages/vllm/entrypoints/openai/api_server.py", line 105, in build_async_engine_client
    async with build_async_engine_client_from_engine_args(
  File "/usr/lib64/python3.11/contextlib.py", line 210, in __aenter__
    return await anext(self.gen)
           ^^^^^^^^^^^^^^^^^^^^^
  File "/opt/app-root/lib64/python3.11/site-packages/vllm/entrypoints/openai/api_server.py", line 192, in build_async_engine_client_from_engine_args
    raise RuntimeError(
RuntimeError: Engine process failed to start

이 문제를 해결하려면 다음 명령을 실행해야 합니다.

$ sudo systemctl stop nvidia-persistenced.service
$ sudo systemctl start nvidia-fabricmanager.service
$ sudo systemctl start nvidia-persistenced.service

UI AMD 기술 프리뷰 설치

Red Hat Enterprise Linux AI 버전 1.5는 현재 프리뷰된 AMD ISO 기술을 사용한 그래픽 기반 설치를 지원하지 않습니다. Kickstart 파일의 텍스트 매개변수가 비대화형 설치용으로 구성되어 있는지 확인합니다. 대화형 설치 중에 쉘에 inst.text 를 전달하여 설치 시간 충돌을 방지할 수도 있습니다.

SDG는 4xL40에서 실패할 수 있습니다

SDG가 4xL40s에서 실행하려면 --num-cpus 플래그를 사용하여 SDG를 실행하고 4 값으로 설정해야합니다.

$ ilab data generate --num-cpus 4

granite-8b-starter-v1 모델의 MMLU 및 MMLU_BRANCH

granite-8b-starter-v1 Cryostat에서 빌드된 모델을 평가할 때 MMLU 및 MMLU_BRANCH 벤치마크를 실행할 때 vLLM이 시작되지 않을 수 있습니다.

vLLM이 시작되지 않으면 config.yaml 파일의 serve 섹션에 다음 매개변수를 추가합니다.

serve:
  vllm:
    vllm_args: [--dtype bfloat16]

nfs를 통한 kdump

Red Hat Enterprise Linux AI 버전 1.5는 구성없이 nfs를 통해 kdump를 지원하지 않습니다. 이 기능을 사용하려면 다음 명령을 실행합니다.

mkdir -p /var/lib/kdump/dracut.conf.d
echo "dracutmodules=''" > /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "omit_dracutmodules=''" >> /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "dracut_args --confdir /var/lib/kdump/dracut.conf.d --install /usr/lib/passwd --install /usr/lib/group" >> /etc/kdump.conf
systemctl restart kdump

1.5. 확인된 문제

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 소개

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 문서 정보

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links