1.5. 확인된 문제


MMLU 평가 실행

RHEL AI 버전 1.5에서는 MMLU를 실행할 때 --skip-server 플래그를 사용해야 합니다.

일부 NVIDIA A100 시스템에서 잘못된 자동 감지

RHEL AI는 A100 액셀러레이터를 사용하여 시스템에서 잘못된 시스템 프로파일을 자동 감지하는 경우가 있습니다.

올바른 시스템 프로파일을 다시 초기화하고 전달하여 올바른 프로필을 선택할 수 있습니다.

$ ilab config init --profile <path-to-system-profile>
Copy to Clipboard Toggle word wrap

Fabric Manager가 NVIDIA 가속기에서 항상 시작되지는 않습니다.

NVIDIA 시스템에 Red Hat Enterprise Linux AI를 설치한 후 모델을 제공하거나 교육할 때 다음과 같은 오류가 표시될 수 있습니다.

INFO 2024-11-26 22:18:04,244 instructlab.model.serve_backend:56: Using model '/var/home/cloud-user/.local/share/instructlab/phased/phase2/checkpoints/hf_format/samples_29117' with -1 gpu-lay
ers and 4096 max context size.
INFO 2024-11-26 22:18:04,244 instructlab.model.serve_backend:88: '--gpus' flag used alongside '--tensor-parallel-size' in the vllm_args section of the config file. Using value of the --gpus

File "/opt/app-root/lib64/python3.11/site-packages/vllm/entrypoints/openai/api_server.py", line 105, in build_async_engine_client
    async with build_async_engine_client_from_engine_args(
  File "/usr/lib64/python3.11/contextlib.py", line 210, in __aenter__
    return await anext(self.gen)
           ^^^^^^^^^^^^^^^^^^^^^
  File "/opt/app-root/lib64/python3.11/site-packages/vllm/entrypoints/openai/api_server.py", line 192, in build_async_engine_client_from_engine_args
    raise RuntimeError(
RuntimeError: Engine process failed to start
Copy to Clipboard Toggle word wrap

이 문제를 해결하려면 다음 명령을 실행해야 합니다.

$ sudo systemctl stop nvidia-persistenced.service
$ sudo systemctl start nvidia-fabricmanager.service
$ sudo systemctl start nvidia-persistenced.service
Copy to Clipboard Toggle word wrap

UI AMD 기술 프리뷰 설치

Red Hat Enterprise Linux AI 버전 1.5는 현재 프리뷰된 AMD ISO 기술을 사용한 그래픽 기반 설치를 지원하지 않습니다. Kickstart 파일의 텍스트 매개변수가 비대화형 설치용으로 구성되어 있는지 확인합니다. 대화형 설치 중에 쉘에 inst.text 를 전달하여 설치 시간 충돌을 방지할 수도 있습니다.

SDG는 4xL40에서 실패할 수 있습니다

SDG가 4xL40s에서 실행하려면 --num-cpus 플래그를 사용하여 SDG를 실행하고 4 값으로 설정해야합니다.

$ ilab data generate --num-cpus 4
Copy to Clipboard Toggle word wrap

granite-8b-starter-v1 모델의 MMLU 및 MMLU_BRANCH

granite-8b-starter-v1 Cryostat에서 빌드된 모델을 평가할 때 MMLU 및 MMLU_BRANCH 벤치마크를 실행할 때 vLLM이 시작되지 않을 수 있습니다.

vLLM이 시작되지 않으면 config.yaml 파일의 serve 섹션에 다음 매개변수를 추가합니다.

serve:
  vllm:
    vllm_args: [--dtype bfloat16]
Copy to Clipboard Toggle word wrap

nfs를 통한 kdump

Red Hat Enterprise Linux AI 버전 1.5는 구성없이 nfs를 통해 kdump를 지원하지 않습니다. 이 기능을 사용하려면 다음 명령을 실행합니다.

mkdir -p /var/lib/kdump/dracut.conf.d
echo "dracutmodules=''" > /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "omit_dracutmodules=''" >> /var/lib/kdump/dracut.conf.d/99-kdump.conf
echo "dracut_args --confdir /var/lib/kdump/dracut.conf.d --install /usr/lib/passwd --install /usr/lib/group" >> /etc/kdump.conf
systemctl restart kdump
Copy to Clipboard Toggle word wrap
맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat