1.6. 非同期 Z-stream 更新
RHEL AI 1.4 のセキュリティー、バグ修正、および機能強化の更新は、非同期の z-stream 更新としてリリースされます。
このセクションは、RHEL AI 1.4 の将来の非同期 z-stream リリースの機能強化とバグ修正に関するメモを提供するために、今後も更新され続けます。たとえば、フォーム RHEL AI 1.4.z を使用したバージョン管理された非同期リリースについては、サブセクションで説明します。
1.6.1. Red Hat Enterprise Linux AI 1.4.1 のバグ修正 リンクのコピーリンクがクリップボードにコピーされました!
発行日: 2025 年 2 月 25 日
Red Hat Enterprise Linux AI リリース 1.4.1 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。
1.6.1.1. 既知の問題 リンクのコピーリンクがクリップボードにコピーされました!
トレーニング中にチェックポイントを保存するときの NCCL Watchdog タイムアウトエラー
AWS NVIDIA インスタンスでモデルを登録すると、チェックポイントがディスクに保存されないようにするタイムアウトエラーが発生する可能性があります。
この問題を解決してチェックポイントを正常に保存するには、モデルを低精度な形式で保存するか、高速なディスク書き込み速度で AWS インスタンスを使用する必要がある場合があります。
1.6.1.2. Upgrade リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。
$ sudo bootc upgrade --apply
RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。
1.6.2. Red Hat Enterprise Linux AI 1.4.2 の機能とバグ修正 リンクのコピーリンクがクリップボードにコピーされました!
発行日: 2025 年 3 月 4 日
Red Hat Enterprise Linux AI リリース 1.4.2 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。
1.6.2.1. 機能 リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI バージョン 1.4.2 およびそれ以降の 1.4.z リリースでは、Intel Gaudi3 アクセラレーターがサポートされるようになりました。Download Red Hat Enterprise Linux AI ページで Red Hat Enterprise Linux AI イメージをダウンロードし、Gaudi3 アクセラレーターを搭載したマシンに RHEL AI をデプロイします。
1.6.2.2. 既知の問題 リンクのコピーリンクがクリップボードにコピーされました!
Intel Gaudi3 でマルチアクセラレーターの推論が失敗する
1.4.2 Intel Gaudi3 では、InstructLab ラッパーにパラメーターがありません。これにより、Gaudi3 アクセラレーターを搭載したマシンで推論が失敗します。この問題を解決するには、次の手順を実行してください。
/usr/bin/ilabファイルをホームダイレクトにコピーし、ilabファイルを編集します。$ cp /usr/bin/ilab <path-to-home-directory> $ vim ~/ilabファイルは次のようになり、
`--env" "PT_HPU_ENABLE_LAZY_COLLECTIVES=trueパラメーターが含まれるようになります。PODMAN_COMMAND=("podman" "run" "--rm" "-it" "--device" "/dev/infiniband" "--device" "/dev/accel" "--security-opt" "label=disable" "--net" "host" "--shm-size" "10G" "--pids-limit" "-1" "-v" "$HOME:$HOME" "${ADDITIONAL_MOUNT_OPTIONS[@]}" "--env" "HF_TOKEN" "--env" "HOME" "--env" "NCCL_DEBUG" "--env" "VLLM_LOGGING_LEVEL" "--env" "PT_HPU_ENABLE_LAZY_COLLECTIVES=true" "--entrypoint" "$ENTRYPOINT" "${IMAGE_NAME}")
RHEL AI サービスは、Gaudi アクセラレーター上で 16 を超える同時リクエストを許可しない
Gaudi アクセラレーターを搭載したマシンの RHEL AI バージョン 1.4.2 では、ilab model serve コマンドを実行するときに 16 を超える同時リクエストを実行できません。
トレーニング中にチェックポイントを保存するときの NCCL Watchdog タイムアウトエラー
AWS NVIDIA インスタンスでモデルを登録すると、チェックポイントがディスクに保存されないようにするタイムアウトエラーが発生する可能性があります。
この問題を解決してチェックポイントを正常に保存するには、モデルを低精度な形式で保存するか、高速なディスク書き込み速度で AWS インスタンスを使用する必要がある場合があります。
1.6.2.3. アップグレード リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。
$ sudo bootc upgrade --apply
RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。
1.6.3. Red Hat Enterprise Linux AI 1.4.3 機能とバグ修正 リンクのコピーリンクがクリップボードにコピーされました!
発行日: 2025 年 3 月 27 日
Red Hat Enterprise Linux AI リリース 1.4.3 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。
1.6.3.1. アップグレード リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。
$ sudo bootc upgrade --apply
RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。
1.6.4. Red Hat Enterprise Linux AI 1.4.4 機能とバグ修正 リンクのコピーリンクがクリップボードにコピーされました!
発行日: 2025 年 4 月 22 日
Red Hat Enterprise Linux AI リリース 1.4.4 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。
1.6.4.1. 機能 リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI バージョン 1.4.4 およびそれ以降の 1.4.z リリースでは、AMD MI300X アクセラレーターがサポートされるようになりました。I Download Red Hat Enterprise Linux AI から Red Hat Enterprise Linux AI イメージをダウンロードし、AMD アクセラレーターを搭載したマシンに RHEL AI をデプロイできます。
1.6.4.2. アップグレード リンクのコピーリンクがクリップボードにコピーされました!
RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。
$ sudo bootc upgrade --apply
RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。