1.6. 非同期 Z-stream 更新


RHEL AI 1.4 のセキュリティー、バグ修正、および機能強化の更新は、非同期の z-stream 更新としてリリースされます。

このセクションは、RHEL AI 1.4 の将来の非同期 z-stream リリースの機能強化とバグ修正に関するメモを提供するために、今後も更新され続けます。たとえば、フォーム RHEL AI 1.4.z を使用したバージョン管理された非同期リリースについては、サブセクションで説明します。

1.6.1. Red Hat Enterprise Linux AI 1.4.1 のバグ修正

発行日: 2025 年 2 月 25 日

Red Hat Enterprise Linux AI リリース 1.4.1 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。

1.6.1.1. 既知の問題

トレーニング中にチェックポイントを保存するときの NCCL Watchdog タイムアウトエラー

AWS NVIDIA インスタンスでモデルを登録すると、チェックポイントがディスクに保存されないようにするタイムアウトエラーが発生する可能性があります。

この問題を解決してチェックポイントを正常に保存するには、モデルを低精度な形式で保存するか、高速なディスク書き込み速度で AWS インスタンスを使用する必要がある場合があります。

1.6.1.2. Upgrade

RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。

$ sudo bootc upgrade --apply

RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。

1.6.2. Red Hat Enterprise Linux AI 1.4.2 の機能とバグ修正

発行日: 2025 年 3 月 4 日

Red Hat Enterprise Linux AI リリース 1.4.2 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。

1.6.2.1. 機能

RHEL AI バージョン 1.4.2 およびそれ以降の 1.4.z リリースでは、Intel Gaudi3 アクセラレーターがサポートされるようになりました。Download Red Hat Enterprise Linux AI ページで Red Hat Enterprise Linux AI イメージをダウンロードし、Gaudi3 アクセラレーターを搭載したマシンに RHEL AI をデプロイします。

1.6.2.2. 既知の問題

Intel Gaudi3 でマルチアクセラレーターの推論が失敗する

1.4.2 Intel Gaudi3 では、InstructLab ラッパーにパラメーターがありません。これにより、Gaudi3 アクセラレーターを搭載したマシンで推論が失敗します。この問題を解決するには、次の手順を実行してください。

  • /usr/bin/ilab ファイルをホームダイレクトにコピーし、ilab ファイルを編集します。

    $ cp /usr/bin/ilab <path-to-home-directory>
    $ vim ~/ilab

    ファイルは次のようになり、`--env" "PT_HPU_ENABLE_LAZY_COLLECTIVES=true パラメーターが含まれるようになります。

    PODMAN_COMMAND=("podman" "run" "--rm" "-it"
        "--device" "/dev/infiniband" "--device" "/dev/accel"
        "--security-opt" "label=disable" "--net" "host"
        "--shm-size" "10G"
        "--pids-limit" "-1"
        "-v" "$HOME:$HOME"
        "${ADDITIONAL_MOUNT_OPTIONS[@]}"
        "--env" "HF_TOKEN"
        "--env" "HOME"
        "--env" "NCCL_DEBUG"
        "--env" "VLLM_LOGGING_LEVEL"
        "--env" "PT_HPU_ENABLE_LAZY_COLLECTIVES=true"
        "--entrypoint" "$ENTRYPOINT"
        "${IMAGE_NAME}")

RHEL AI サービスは、Gaudi アクセラレーター上で 16 を超える同時リクエストを許可しない

Gaudi アクセラレーターを搭載したマシンの RHEL AI バージョン 1.4.2 では、ilab model serve コマンドを実行するときに 16 を超える同時リクエストを実行できません。

トレーニング中にチェックポイントを保存するときの NCCL Watchdog タイムアウトエラー

AWS NVIDIA インスタンスでモデルを登録すると、チェックポイントがディスクに保存されないようにするタイムアウトエラーが発生する可能性があります。

この問題を解決してチェックポイントを正常に保存するには、モデルを低精度な形式で保存するか、高速なディスク書き込み速度で AWS インスタンスを使用する必要がある場合があります。

1.6.2.3. アップグレード

RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。

$ sudo bootc upgrade --apply

RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。

1.6.3. Red Hat Enterprise Linux AI 1.4.3 機能とバグ修正

発行日: 2025 年 3 月 27 日

Red Hat Enterprise Linux AI リリース 1.4.3 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。

1.6.3.1. アップグレード

RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。

$ sudo bootc upgrade --apply

RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。

1.6.4. Red Hat Enterprise Linux AI 1.4.4 機能とバグ修正

発行日: 2025 年 4 月 22 日

Red Hat Enterprise Linux AI リリース 1.4.4 が利用可能になりました。このリリースにはバグ修正と製品の機能強化が含まれています。

1.6.4.1. 機能

RHEL AI バージョン 1.4.4 およびそれ以降の 1.4.z リリースでは、AMD MI300X アクセラレーターがサポートされるようになりました。I Download Red Hat Enterprise Linux AI から Red Hat Enterprise Linux AI イメージをダウンロードし、AMD アクセラレーターを搭載したマシンに RHEL AI をデプロイできます。

1.6.4.2. アップグレード

RHEL AI システムを最新の z-stream バージョンに更新するには、Red Hat レジストリーにログインして次のコマンドを実行する必要があります。

$ sudo bootc upgrade --apply

RHEL AI システムのアップグレードの詳細は、Red Hat Enterprise Linux AI の更新 ドキュメントを参照してください。

Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

Red Hat ドキュメントについて

Legal Notice

Theme

© 2026 Red Hat
トップに戻る