2.8. テストおよび検証済みのモデルサービングランタイム

テストおよび検証済みのランタイムは、OpenShift AI の特定のバージョンに対してテストおよび検証されたモデルサービングランタイムのコミュニティーバージョンです。

Red Hat は、OpenShift AI の新しいバージョンがリリースされるたびに、テストおよび検証済みのランタイムの最新バージョンをテストします。テストおよび検証済みのランタイムの新しいバージョンが OpenShift AI リリースサイクルの途中でリリースされた場合、今後のリリースでテストおよび検証されます。

テスト済みで検証済みのランタイムと互換性のあるバージョンの一覧は、OpenShift AI リリースノートで確認できます。

注記

テストおよび検証済みのランタイムは、Red Hat によって直接サポートされません。お客様が責任を持って追加するテスト済みおよび検証済みのランタイムを使用するライセンスがあることを確認して正しく設定および保守するようにしてください。

詳細は、OpenShift AI でテストおよび検証されたランタイムを参照してください。

表2.3 モデルサービングランタイム
名前	説明	エクスポートされたモデル形式
NVIDIA Triton Inference Server	アプリケーションにおける高速かつスケーラブルな AI を実現するオープンソースの推論サービスソフトウェア。	TensorRT、TensorFlow、PyTorch、ONNX、OpenVINO、Python、RAPIDS FIL など

表2.4 デプロイメント要件
名前	デフォルトプロトコル	追加プロトコル	モデルメッシュのサポート	シングルノードの OpenShift サポート	デプロイメントモード
NVIDIA Triton Inference Server	gRPC	REST	はい	はい	raw および serverless

関連情報

推論エンドポイント

2.8. テストおよび検証済みのモデルサービングランタイム

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Red Hat legal and privacy links

Red Hat legal and privacy links