ホーム
製品
Red Hat OpenShift AI Self-Managed
2.16
モデルのサービング
3.20. NVIDIA NIM モデルサービングプラットフォームについて

3.20. NVIDIA NIM モデルサービングプラットフォームについて

NVIDIA NIM モデルサービングプラットフォーム で NVIDIA NIM 推論サービスを使用してモデルを展開できます。

NVIDIA AI Enterprise の一部である NVIDIA NIM は、クラウド、データセンター、ワークステーションをまたいで推論を実行する高性能 AI モデルの、セキュアで信頼性の高いデプロイメントのために設計されたマイクロサービスのセットです。

3.20.1. NVIDIA NIM モデルサービングプラットフォームの有効化
リンクのコピー

管理者は、Red Hat OpenShift AI ダッシュボードを使用して、NVIDIA NIM モデルサービングプラットフォームを有効にできます。

注記

以前に OpenShift AI 2.14 または 2.15 で NVIDIA NIM モデルサービングプラットフォーム を有効にし、その後新しいバージョンにアップグレードした場合は、NVIDIA NGC API キーを再入力して、NVIDIA NIM モデルサービングプラットフォームを再度有効にしてください。

前提条件

Red Hat OpenShift AI に管理者としてログインしている。
シングルモデルサービングプラットフォームを有効にしている。プリインストールされているランタイムを有効にする必要はありません。シングルモデルサービングプラットフォームを有効にする方法の詳細は、シングルモデルサービングプラットフォームの有効化を参照してください。
次の OpenShift AI ダッシュボード設定が有効になっている。
```
disableNIMModelServing: false
```
```
disableNIMModelServing: false
```
Copy to Clipboard Toggle word wrap
詳細は、ダッシュボード設定オプションを参照してください。
OpenShift AI で GPU サポートを有効にした。詳細は、NVIDIA GPU の有効化を参照してください。
NVIDIA Cloud Account (NCA) をお持ちで、NVIDIA GPU Cloud (NGC) ポータルにアクセスできる。詳細は、NVIDIA GPU Cloud user guide を参照してください。
お使いの NCA アカウントが NVIDIA AI Enterprise Viewer ロールに関連付けられている。
NGC ポータルで NGC API キーを生成した。詳細は、NGC API keys を参照してください。

手順

OpenShift AI にログインします。
OpenShift AI ダッシュボードの左側のメニューで、Applications Explore をクリックします。
Explore ページで、NVIDIA NIM タイルを見つけます。
アプリケーションタイルで Enable をクリックします。
NGC API キーを入力し、Submit をクリックします。

検証

有効にした NVIDIA NIM アプリケーションが Enabled ページに表示されます。

3.20.2. NVIDIA NIM モデルサービングプラットフォームにモデルをデプロイする
リンクのコピー

NVIDIA NIM モデルサービングプラットフォーム を有効にすると、プラットフォーム上で NVIDIA 向けに最適化されたモデルのデプロイを開始できます。

前提条件

Red Hat OpenShift AI にログインしている。
OpenShift AI グループを使用している場合は、OpenShift のユーザーグループまたは管理者グループ (rhoai-users や rhoai-admins など) に属している。
NVIDIA NIM モデルサービングプラットフォーム を有効にした。
データサイエンスプロジェクトを作成した。
OpenShift AI でグラフィックプロセッシングユニット (GPU) のサポートを有効にした。これには、Node Feature Discovery Operator と NVIDIA GPU Operator のインストールが含まれます。詳細は、Node Feature Discovery Operator のインストールと NVIDIA GPU の有効化を参照してください。

手順

左側のメニューで、Data Science Projects をクリックします。
Data Science Projects ページが開きます。
モデルをデプロイするプロジェクトの名前をクリックします。
プロジェクトの詳細ページが開きます。
Models タブをクリックします。
Models セクションで、次のいずれかの操作クションを実行します。
- NVIDIA NIM model serving platform タイルで、タイル上の Select NVIDIA NIM をクリックし、Deploy model をクリックします。
- 以前に NVIDIA NIM モデルサービングタイプを選択した場合は、Models ページの右上隅に NVIDIA model serving enabled が表示され、Deploy model ボタンも表示されます。続行するには、Deploy model をクリックします。
Deploy model ダイアログが開きます。
モデルをデプロイするためのプロパティーを次のように設定します。
1. Model deployment name フィールドに、デプロイメントの一意の名前を入力します。
2. NVIDIA NIM リストから、デプロイする NVIDIA NIM モデルを選択します。詳細は、Supported Models を参照してください。
3. NVIDIA NIM storage size フィールドで、NVIDIA NIM モデルを保存するために作成されるクラスターストレージインスタンスのサイズを指定します。
4. Number of model server replicas to deploy フィールドに値を指定します。
5. Model server size リストから値を選択します。
6. Accelerator リストからアクセラレーターを選択します。
  Number of accelerators フィールドが表示されます。
7. Number of accelerators フィールドで、使用するアクセラレーターの数を指定します。デフォルト値は 1 です。
Deploy をクリックします。

検証

デプロイされたモデルがプロジェクトの Models タブに表示され、ダッシュボードの Model Serving ページで Status 列にチェックマークが付いて表示されていることを確認します。

トップに戻る

3.20. NVIDIA NIM モデルサービングプラットフォームについて

3.20.1. NVIDIA NIM モデルサービングプラットフォームの有効化
リンクのコピー

3.20.2. NVIDIA NIM モデルサービングプラットフォームにモデルをデプロイする
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

3.20. NVIDIA NIM モデルサービングプラットフォームについて

3.20.1. NVIDIA NIM モデルサービングプラットフォームの有効化リンクのコピーリンクがクリップボードにコピーされました!

3.20.2. NVIDIA NIM モデルサービングプラットフォームにモデルをデプロイするリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

3.20.1. NVIDIA NIM モデルサービングプラットフォームの有効化
リンクのコピー

3.20.2. NVIDIA NIM モデルサービングプラットフォームにモデルをデプロイする
リンクのコピー