2.10. モデルレジストリーからデプロイされたモデルバージョンのデプロイメントプロパティーの編集
レジストリーからデプロイされたモデルのモデルレジストリーから、モデルバージョンデプロイメントプロパティーを編集できます。たとえば、デプロイメント名、モデルフレームワーク、ソースモデルの場所の詳細を変更できます。
2.10.1. マルチモデルサービングプラットフォームを使用してデプロイされたモデルのデプロイメントプロパティーを編集する リンクのコピーリンクがクリップボードにコピーされました!
モデルレジストリーから、デプロイされたモデルバージョンのデプロイメントプロパティーを編集できます。たとえば、デプロイメント名、モデルフレームワーク、ソースモデルの場所の詳細を変更できます。
前提条件
- Red Hat OpenShift AI にログインしている。
- 使用可能なモデルレジストリーがデプロイメント内に存在し、登録およびデプロイされたモデルバージョンが少なくとも 1 つ含まれている。
- 編集するモデルバージョンのデプロイメントを含むモデルレジストリーにアクセスできる。
手順
-
OpenShift AI ダッシュボードから、Models
Model registry をクリックします。 - Model registry ドロップダウンメニューから、編集するモデルデプロイメントが含まれているモデルレジストリーを選択します。
Model name 列で、編集するデプロイメントを含むモデルの名前をクリックします。
モデルの詳細ページが開きます。
- 編集するデプロイメントのモデルバージョンの名前をクリックします。
- Deployments をクリックします。
- 編集するモデルデプロイメントの横にあるアクションメニュー (⋮) をクリックします。
- Edit をクリックします。
Edit model ダイアログで、モデルのデプロイメントプロパティーを編集します。
- Model deployment name フィールドに、モデルデプロイメントの新しい一意の名前を入力します。
Model framework リストから、モデルに別のフレームワークを選択します。
注記Model framework リストには、モデルサーバーの設定時に指定したモデルサービングランタイムによってサポートされるフレームワークのみが表示されます。
- 既存の接続を指定するか、新しい接続を作成して接続を編集します。
- Redeploy をクリックします。
検証
- モデルが再デプロイされ、モデルバージョンの Deployments タブに更新された詳細が表示されます。
2.10.2. シングルモデルサービングプラットフォームを使用してデプロイされたモデルのデプロイメントプロパティーを編集する リンクのコピーリンクがクリップボードにコピーされました!
モデルレジストリーから、デプロイされたモデルバージョンのデプロイメントプロパティーを編集できます。たとえば、デプロイメント名、モデルフレームワーク、モデルサーバーレプリカの数、モデルサーバーのサイズ、ソースモデルの場所の詳細を変更できます。
前提条件
- Red Hat OpenShift AI にログインしている。
- 使用可能なモデルレジストリーがデプロイメント内に存在し、登録およびデプロイされたモデルバージョンが少なくとも 1 つ含まれている。
- 編集するモデルバージョンのデプロイメントを含むモデルレジストリーにアクセスできる。
手順
-
OpenShift AI ダッシュボードから、Models
Model registry をクリックします。 - Model registry ドロップダウンメニューから、編集するモデルデプロイメントが含まれているモデルレジストリーを選択します。
Model name 列で、編集するデプロイメントを含むモデルの名前をクリックします。
モデルの詳細ページが開きます。
- 編集するデプロイメントのモデルバージョンの名前をクリックします。
- Deployments をクリックします。
- 編集するモデルデプロイメントの横にあるアクションメニュー (⋮) をクリックします。
- Edit をクリックします。
Edit model ダイアログで、モデルのデプロイメントプロパティーを編集します。
- Model deployment name フィールドに、モデルデプロイメントの新しい一意の名前を入力します。
Model framework リストから、モデルに別のフレームワークを選択します。
注記Model framework リストには、モデルをデプロイしたときに指定したモデル提供ランタイムでサポートされているフレームワークのみが表示されます。
- Number of model server replicas to deploy フィールドに値を指定します。
- Model server size リストから値を選択します。
- Model route セクションで、Make deployed models available through an external route チェックボックスをオンにして、デプロイされたモデルを外部クライアントが利用できるようにします。
Token authentication セクションで、Require token authentication チェックボックスをオンにすると、モデルサーバーでトークン認証を必須にできます。トークン認証の設定を完了するには、次のアクションを実行します。
- Service account name フィールドに、トークンが生成されるサービスアカウント名を入力します。生成されたトークンは、モデルサーバーの設定時に作成され、Token secret フィールドに表示されます。
- 追加のサービスアカウントを追加するには、Add a service account をクリックし、別のサービスアカウント名を入力します。
- 既存の接続を指定するか、新しい接続を作成して接続を編集します。
Configuration parameters セクションでランタイムパラメーターをカスタマイズします。
- Additional serving runtime arguments の値を変更して、デプロイされるモデルの動作を定義します。
モデルの環境内の変数を定義するには、Additional environment variables の値を変更します。
Configuration parameters セクションに、事前定義されたサービングランタイムパラメーターが表示されます (利用可能な場合)。
注記ポートまたはモデルサービングランタイムの引数は変更しないでください。これらの引数には、特定の値を設定する必要があるためです。これらのパラメーターを上書きすると、デプロイが失敗する可能性があります。
- Redeploy をクリックします。
検証
- モデルが再デプロイされ、モデルバージョンの Deployments タブに更新された詳細が表示されます。