3.9. KServe デプロイメントモードについて


デフォルトでは、モデルの serverless デプロイメントを可能にするクラウドネイティブ開発モデルである Red Hat OpenShift Serverless を使用して、KServe でシングルモデルサービングプラットフォームにモデルをデプロイできます。OpenShift Serverless は、オープンソースの Knative プロジェクトをベースにしています。さらに、serverless モードは Red Hat OpenShift Serverless Operator に依存します。

あるいは、Red Hat OpenShift Serverless Operator に依存しない raw デプロイメントモードを使用することもできます。raw デプロイメントモードでは、DeploymentServiceIngressHorizontal Pod Autoscaler などの Kubernetes リソースを使用してモデルをデプロイできます。

重要

KServe の raw デプロイメントモードを使用して機械学習モデルをデプロイすることは、限定提供機能です。限定提供とは、Red Hat AI Business Unit からの特別な承認を得た場合にのみ、対象となる機能をインストールしてサポートを受けることができることを意味します。このような承認がない場合、この機能はサポートされません。また、この機能は、シングルノードの OpenShift のセルフマネージドデプロイメントでのみサポートされます。

これらの各デプロイメントモードには、それぞれメリットとデメリットがあります。

3.9.1. Serverless モード

メリット:

  • リクエスト量に基づいて自動スケーリングを有効にします。

    • 着信リクエストを受信すると、リソースは自動的にスケールアップされます。
    • リソースの使用を最適化し、ピーク時のパフォーマンスを維持します。
  • Knative を使用してゼロへのスケールダウンとゼロからのスケールダウンをサポートします。

    • 着信リクエストがない場合にリソースを完全にスケールダウンできます。
    • アイドル状態のリソースを実行しないことでコストを節約します。

デメリット:

  • カスタマイズの制限があります。

    • 複数のボリュームをマウントする場合など、Serverless は Knative に制限されます。
  • スケーリン用に Knative に依存します。

    • 従来のスケーリング方法と比較して、セットアップと管理がさらに複雑になります。

3.9.2. raw デプロイメントモード

メリット:

  • DeploymentServiceIngressHorizontal Pod Autoscaler などの Kubernetes リソースを使用したデプロイメントを有効にします。

    • Kubernetes リソースを完全に制御し、デプロイメント設定の詳細なカスタマイズと設定を可能にします。
  • 複数のボリュームをマウントできないなどの Knative の制限を解除します。

    • 複雑な設定や複数のストレージマウントを必要とするアプリケーションに役立ちます。

デメリット:

  • 自動スケーリングはサポートされていません。

    • アイドル時にリソースを自動的にゼロにスケールダウンすることはサポートされていません。
    • トラフィックが少ない期間にはコストが高くなる可能性があります。
  • スケーリングの手動管理が必要です。
Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.