第2章 新機能および機能拡張


このセクションでは、Red Hat OpenShift AI 2.16 の新機能および拡張機能について説明します。

2.1. 新機能

カスタマイズ可能な提供ランタイムパラメーター
モデルを提供するときに、パラメーター値と環境変数をランタイムに渡すことができるようになりました。ランタイムパラメーターのカスタマイズは、vLLM に関連する GenAI ユースケースで特に重要です。
数量化されたモデルのデプロイのサポート
KServe ランタイムに vLLM ServingRuntime を使用して、Marlin カーネル用 に数量化されたモデルをデプロイできます。モデルが Marlin の数量付けされている場合、vLLM は基礎となるハードウェアに基づいて Marlin カーネルを自動的に使用します。他の 数量モデルの場合は、quantization=marlin カスタムパラメーターを使用できます。サポートされているハードウェアの詳細は、vLLM Web サイトの Supported Hardware for Quantization Kernels を参照してください。
code-server ワークベンチイメージ

以前はテクノロジープレビュー機能として利用可能であった Red Hat OpenShift AI に含まれるコードサーバーワークベンチイメージが一般提供されました。詳細については、Working in code-server を参照してください。

code-server ワークベンチイメージを使用すると、さまざまな拡張機能を使用して新しい言語、テーマ、デバッガーを追加し、追加のサービスに接続することで、ワークベンチ環境をカスタマイズできます。構文の強調表示、自動インデント、括弧の一致により、データサイエンス作業の効率も向上します。

注記

Elyra ベースのパイプラインは、code-server ワークベンチイメージでは使用できません。

Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.