2.7. 支持的模型保留运行时


OpenShift AI 包含多个预安装的模型运行时。您可以使用预安装的模型服务运行时启动服务模型,而无需自行修改或定义运行时。您还可以添加自定义运行时来支持模型。

有关添加自定义运行时的帮助,请参阅为单模型服务平台添加自定义模型运行时

表 2.1. model-serving 运行时
Name描述导出模型格式

Caikit 文本 Generation Inference Server (Caikit-TGIS) ServingRuntime for KServe (1)

Caikit 格式的服务模型的复合运行时

Caikit 文本生成

Caikit Standalone ServingRuntime for KServe (2)

Caikit 嵌入了嵌入任务的 Caikit 服务模型的运行时

Caikit Embeddings

OpenVINO Model Server

为为 Intel 架构优化的服务模型提供可扩展的高性能运行时

PyTorch, TensorFlow, OpenVINO IR, PaddlePaddle, XDPNet, Caffe, Kaldi

文本 Generation Inference Server (TGIS) Standalone ServingRuntime for KServe (3)

为支持 TGI 的模型提供服务的运行时

PyTorch Model Formats

vLLM ServingRuntime for KServe

用于大型语言模型的高吞吐量和内存效率推测和服务运行时

支持的模型

vLLM ServingRuntime,带有对 KServe 的 Gaudi 加速器的支持

支持 Intel Gaudi Accelerator 的高吞吐量和内存效率推测和服务运行时

支持的模型

用于 KServe 的 vLLM ROCm ServingRuntime

支持 AMD GPU 加速器的高吞吐量和内存效率推测和服务运行时

支持的模型

  1. 复合 Caikit-TGIS 运行时基于 Caikit文本 Generation Inference Server (TGIS)。要使用此运行时,您必须将模型转换为 Caikit 格式。例如,请参阅 cai kit-tgis-serving 存储库中的 Hugging Face Hub 模型转换为 Caikit 格式
  2. Caikit 独立运行时基于 Caikit NLP。要使用此运行时,您必须将模型转换为 Caikit 嵌入格式。例如,请参阅 嵌入模块的文本 测试。
  3. 文本 Generation Inference Server (TGIS) 基于 Hugging Face TGI 的早期分叉。红帽将继续开发独立 TGIS 运行时来支持 TGI 模型。如果模型在当前版本的 OpenShift AI 中不兼容,则可能会在以后的版本中添加支持。同时,您还可以添加自己的自定义运行时来支持 TGI 模型。如需更多信息,请参阅为单模型服务平台添加自定义模型运行时
表 2.2. 部署要求
Name默认协议附加组件协议模型网格支持单节点 OpenShift 支持部署模式

Caikit 文本 Generation Inference Server (Caikit-TGIS) ServingRuntime for KServe

REST

gRPC

raw 和 serverless

Caikit Standalone ServingRuntime for KServe

REST

gRPC

raw 和 serverless

OpenVINO Model Server

REST

None

raw 和 serverless

文本 Generation Inference Server (TGIS) Standalone ServingRuntime for KServe

gRPC

None

raw 和 serverless

vLLM ServingRuntime for KServe

REST

None

raw 和 serverless

vLLM ServingRuntime,带有对 KServe 的 Gaudi 加速器的支持

REST

None

raw 和 serverless

用于 KServe 的 vLLM ROCm ServingRuntime

REST

None

raw 和 serverless

其他资源

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.