2.10. 关于 KServe 部署模式


默认情况下,您可以使用 Red Hat OpenShift Serverless 在单型号服务平台上部署模型,这是允许无服务器部署模型的云原生开发模型。OpenShift Serverless 基于开源 Knative 项目。另外,无服务器模式依赖于 Red Hat OpenShift Serverless Operator。

另外,您可以使用原始部署模式,它不依赖于 Red Hat OpenShift Serverless Operator。使用原始部署模式,您可以使用 Kubernetes 资源部署模型,如 DeploymentServiceIngressHorizontal Pod Autoscaler

重要

使用 KServe 原始部署模式部署机器学习模型是一个有限可用性功能。有限的可用性意味着您只能通过 Red Hat AI 事业部的特定批准方式安装和接收对该功能的支持。如果没有这样的批准,则不支持该功能。另外,这个功能只在单一节点 OpenShift 的自助管理部署中被支持。

使用每个部署模式都有优点和缺点:

2.10.1. Serverless 模式

优点:

  • 根据请求卷启用自动扩展:

    • 在接收传入请求时,资源会自动扩展。
    • 在高峰时间优化资源使用并保持性能。
  • 支持使用 Knative 缩减到零和从零缩减:

    • 当没有传入请求时,允许资源完全缩减。
    • 通过不运行空闲资源来节约成本。

缺点:

  • 具有自定义限制:

    • Serverless 仅限于 Knative,比如在挂载多个卷时。
  • 依赖于 Knative 进行扩展:

    • 与传统的扩展方法相比,设置和管理增加了额外的复杂性。

2.10.2. 原始部署模式

优点:

  • 使用 Kubernetes 资源启用部署,如 DeploymentServiceIngressHorizontal Pod Autoscaler

    • 提供对 Kubernetes 资源的完整控制,允许详细自定义和配置部署设置。
  • 解锁 Knative 限制,如无法挂载多个卷:

    • 对于需要复杂配置或多个存储挂载的应用程序有用。

缺点:

  • 不支持自动扩展:

    • 不支持在空闲时自动缩放为零资源。
    • 可能会导致流量低期间成本更高。
  • 需要手动管理缩放。
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.