2.10. 关于 KServe 部署模式
您可以在 高级 或标准 部署模式中部署模型。
高级部署模式使用 Knative Serverless。默认情况下,KServe 与 Red Hat OpenShift Serverless 和 Red Hat OpenShift Service Mesh 集成,以便在单模式服务平台上部署模型。Red Hat Serverless 基于开源 Knative 项目,需要 Red Hat OpenShift Serverless Operator。
另外,您可以使用标准部署模式,它使用 KServe RawDeployment 模式,且不需要 Red Hat OpenShift Serverless Operator、Red Hat OpenShift Service Mesh 或 Authorino。
如果为 高级 部署模式配置 KServe,您可以设置数据科学项目,以 高级 和标准 部署模式提供模型。但是,如果您只 为标准 部署模式配置 KServe,则只能使用 标准 部署模式。
使用每个部署模式都有优点和缺点:
2.10.1. 高级模式 复制链接链接已复制到粘贴板!
优点:
根据请求卷启用自动扩展:
- 在接收传入请求时,资源会自动扩展。
- 在高峰时间优化资源使用并保持性能。
支持使用 Knative 缩减到零和从零缩减:
- 当没有传入请求时,允许资源完全缩减。
- 通过不运行空闲资源来节约成本。
缺点:
具有自定义限制:
- Serverless 由 Knative 支持,并隐式继承相同的设计选择,比如在挂载多个卷时。
依赖于 Knative 进行扩展:
- 与传统的扩展方法相比,设置和管理增加了额外的复杂性。
集群范围内的组件:
- 如果集群已经配置了 Serverless,则必须手动配置集群使其使用 OpenShift AI。
2.10.2. 标准模式 复制链接链接已复制到粘贴板!
优点:
启用 Kubernetes 资源的部署,如
Deployment
、Service
、Route
和Horizontal Pod Autoscaler
,而无需其他依赖项,如 Red Hat Serverless、Red Hat Service Mesh 和 Authorino。- 与高级模式相比,生成的模型部署的资源占用较小。
启用传统的 Deployment/Pod 配置,如挂载多个卷,它们无法使用 Knative 提供。
- 对于需要复杂配置或多个存储挂载的应用程序有用。
缺点:
不支持自动扩展:
- 不支持在空闲时自动缩放为零资源。
- 可能会导致流量低期间成本更高。