第 3 章 提供大型模型


对于部署大型语言模型(LLMs)的大型 模型,Red Hat OpenShift AI 包括一个基于 KServe 组件的模型服务平台。由于每个模型都从自己的模型服务器部署,单一模型服务平台可帮助您部署、监控、扩展和维护需要增加资源的大型模型。

3.1. 关于单一模型服务平台

单一模型服务平台由以下组件组成:

  • KServe: 一个 Kubernetes 自定义资源定义(CRD),用于编配所有类型的模型服务。它包括模型-serving 运行时,用于实施指定类型的模型服务器加载。KServe 处理部署对象、存储访问和网络设置的生命周期。
  • Red Hat OpenShift Serverless: 一个云原生开发模型,允许无服务器部署模型。OpenShift Serverless 基于开源 Knative 项目。
  • Red Hat OpenShift Service Mesh: 服务网格网络层,用于管理流量流并强制实施访问策略。OpenShift Service Mesh 基于开源 Istio 项目。

    注意

    目前,只支持 OpenShift Service Mesh v2。如需更多信息,请参阅 支持的配置

要安装单一模型服务平台,有以下选项:

自动化安装
如果您还没有在 OpenShift 集群上创建 ServiceMeshControlPlaneKNativeServing 资源,您可以将 Red Hat OpenShift AI Operator 配置为安装 KServe 及其依赖项。
手动安装
如果您已在 OpenShift 集群上创建了 ServiceMeshControlPlaneKNativeServing 资源,则无法 配置 Red Hat OpenShift AI Operator 来安装 KServe 及其依赖项。在这种情况下,您必须手动安装 KServe。

安装 KServe 后,您可以使用 OpenShift AI 仪表板使用预安装或自定义模型运行时部署模型。

OpenShift AI 为 KServe 包含以下预安装的运行时:

  • 独立 TGIS 运行时
  • 组合 Caikit-TGIS 运行时
  • OpenVINO Model Server
注意

您还可以为单一模型服务平台配置监控,并使用 Prometheus 提取可用的指标。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat