第 4 章 在多型号服务平台上部署模型


为了部署小型和中型模型,OpenShift AI 包含一个基于 ModelMesh 组件的 多模式服务平台。在多型号服务平台上,可以从同一模型服务器部署多个模型并共享服务器资源。

重要

从 OpenShift AI 版本 2.19 开始,基于 ModelMesh 的多模式服务平台已弃用。您可以继续在多模式服务平台上部署模型,但建议您迁移到单一模式服务平台。

如需了解更多相关信息,或有关使用单一模式服务平台的帮助,请联系您的客户经理。

4.1. 为多模式服务平台添加模型服务器

当您启用了多型号服务平台时,您必须配置模型服务器来部署模型。如果您需要额外的计算能力以用于大型数据集,可以为模型服务器分配加速器。

注意

在 OpenShift AI 中,红帽支持用于模型服务的 NVIDIA 和 AMD GPU 加速器。

先决条件

  • 您已登陆到 Red Hat OpenShift AI。
  • 您已创建了可添加模型服务器的数据科学项目。
  • 您已启用了多型号服务平台。
  • 如果要将自定义模型运行时用于模型服务器,您添加了并启用运行时。请参阅 添加自定义模型运行时
  • 如果要将图形处理单元(GPU)与模型服务器搭配使用,在 OpenShift AI 中启用了 GPU 支持。如果使用 NVIDIA GPU,请参阅启用 NVIDIA GPU。如果使用 AMD GPU,请参阅 AMD GPU 集成

流程

  1. 在 OpenShift AI 仪表板的左侧菜单中,单击 Data Science projects

    Data Science 项目页将打开。

  2. 点您要为其配置模型服务器的项目名称。

    此时会打开项目详情页面。

  3. Models 选项卡。
  4. 执行以下操作之一:

    • 如果您看到 ​Multi-model 服务平台 标题,点标题上的 Add model server
    • 如果没有看到任何标题,请点击 Add model server 按钮。

    此时会打开 Add model server 对话框。

  5. Model server name 字段中输入模型服务器的唯一名称。
  6. Serving runtime 列表中,选择一个在 OpenShift AI 部署中安装并启用的模型运行时。

    注意

    如果您在模型服务器中使用 自定义 模型运行时并希望使用 GPU,您必须确保您的自定义运行时支持 GPU,并被适当配置为使用它们。

  7. Number of model replicas to deploy 字段中,指定一个值。
  8. Accelerator 配置集 列表中,选择一个加速器配置集。

    重要

    默认情况下,硬件配置集在仪表板导航菜单和用户界面中隐藏,而加速器配置集保持可见。另外,与已弃用的加速器配置集功能关联的用户界面组件仍然会显示。如果启用了硬件配置文件,则会显示 Hardware 配置集 列表,而不是 加速器配置集列表。要在仪表板导航菜单中显示 Settings Hardware profiles 选项,以及与硬件配置集关联的用户界面组件,请在 OpenShift 中的 OdhDashboardConfig 自定义资源(CR)中将 disableHardwareProfiles 值设置为 false。有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板

  9. 可选:点 Customize resource requests and limit 并更新以下值:

    1. CPU requests 字段中,指定要与模型服务器一起使用的 CPU 数量。使用此字段旁边的列表来指定内核或 millicores 的值。
    2. CPU limits 字段中,指定模型服务器使用的最大 CPU 数量。使用此字段旁边的列表来指定内核或 millicores 的值。
    3. Memory requests 字段中,以 gibibytes (Gi)为模型服务器指定请求的内存。
    4. Memory limits 字段中,以千兆字节(Gi)指定模型服务器的最大内存限值。
  10. 可选:在 Model route 部分中,选择 Make deployed model available via an external route 复选框,使部署的模型可供外部客户端使用。
  11. 可选:在 Token authentication 部分中,选择 Require token authentication 复选框,以为您的模型服务器需要令牌身份验证。要完成配置令牌身份验证,请执行以下操作:

    1. Service account name 字段中输入要为其生成令牌的服务帐户名称。配置模型服务器时,生成的令牌会被创建并显示在 Token secret 字段中。
    2. 要添加额外服务帐户,请点 Add a service account 并输入另一个服务帐户名称。
  12. 点击 Add

    • 您配置的模型服务器会显示在项目的 Models 选项卡中,在 Models 和 model servers 列表中。
  13. 可选: 要更新模型服务器,请点击模型服务器旁边的操作菜单(alsa),然后选择 Edit model server
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部