4.3. 使用多模式服务平台部署模型


您可以在 OpenShift AI 上部署受培训的模型,以便测试并实施它们到智能应用程序中。部署模型使其可作为服务使用 API 访问。这可让您根据数据输入返回预测。

当您启用了多模式服务平台时,您可以在平台上部署模型。

先决条件

  • 您已登陆到 Red Hat OpenShift AI。
  • 您已启用了多型号服务平台。
  • 您已创建了一个项目并添加了模型服务器。
  • 您可以访问 S3 兼容对象存储。
  • 对于您要部署的模型,您知道 S3 兼容对象存储桶中的关联文件夹路径。

流程

  1. 在 OpenShift AI 仪表板的左侧菜单中,单击 Projects

    Projects 页面将打开。

  2. 点击您要在其中部署模型的项目的名称。

    此时会打开项目详情页面。

  3. 单击 Deployments 选项卡。
  4. 单击 Deploy model
  5. 配置部署模型的属性,如下所示:

    1. Model name 字段中输入您要部署的模型的唯一名称。
    2. Model 框架 列表中,为您的模型选择一个框架。

      注意

      Model 框架 列表仅显示配置模型服务器时指定的模型运行时支持的框架。

    3. 要指定您要从 S3 兼容对象存储部署的模型位置,请执行以下一组操作:

      • 使用现有连接

        1. 选择现有连接
        2. Name 列表中,选择一个您之前定义的连接。
        3. Path 字段中输入在指定数据源中包含模型的文件夹路径。

          注意

          如果您使用现有 S3 或 URI 数据连接部署注册的模型版本,可能会自动填充一些连接详情。这取决于数据连接类型以及项目中可用的匹配连接数量。例如,如果只有一个匹配的连接,则路径、URI、端点、存储桶和区域等字段可能会自动填充。匹配连接将标记为 建议

      • 使用新连接

        1. 要定义模型可访问的新连接,请选择 New connection
        2. Add connection modal 中,选择 Connection typeS3 兼容对象存储URI 选项是预安装的连接类型。如果您的 OpenShift AI 管理员添加了其他选项,则可能会使用其他选项。

          此时会打开 Add connection 表单,其中包含特定于您选择的连接类型的字段。

        3. 输入连接详情字段。
    4. (可选)在 配置参数 部分中自定义运行时参数:

      1. 修改附加服务 运行时参数中的值,以定义部署模型的行为方式。
      2. 修改 附加环境变量中的值,以在模型环境中定义变量。
    5. Deploy

验证

  • 确认部署的模型显示在项目的 Deployments 选项卡中,并在仪表板的 Deployments 页面中显示 Status 列中带有复选标记。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat