第 1 章分布式工作负载概述

您可以使用分布式工作负载功能来队列、扩展和管理在 OpenShift 集群中在多个节点上运行数据科学工作负载所需的资源。通常，数据科学工作负载包括多种人工智能(AI)工作负载，包括机器学习(ML)和 Python 工作负载。

分布式工作负载提供以下优点：

由于处理时间减少，您可以更频繁地迭代和试验速度。
您可以使用更大的数据集，这可导致更准确的模型。
您可以使用无法在单一节点上培训的复杂模型。
您可以随时提交分布式工作负载，然后在所需资源可用时调度分布式工作负载。

分布式工作负载基础架构包括以下组件：

CodeFlare Operator: 保护部署的 Ray 集群，并授予对其 URL 的访问权限
CodeFlare SDK: 为任何基于 Python 的环境定义和控制远程分布式计算作业和基础架构
注意
CodeFlare SDK 未作为 OpenShift AI 的一部分安装，但它包含在 OpenShift AI 提供的一些笔记本镜像中。
KubeRay: 管理 OpenShift 上的远程 Ray 集群，用于运行分布式计算工作负载
韩语: 管理配额以及分布式工作负载如何使用它们，并管理与配额相关的分布式工作负载的队列

您可以从数据科学管道、Jupyter 笔记本或从 Microsoft Visual Studio Code 文件运行分布式工作负载。

注意

数据科学管道工作负载不由分布式工作负载功能管理，不包含在分布式工作负载指标中。

返回顶部

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务，以及可以信赖的内容，帮助红帽用户创新并实现他们的目标。了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情，请参阅红帽博客.

關於紅帽

我们提供强化的解决方案，使企业能够更轻松地跨平台和环境（从核心数据中心到网络边缘）工作。

Theme

© 2025 Red Hat