第 1 章 OpenShift Container Platform 上的 AI 工作负载概述


OpenShift Container Platform 为跨培训、推测和数据科学工作流运行智能(AI)工作负载提供安全、可扩展的基础。

1.1. 运行 AI 工作负载的 Operator

您可以使用 Operator 在 OpenShift Container Platform 上运行智能(AI)和机器学习(ML)工作负载。使用 Operator,您可以构建满足特定 AI/ML 要求的自定义环境,同时继续使用 OpenShift Container Platform 作为应用程序的核心平台。

OpenShift Container Platform 提供多个 Operator 可帮助您运行 AI 工作负载:

Red Hat build of Kueue

您可以使用红帽构建的 Kue 提供结构化队列和优先顺序,以便处理工作负载完全且有效地处理。如果没有正确优先级,重要的作业可能会延迟,而较少的关键作业会占用资源。

如需更多信息,请参阅 "Introduction to Red Hat build of Kueue"。

leader Worker Set Operator

您可以使用 Leader Worker Set Operator 启用大规模 AI inference 工作负载,以便使用领导和 worker 进程之间的同步在节点间可靠地运行。如果没有适当的协调,大型培训运行可能会失败或停滞。

如需更多信息,请参阅"Leader Worker 设置 Operator 概述"。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat