第 2 章 红帽构建的 Kueue


2.1. 红帽构建的 Kueue 简介

红帽构建的 Kueue 是一个 Kubernetes 原生系统,用于管理对作业资源的访问。红帽构建的 Kueue 可以决定作业等待、接受创建 pod 或应该被抢占(这意味着该作业的活动 pod 被删除)的时间。

注意

对于红帽构建的 Kueue,一个作业可以被定义为一次性任务或按需任务,它需要运行完成。

红帽构建的 Kueue 基于 Kueue 开源项目。

红帽构建的 Kueue 与使用异构、弹性资源的环境兼容。这意味着,环境具有不同的资源类型,这些资源能够动态扩展。

红帽构建的 Kueue 不会替换 Kubernetes 集群中的任何现有组件,而是与现有 Kubernetes API 服务器、调度程序和集群自动扩展组件集成。

红帽构建的 Kueue 支持“all-or-nothing”语义。这意味着,所有组件的整个作业都会被接受到集群,或者如果整个作业不适用于集群,则拒绝整个作业。

2.1.1. 用户角色(Personas)

红帽构建的 Kueue 工作流存在不同的用户角色。

批处理管理员
批处理管理员管理集群基础架构,并建立配额和队列。
批处理用户
批处理用户在集群中运行作业。例如,批处理用户可以是研究人员、AI/ML 工程师或数据科学家。
服务(Serving)用户
服务用户在集群中运行作业。例如,要公开经过训练的 AI/ML 模型用于推理。
平台开发者
平台开发者将红帽构建的 Kueue 与其他软件集成。它们也会向 Kueue 开源项目进行贡献。

2.1.2. 工作流概述

红帽构建的 Kueue 工作流的高级别描述如下:

  1. 批处理管理员创建和配置 ResourceFlavorLocalQueueClusterQueue 资源。
  2. 用户角色在集群上创建作业。
  3. Kubernetes API 服务器验证并接受作业数据。
  4. 红帽构建的 Kueue 会基于配置选项(如订单或配额)来批准作业。它使用资源 flavor 将关联性注入到作业,并创建一个与每个作业对应的 Workload 对象。
  5. 适用于作业类型的控制器创建 pod。
  6. Kubernetes 调度程序将 pod 分配给集群中的一个节点。
  7. Kubernetes 集群自动扩展器会根据需要置备更多节点。
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat