第 2 章 Red Hat build of Kueue
2.1. 红帽构建的 Kueue 简介 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Red Hat build of Kue 是一个 Kubernetes 原生系统,用于管理对作业资源的访问。红帽构建的 Kueue 可以决定作业在何时等待、接受创建 pod 或被 抢占 了,这意味着该作业的活动 pod 已被删除。
注意
在红帽构建的 Kueue 上下文中,可以将作业定义为一次性或按需完成的任务。
红帽构建的 Kueue 基于 Kue 开源项目。
红帽构建的 Kue 与使用异构、弹性资源的环境兼容。这意味着环境具有许多不同的资源类型,这些资源能够动态扩展。
红帽构建的 Kueue 不会替换 Kubernetes 集群中的任何现有组件,而是与现有 Kubernetes API 服务器、调度程序和集群自动扩展组件集成。
红帽构建的 Kue 支持所有或排除语义。这意味着,所有组件的整个作业都会被接受到集群,或者如果整个作业不适用于集群,则拒绝整个作业。
2.1.1. Personas 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
红帽构建的 Kueue 工作流存在不同的用户角色。
- 批处理管理员
- 批处理管理员管理集群基础架构,并建立配额和队列。
- 批处理用户
- 批处理用户在集群中运行作业。批处理用户的示例可能是研究人员、AI/ML 工程师或数据科学家。
- 为用户提供服务
- 供用户在集群中运行作业。例如,要公开经过培训的 AI/ML 模型以推测。
- 平台开发人员
- 平台开发人员将红帽构建的与其他软件集成。它们也可能有助于 Kueue 开源项目。
2.1.2. 工作流概述 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
红帽构建的 Kueue 工作流可以在高级别上描述,如下所示:
-
批处理管理员创建和配置
ResourceFlavor
、LocalQueue
和ClusterQueue
资源。 - 用户用户角色在集群上创建作业。
- Kubernetes API 服务器验证并接受作业数据。
-
红帽构建的 Kueue admit 作业基于配置选项,如顺序或配额。它使用资源类型将关联性注入作业,并创建一个与每个作业对应的
Workload
对象。 - 适用的作业类型的控制器创建 pod。
- Kubernetes 调度程序将 pod 分配给集群中的节点。
- Kubernetes 集群自动扩展根据需要置备更多节点。