1.2. 分布式工作负载的类型
根据您要运行的分布式工作负载类型,您必须使用不同的 OpenShift AI 组件:
-
基于 Ray 的分布式工作负载:使用
codeflare、kue和ray组件。 -
培训基于 Operator 的分布式工作负载:使用
trainingoperator和kueue组件。
对于基于 Ray 的分布式工作负载,您可以使用基于 Ray 的分布式工作负载,您可以使用 Kue 和支持的加速器:
- 使用 Kue 管理分布式工作负载的资源。
- 将 CUDA 培训镜像用于 NVIDIA GPU,为 AMD GPU 使用基于 ROCm 的文档镜像。
有关支持的加速器的更多信息,请参阅 Red Hat OpenShift AI: 支持的配置 知识库文章
您可以从数据科学管道、Jupyter 笔记本或 Microsoft Visual Studio Code 文件运行分布式工作负载。
注意
数据科学管道工作负载不由分布式工作负载功能管理,不包含在分布式工作负载指标中。