第 2 章 使用项目工作台


2.1. 创建工作台并选择 IDE

工作台是一种隔离区域,您可以检查并使用 ML 模型。您还可以使用数据和运行程序,例如准备和清理数据。例如,如果工作台不需要提供现有模型,但大多数数据科学工作流任务(如编写代码来处理数据或培训模型)需要它。

当您创建工作台时,您可以指定一个镜像(IDE、软件包和其他依赖项)。支持的 IDE 包括 JupyterLab、code-server 和 RStudio (技术预览)。

IDE 基于服务器客户端架构。每个 IDE 都提供一个在 OpenShift 集群上的容器中运行的服务器,而用户界面(客户端)则显示在 Web 浏览器中。例如,Jupyter workbench 在 Red Hat OpenShift 集群的容器中运行。客户端是在您的本地计算机上的 Web 浏览器中打开的 JupyterLab 界面。您在 JupyterLab 中输入的所有命令都由工作台执行。同样,code-server 或 RStudio 服务器等其他 IDE 提供了一种在 OpenShift 集群上的容器中运行的服务器,而用户界面显示在 Web 浏览器中。此架构允许您在浏览器环境中通过本地计算机交互,同时在集群中进行所有处理。集群提供更大的可用资源和安全性优势,因为正在处理的数据永远不会离开集群。

在工作台中,您还可以配置连接(访问培训模型的外部数据并保存模型,以便您可以部署它们)和集群存储(用于保留数据)。同一项目中的工作台可以通过带有数据科学管道和模型服务器的对象存储共享模型和数据。

对于需要保留数据的数据科学项目,您可以在您要创建的工作台中添加容器存储。

在一个项目中,您可以创建多个工作台。当创建新工作台时,需要考虑事项,例如:

  • 工作台配置(如 CPU、RAM 或 IDE)。如果要避免编辑现有工作台配置来容纳新任务的配置,您可以创建一个新的工作台。
  • 分离任务或活动。例如,您可能希望在大型语言模型(LLM)试验活动中使用一个工作台、专用于演示的另一个工作台,另一个工作台用于测试。

2.1.1. 关于工作台镜像

工作台镜像预装了您模型开发所需的工具和库。您可以使用提供的工作台镜像,或 OpenShift AI 管理员可以根据您的需要创建自定义工作台镜像。

为了为您的模型开发提供一致的稳定平台,许多提供的工作台镜像都包含相同的 Python 版本。OpenShift AI 上的大多数工作台镜像已预先构建,并在安装或升级 OpenShift AI 立即使用。

有关红帽支持工作台镜像和软件包的详情,请参考 Red Hat OpenShift AI: 支持的配置

下表列出了默认安装的 Red Hat OpenShift AI 的工作台镜像。

如果这些镜像中提供的预安装软件包不足以满足您的用例,则您可以选择:

  • 在启动默认镜像后安装其他库。如果您要在开发模型时添加库,此选项很好。但是,管理已安装库的依赖项可能会有一定难度,在工作台重启时不会保存您的更改。
  • 创建包含额外库或软件包的自定义镜像。如需更多信息,请参阅 创建自定义工作台镜像
重要

Red Hat production 服务等级协议 (SLA)不支持使用这个表中的工作台镜像(技术预览 ),且可能无法完成。红帽不推荐在生产环境中使用技术预览功能。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。有关红帽技术预览功能支持范围的更多信息,请参阅技术预览功能支持范围

Expand
表 2.1. 默认工作台镜像
镜像名称描述

CUDA

如果您使用需要 GPU 支持的计算密集型数据科学模型,请使用 Compute Unified Device Architecture (CUDA)工作台镜像来访问 NVIDIA CUDA 工具包。使用这个工具包,您可以使用 GPU 加速的库和优化工具优化您的工作。

Standard Data Science

对于不需要 TensorFlow 或 PyTorch 的型号,使用标准数据科学工作台镜像。此镜像包含常用的库,可帮助您开发机器学习模型。

TensorFlow

TensorFlow 是供机器学习的开源平台。通过 TensorFlow,您可以构建、培训和部署机器学习模式。TensorFlow 包含高级数据视觉化功能,如计算图形视觉化。它还允许您轻松监控和跟踪模型的进度。

PyTorch

PyTorch 是一个开源机器学习库,专为深入学习而优化。如果您正在处理计算机愿景或自然语言处理模型,请使用 Pytorch workbench 镜像。

Minimal Python

如果您不需要高级机器学习功能,或计算密集型数据科学工作的其他资源,您可以使用最小 Python 镜像开发您的模型。

TrustyAI

使用 TrustyAI workbench 镜像通过模型解释性、追踪和责任以及运行时监控来利用您的数据科学工作。有关一些 Jupyter 笔记本示例,请参阅 TrustyAI Explainability 软件仓库

code-server

使用 code-server workbench 镜像,您可以使用各种扩展来自定义工作台环境来满足您的需求,以添加新的语言、主题、调试器并连接到其他服务。通过语法突出显示、自动和括号匹配,提高数据科学工作的效率,以及用于无缝自动化的自动任务运行程序。如需更多信息,请参阅 GitHub 中的 code-server

注意:基于 Elyra 的管道不适用于 code-server workbench 镜像。

RStudio 服务器(技术预览)

使用 RStudio 服务器工作台镜像访问 RStudio IDE,这是 R 的集成开发环境,这是统计计算和图形的编程语言。如需更多信息,请参阅 RStudio 服务器网站

要使用 RStudio Server workbench 镜像,您必须首先通过创建 secret 并触发 BuildConfig 来构建它,然后通过编辑 r Studio-rhel9 镜像流在 OpenShift AI UI 中启用它。如需更多信息,请参阅 构建 RStudio 服务器工作台镜像

重要

免责声明:
红帽支持在 OpenShift AI 中管理工作台。但是,红帽不提供对 RStudio 软件的支持。RStudio 服务器可以通过 https://rstudio.org/ 访问,并遵循 RStudio 许可条款。使用此示例工作台前,请查看许可证条款。

CUDA - RStudio 服务器(技术预览)

使用 CUDA - RStudio Server workbench 镜像访问 RStudio IDE 和 NVIDIA CUDA Toolkit。RStudio 是 R 的集成开发环境,这是统计计算和图形的编程语言。使用 NVIDIA CUDA 工具包,您可以使用 GPU 加速的库和优化工具优化工作。如需更多信息,请参阅 RStudio 服务器网站

要使用 CUDA - RStudio Server workbench 镜像,您必须首先通过创建一个 secret 并触发 BuildConfig 来构建它,然后通过编辑 cuda-r Studio-rhel9 镜像流在 OpenShift AI UI 中启用它。如需更多信息,请参阅 构建 RStudio 服务器工作台镜像

重要

免责声明:
红帽支持在 OpenShift AI 中管理工作台。但是,红帽不提供对 RStudio 软件的支持。RStudio 服务器可以通过 https://rstudio.org/ 访问,并遵循 RStudio 许可条款。使用此示例工作台前,请查看许可证条款。

CUDA - RStudio Server workbench 镜像包含 NVIDIA CUDA 技术。CUDA 许可信息位于 https://docs.nvidia.com/cuda/。使用此示例工作台前,请查看许可证条款。

ROCm

使用 ROCm workbench 镜像在 OpenShift AI 的 AMD GPU 上运行 AI 和机器学习工作负载。它包括为高性能 GPU 加速优化的 ROCm 库和工具,支持自定义 AI 工作流和数据处理任务。使用此镜像集成其他框架或基于您的特定 AI 开发需求的依赖项。

ROCm-PyTorch

使用 ROCm-PyTorch workbench 镜像在 OpenShift AI 的 AMD GPU 上运行 PyTorch 工作负载。它包括 ROCm-accelerated PyTorch 库,支持高效的学习培训、干扰和试验。此镜像专为使用基于 PyTorch 的工作流的数据科学家设计,提供与 GPU 调度的集成。

ROCm-TensorFlow

使用 ROCm-TensorFlow workbench 镜像在 OpenShift AI 的 AMD GPU 上运行 TensorFlow 工作负载。它包括 ROCm-accelerated TensorFlow 库,以支持高性能的深度学习模型培训和认证和推测。此镜像简化了 AMD GPU 上的 TensorFlow 开发,并与 OpenShift AI 集成资源扩展和管理。

2.1.2. 创建工作台

当您创建工作台时,您可以指定一个镜像(IDE、软件包和其他依赖项)。您还可以配置连接、集群存储并添加容器存储。

先决条件

  • 您已登陆到 Red Hat OpenShift AI。
  • 您已创建了一个项目。
  • 如果您在 Red Hat OpenShift AI 之外创建了 Simple Storage Service (S3)帐户,并希望创建到现有 S3 存储桶的连接,则具有存储存储桶的以下凭证信息:

    • 端点 URL
    • access key
    • Secret 密钥
    • 区域
    • bucket 名称

    如需更多信息,请参阅在 S3 兼容对象存储中使用数据

流程

  1. 在 OpenShift AI 仪表板中点 Data Science projects

    Data Science 项目页将打开。

  2. 点您要将工作台添加到的项目的名称。

    此时会打开项目详情页面。

  3. 单击 Workbenches 选项卡。
  4. Create workbench

    Create workbench 页面将打开。

  5. Name 字段中输入工作台的唯一名称。
  6. 可选:如果要更改工作台的默认资源名称,点 Edit resource name

    资源名称是您在 OpenShift 中标记的资源。有效字符包括小写字母、数字和连字符(-)。资源名称不能超过 30 个字符,它必须以字母或数字开头,并以字母或数字结尾。

    注: 您无法在创建工作台后更改资源名称。您只能编辑显示名称和描述。

  7. 可选:在 Description 字段中输入工作台的描述。
  8. Workbench image 部分中,完成字段以指定要与工作台搭配使用的工作台镜像。

    Image selection 列表中,选择一个适合您用例的工作台镜像。工作台镜像包含 IDE 和 Python 软件包(可重复利用的代码)。如果存在项目范围内的镜像,Image 选择 列表包含子标题,以区分全局镜像和项目范围内的镜像。

    (可选)点击 View package information 查看包含在您选择的镜像中的软件包列表。

    如果工作台镜像有多个可用的版本,请从 Version 选择 列表中选择要使用的工作台镜像版本。要使用最新的软件包版本,红帽建议您使用最近添加的镜像。

    注意

    在创建工作台后,您可以更改工作台镜像。

  9. Deployment size 部分中,选择以下选项之一,具体取决于是否启用了硬件配置文件功能。

    重要

    硬件配置集功能目前在 Red Hat OpenShift AI 中作为技术预览功能提供。技术预览功能不受红帽产品服务等级协议(SLA)支持,且功能可能并不完整。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。

    有关红帽技术预览功能支持范围的更多信息,请参阅技术预览功能支持范围

    • 如果没有启用硬件配置集功能:

      1. 容器大小 列表中,为您要培训或调优的模型大小选择适当的大小。

        例如,若要运行 Fine-tuning a model 中描述的示例微调作业,请使用 Kubeflow 培训,选择 Medium

      2. Accelerator 列表中,为您的工作台选择一个合适的加速器配置集。

        如果存在项目范围内的加速器配置文件,则 加速器 列表包含子标题,以区分全局加速器配置文件和项目范围加速器配置集。

    • 如果启用了硬件配置集功能:

      1. Hardware profile 列表中,为您的工作台选择一个合适的硬件配置集。

        如果存在项目范围内的硬件配置文件,则 Hardware profile 列表包含子标题,以区分全局硬件配置文件和项目范围内的硬件配置文件。

        硬件配置集指定分配给容器的 CPU 数量和内存量,为两者设置保证最小值(request)和最大值(limit)。

      2. 如果要更改默认值,点 Customize resource requests and limit,并输入新的最小值(request)和最大值(limit)值。

        重要

        默认情况下不启用硬件配置文件功能:硬件配置文件不会在仪表板导航菜单或用户界面中的其他位置显示。另外,与已弃用的加速器配置集功能关联的用户界面组件仍然会显示。要在仪表板导航菜单中显示 Settings Hardware profiles 选项,以及与硬件配置集关联的用户界面组件,请在 OpenShift 中的 OdhDashboardConfig 自定义资源(CR)中将 disableHardwareProfiles 值设置为 false。有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板

  10. 可选: 在 Environment variables 部分中,选择 并指定任何环境变量的值。

    在工作台配置期间设置环境变量可帮助您稍后节省时间,因为您不需要在工作台的正文或 IDE 命令行界面中定义它们。

    如果使用 S3 兼容存储,请添加这些推荐的环境变量:

    • AWS_ACCESS_KEY_ID 指定 Amazon Web Services 的 Access Key ID。
    • AWS_SECRET_ACCESS_KEY 指定在 AWS_ACCESS_KEY_ID 中指定的帐户的 Secret 访问密钥。

    如果在添加变量时选择 Secret,OpenShift AI 将凭证作为 Kubernetes secret 存储在受保护的命名空间中。

  11. Cluster storage 部分中,为您的工作台配置存储。选择以下选项之一:

    • 创建新的持久性存储 来创建在关闭工作台后保留的存储。完成相关字段以定义存储:

      1. 为集群存储输入一个名称
      2. 输入集群存储的描述
      3. 集群存储选择存储类

        注意

        在将集群存储添加到工作台后,您无法更改存储类。

      4. 对于支持多个访问模式的存储类,请选择 Access 模式 来定义如何访问卷。如需更多信息,请参阅关于持久性存储

        只有您的集群和 OpenShift AI 管理员为存储类启用的访问模式才可见。

      5. 持久性存储大小 下,以千兆字节或兆字节输入新大小。
    • 使用现有的持久性存储 来重复使用现有存储并从 Persistent storage 列表中选择存储。
  12. 可选:您可以在工作台中添加连接。连接是一个资源,其中包含连接到数据源或接收器(如对象存储桶)所需的配置参数。您可以使用存储存储桶来存储数据、型号和管道工件。您还可以使用连接来指定您要部署的模型的位置。

    Connections 部分中,使用现有连接或创建新连接:

    • 使用现有连接,如下所示:

      1. 单击 Attach existing connection
      2. Connection 列表中,选择一个您之前定义的连接。
    • 创建新连接,如下所示:

      1. Create connection。此时会打开 Add connection 对话框。
      2. Connection type 下拉列表中,选择连接的类型。此时会显示 Connection details 部分。
      3. 如果您在上一步中选择了 S3 兼容对象存储,请配置连接详情:

        1. Connection name 字段中输入连接的唯一名称。
        2. 可选:在 Description 字段中输入连接的描述。
        3. Access key 字段中,输入 S3 兼容对象存储供应商的访问密钥 ID。
        4. Secret key 字段中,为您指定的 S3 兼容对象存储帐户输入 secret 访问密钥。
        5. Endpoint 字段中,输入 S3 兼容对象存储桶的端点。
        6. Region 字段中,输入 S3 兼容对象存储帐户的默认区域。
        7. Bucket 字段中,输入 S3 兼容对象存储桶的名称。
        8. Create
      4. 如果上一步中选择了 URI,请配置连接详情:

        1. Connection name 字段中输入连接的唯一名称。
        2. 可选:在 Description 字段中输入连接的描述。
        3. URI 字段中,输入 Uniform Resource Identifier (URI)。
        4. Create
  13. Create workbench

验证

  • 您创建的工作台在项目的 Workbenches 选项卡中可见。
  • 您创建过程中与工作台关联的任何集群存储都会显示在项目的 Cluster storage 选项卡中。
  • Workbenches 选项卡上的 Status 列在工作台服务器 启动时显示 Starting 状态,并在工作台成功启动时显示为 Running
  • 可选:点击打开图标( The open icon )在新窗口中打开 IDE。
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部