第 5 章 在 JupyterLab 中使用管道


5.1. JupyterLab 中的管道概述

您可以使用 Elyra 在 JupyterLab 中创建视觉端到端管道工作流。Elyra 是 JupyterLab 的扩展,为您提供了一个 Pipeline Editor,以创建可在 OpenShift AI 执行的管道工作流。

在创建以下工作台镜像的最新版本时,您可以在 JupyterLab 中访问 Elyra 扩展:

  • Standard Data Science
  • PyTorch
  • TensorFlow
  • TrustyAI
  • ROCm-PyTorch
  • ROCm-TensorFlow

Elyra 管道编辑器仅适用于特定的工作台镜像。要使用 Elyra,工作台必须基于 JupyterLab 镜像。Elyra 扩展在 code-server 或 RStudio IDE 中不可用。工作台也必须从 Standard Data Science 镜像衍生而来。它不适用于 Minimal Python 或 CUDA 的工作台。所有其他支持的基于 JupyterLab 的工作台镜像都可以访问 Elyra 扩展。

当您使用 Pipeline Editor 可视化设计管道时,需要最少的代码来创建和运行管道。有关 Elyra 的更多信息,请参阅 Elyra 文档。有关 Pipeline Editor 的更多信息,请参阅 Visual Pipeline Editor。创建管道后,您可以在 JupyterLab 中本地运行,也可以使用 OpenShift AI 中的数据科学管道远程运行。

管道创建过程由以下任务组成:

  • 创建包含工作台的数据科学项目。
  • 创建管道服务器。
  • 在 JupyterLab 中的 Pipeline Editor 中创建新管道。
  • 通过添加 Python 笔记本或 Python 脚本并定义其运行时属性来开发管道。
  • 定义执行依赖项。
  • 运行或导出管道。

在 JupyterLab 中运行管道前,您的管道实例必须包含运行时配置。运行时配置定义了管道实例的连接信息,以及 S3 兼容云存储。

如果您创建工作台作为数据科学项目的一部分,则会自动创建默认的运行时配置。但是,如果您从 OpenShift AI 仪表板的 Start basic workbench 标题创建工作台,您必须在 JupyterLab 中运行管道前创建一个运行时配置。有关运行时配置的更多信息,请参阅运行时配置。作为先决条件,在创建工作台前,请确保已在与工作台相同的数据科学项目中创建并配置管道服务器。

您可以使用 S3 兼容云存储,在笔记本和脚本执行期间使数据提供给笔记本和脚本。您的云存储必须可从部署中的机器访问,这些机器运行 JupyterLab 以及托管数据科学管道的集群。在 JupyterLab 中创建并运行管道前,请确保您具有兼容 s3 的存储凭证。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat