5.5. 在 Elyra 中禁用节点缓存
Elyra 在 OpenShift AI 中提供一项功能,允许您在数据管道中缓存组件或"节点"。当管道组件运行时,Elyra 默认存储其输出。在后续运行时,如果 Elyra 检测到某个组件已经执行并且其输入没有更改,它将重复使用缓存的输出,而不是重新运行整个组件。
有关数据科学管道缓存的更多信息,请参阅 数据科学管道缓存概述。
如果您不想缓存组件输出,您可以为单一节点或管道中的所有节点禁用此功能。
先决条件
- 您已登陆到 Red Hat OpenShift AI。
- 您已创建了数据科学项目。
您已在包含工作台的 data Science 项目中创建和配置了管道服务器。
重要要确保默认创建了运行时配置,您必须在创建工作台前创建管道服务器。
- 您已创建了一个工作台镜像的工作台,其中包含 Elyra 扩展(Standard Data Science、TensorFlow、TrustyAI、ROCm-PyTorch、ROCm-TensorFlow 或 PyTorch),如 创建工作台并选择 IDE 中所述。
您已启动工作台并打开 JupyterLab 接口,如 访问工作台 IDE 中所述。
重要Elyra 管道编辑器仅适用于特定的工作台镜像。要使用 Elyra,工作台必须基于包含 Elyra 扩展的 JupyterLab 镜像。Elyra 扩展在 code-server 或 RStudio IDE 中不可用,它不包含在 Minimal Python workbenches 中。支持的基于 JupyterLab 的镜像,如 Standard Data Science、Tensorch、TrustyAI 和 ROCm 变体包括 Elyra 扩展。
- 您可以访问 S3 兼容存储。
- 您已在 JupyterLab 中创建管道。
流程
- 打开 JupyterLab 后,确认 JupyterLab launcher 会自动显示。
- 打开包含您要修改节点的管道。
- 右键点击您要编辑的节点,然后点 Open Properties。
要在单一节点上禁用缓存,请完成以下步骤:
- 单击右侧的滑块菜单中的 Node Properties 选项卡。
- 在 Additional Properties 下,单击 Disable node caching 下的选项栏,该缓存使用 Use runtime default 自动填充。
- 选择 True。
要为管道上的所有节点禁用缓存,请完成以下步骤:
- 点右侧的 slide-out 菜单中的 Pipeline Properties 选项卡。
- 在 Node Defaults 下,单击 Disable node caching 下的选项条,该缓存使用 Use runtime default 自动填充。
- 选择 True。
验证
- 要验证单个节点是否禁用了缓存,请检查节点在目标运行时环境中是否已重新执行。
- 要验证管道上所有节点是否禁用了缓存,请检查目标运行时环境中是否重新执行整个管道运行。