第 3 章 管理管道运行
3.1. 管道运行概述 复制链接链接已复制到粘贴板!
管道运行是数据科学管道的单一执行。作为数据科学家,您可以使用 OpenShift AI 定义、管理和跟踪数据科学管道的执行。要查看之前执行、调度和归档运行的记录,您必须首先从 OpenShift AI 接口的 Experiments
您可以使用管道试验来优化管道运行的使用以实现可移植性和可重复性。通过试验,您可以对管道运行进行逻辑分组,并尝试不同的管道配置。您还可以克隆管道运行来重现和扩展,或者在您要保留执行记录时归档它们,但不再需要它们。您可以删除不再需要保留的归档运行,也可以将其恢复到以前的状态。
您可以执行一次运行,即创建后或重复执行。重复运行由带有所有参数值和 run 触发器的管道副本组成。运行触发器指示重复运行的时间执行。您可以定义以下运行触发器:
- Periodic:调度运行,以间隔方式执行。
- Cron:调度运行,以 cron 任务执行。
您还可以将同一运行的最多 10 个实例配置为同时执行。您可以从 OpenShift AI 用户界面的运行详情页面中跟踪运行的进度。在这里,您可以查看运行的图形和输出工件。
管道运行可以处于以下状态之一:
- Scheduled: 调度一次执行的管道运行
- Active :正在执行或停止的管道运行。
- 归档:归档的管道运行。
您可以使用捕获运行来确保管道运行在暂停时不会永久低于调度。例如,如果您重新启用暂停的重复运行,则运行调度程序会回填每个未命中的运行间隔。如果您禁用捕获运行,并且您有调度的运行间隔可供执行,则运行调度程序只会调度运行的最新间隔。捕获运行会被默认启用。但是,如果管道在内部处理回填,红帽建议您禁用捕获运行以避免重复回填。
管道运行执行后,您可以在 Executions 页面中查看其执行任务的详情,及其工件(在 Artifacts 页面中)。在 Executions 页面中,您可以查看每个任务的执行状态,这表明它是否已成功完成。您还可以通过单击列表中的执行名称来查看每个执行的任务的更多信息。在 Artifacts 页面中,您可以查看每个管道工件的详情,如其名称、唯一 ID、类型和 URI。Pipeline 工件可帮助您评估管道运行的性能,并更轻松地了解管道组件。Pipeline 工件可以从纯文本数据到详细的交互式数据视觉化。
您可以点列表中的工件名称来查看每个工件的更多信息。您还可以通过点击列表中的活跃工件 URI 链接来查看或下载存储在 S3 兼容对象存储中的工件内容。
未存储在 S3 兼容对象存储中的工件无法下载,且不会显示在活跃的 URI 链接中。
如果您的浏览器可以显示工件内容,例如,如果工件是纯文本、HTML 或标记,则内容不会被下载,但会自动显示在新的浏览器标签页中。如果您的浏览器无法显示工件内容,例如,如果工件是模型,工件会自动下载。要下载浏览器标签页中显示的构件,请右键单击内容,然后单击 Save 作为。
您可以查看和分析活跃管道运行中的每个步骤的日志。通过日志查看器,您可以搜索特定的日志消息,查看每个步骤的日志,并将步骤日志下载到本地机器。