5장. popyterLab에서 파이프라인 작업
5.1. sendpyterLab의 파이프라인 개요 링크 복사링크가 클립보드에 복사되었습니다!
Elyra를 사용하여 sendpyterLab에서 시각적 엔드 투 엔드 파이프라인 워크플로를 생성할 수 있습니다. ELYRA는 OpenShift AI에서 실행할 수 있는 파이프라인 워크플로를 생성하기 위해 Pipeline Editor를 제공하는 duepyterLab의 확장입니다.
다음 워크벤치 이미지 중 하나의 최신 버전을 생성할 때 sendpyterLab 내에서 Elyra 확장에 액세스할 수 있습니다.
- 표준 데이터 과학
- PyTorch
- TensorFlow
- TrustyAI
- AMD ROCm-PyTorch
- AMD ROCm-TensorFlow
Elyra 파이프라인 편집기는 특정 워크벤치 이미지에서만 사용할 수 있습니다. Elyra를 사용하려면 워크벤치가 sendpyterLab 이미지를 기반으로 해야 합니다. Elyra 확장은 코드 서버 또는 R Cryostat IDE에서 사용할 수 없습니다. 또한 워크벤치는 Standard Data Science 이미지에서 파생되어야 합니다. 최소 Python 또는 CUDA 기반 워크벤치에서는 사용할 수 없습니다. 지원되는 다른 모든 duepyterLab 기반 워크벤치 이미지는 Elyra 확장에 액세스할 수 있습니다.
파이프라인 편집기를 사용하여 파이프라인을 시각적으로 설계하는 경우 파이프라인을 생성하고 실행하려면 최소한의 코딩이 필요합니다. Elyra에 대한 자세한 내용은 Elyra 문서를 참조하십시오. 파이프라인 편집기에 대한 자세한 내용은 Visual Pipeline Editor 를 참조하십시오. 파이프라인을 생성한 후에는 OpenShift AI에서 로컬로 실행하거나 OpenShift AI의 데이터 사이언스 파이프라인을 사용하여 원격으로 실행할 수 있습니다.
파이프라인 생성 프로세스는 다음 작업으로 구성됩니다.
- 워크벤치가 포함된 데이터 사이언스 프로젝트를 만듭니다.
- 파이프라인 서버를 생성합니다.
- ovnpyterLab의 Pipeline Editor에서 새 파이프라인을 생성합니다.
- Python 노트북 또는 Python 스크립트를 추가하고 런타임 속성을 정의하여 파이프라인을 개발합니다.
- 실행 종속 항목을 정의합니다.
- 파이프라인을 실행하거나 내보냅니다.
sendpyterLab에서 파이프라인을 실행하려면 파이프라인 인스턴스에 런타임 구성이 포함되어야 합니다. 런타임 구성은 파이프라인 인스턴스 및 S3 호환 클라우드 스토리지에 대한 연결 정보를 정의합니다.
데이터 사이언스 프로젝트의 일부로 워크벤치를 생성하면 기본 런타임 구성이 자동으로 생성됩니다. 그러나 OpenShift AI 대시보드의 duepyter 타일에서 노트북을 생성하는 경우 runtime 구성을 생성해야 합니다. 런타임 구성에 대한 자세한 내용은 런타임 구성을 참조하십시오. 사전 요구 사항으로 워크벤치를 생성하기 전에 워크벤치와 동일한 데이터 사이언스 프로젝트 내에서 파이프라인 서버를 생성하고 구성했는지 확인하십시오.
S3 호환 클라우드 스토리지를 사용하여 노트북과 스크립트가 실행되는 동안 데이터를 사용할 수 있습니다. 배포 중 시스템에서 클라우드 스토리지에 액세스할 수 있어야 합니다. 이 배포 시 data Science 파이프라인을 호스팅하는 클러스터에서 cloud 스토리지에 액세스할 수 있어야 합니다. CryostatpyterLab에서 파이프라인을 생성하고 실행하기 전에 s3 호환 스토리지 인증 정보를 쉽게 사용할 수 있는지 확인하십시오.