5.7. JupyterLab でパイプラインの実行
Pipeline Editor ユーザーインターフェイスから JupyterLab で作成したパイプラインを実行できます。パイプラインを実行する前に、データサイエンスプロジェクトとパイプラインサーバーを作成する必要があります。パイプラインサーバーを作成したら、パイプラインサーバーと同じプロジェクト内にワークベンチを作成する必要があります。JupyterLab のパイプラインインスタンスにはランタイム設定が含まれている必要があります。データサイエンスプロジェクトの一部としてワークベンチを作成すると、デフォルトのランタイム設定が自動的に作成されます。ただし、OpenShift AI ダッシュボードの Jupyter タイルからノートブックを作成する場合は、JupyterLab でパイプラインを実行する前にランタイム設定を作成する必要があります。ランタイム設定は、パイプラインインスタンスと S3 互換クラウドストレージの接続情報を定義します。
前提条件
- Red Hat OpenShift AI にログインしている。
-
OpenShift AI グループを使用している場合は、OpenShift のユーザーグループまたは管理者グループ (
rhoai-usersやrhoai-adminsなど) に属している。 - S3 互換ストレージにアクセスできる。
- JupyterLab でパイプラインを作成している。
- JupyterLab の Pipeline Editor でパイプラインを開いている。
- パイプラインインスタンスにはランタイム設定が含まれている。
- ワークベンチを含むデータサイエンスプロジェクト内にパイプラインサーバーを作成して設定している。
- Elyra 拡張機能 (Standard データサイエンス、TensorFlow、TrustyAI、または PyTorch) を含むノートブックイメージから Jupyter サーバーを作成し、起動している。
手順
Pipeline Editor ユーザーインターフェイスで Run Pipeline (
) をクリックします。
Run Pipeline ダイアログが表示されます。Pipeline Name フィールドには、パイプラインファイル名が自動的に入力されます。
注記パイプラインの実行後、OpenShift AI ダッシュボードの Experiments
Experiments and runs ページに、パイプライン実行を含むパイプライントライアルが自動的に作成されます。トライアル名は、パイプラインに割り当てた名前と一致します。 パイプライン実行の設定を定義します。
- Runtime Configuration リストから、パイプラインを実行するための関連するランタイム設定を選択します。
- オプション: 必要に応じて、パイプラインパラメーターを設定します。パイプラインにパイプラインパラメーターを参照するノードが含まれている場合は、デフォルトのパラメーター値を変更できます。パラメーターが必須でデフォルト値がない場合は、値を入力する必要があります。
- OK をクリックします。
検証
-
パイプライン実行の詳細は、OpenShift AI ダッシュボードの Experiments
Experiments and runs ページで確認できます。 - パイプライン実行の出力アーティファクトを表示できます。アーティファクトは、指定されたオブジェクトストレージバケットに保存されます。