6.3. ノートブックからの分散データサイエンスワークロードの実行
ノートブックから分散データサイエンスワークロードを実行するには、まず Ray クラスターイメージへのリンクを提供する必要があります。
前提条件
- 分散ワークロードの設定 の説明に従って分散ワークロードを実行するように設定したデータサイエンスクラスターにアクセスできる。
- デフォルトのノートブックイメージの 1 つ (例: Standard Data Science ノートブック) を実行するワークベンチを含むデータサイエンスプロジェクトを作成済みである。デフォルトのノートブックの完全なリストは、データサイエンティスト向けのノートブックイメージ の表を参照してください。
- ノートブックサーバーを起動し、Jupyter にログインしている。
手順
デモノートブックにアクセスするには、次のように
codeflare-sdk
リポジトリーのクローンを作成します。- JupyterLab インターフェイスで、Git > Clone a Repository をクリックします。
-
"Clone a repo" ダイアログで、
https://github.com/project-codeflare/codeflare-sdk.git
と入力し、Clone をクリックします。codeflare-sdk
リポジトリーは左側のナビゲーションペインに一覧表示されます。
以下の例のように分散ワークロードジョブを実行します。
- JupyterLab インターフェイスで、左側のナビゲーションペインで codeflare-sdk をダブルクリックします。
- demo-notebooks をダブルクリックし、次に guided-demos をダブルクリックします。
各サンプルデモノートブックを次のように更新します。
- サンプルコミュニティーイメージへのリンクは、Ray クラスターイメージへのリンクに置き換えます。
-
instascale
はFalse
に設定します。InstaScale は、分散ワークロード機能のテクノロジープレビューバージョンにはデプロイされません。
- ノートブックを実行します。
検証
ノートブックはエラーなしで完了するまで実行されます。ノートブックでは、cluster.status()
関数または cluster.details()
関数からの出力は、Ray クラスターが Active
であることを示します。