第10章 ジョブの起動
ジョブを作成したら、ジョブを起動して、OpenStack Data Processing サービスに登録されているデータを処理できます( 「入出力データソースの登録」 を参照)。ジョブにはクラスターが必要です。既存のクラスター(「既存クラスターでのジョブの起動」)でジョブを起動するか、完全に新しいクラスター(「新規クラスターでのジョブの起動」)でジョブを起動できます。
ジョブを起動するには、入力データソースと出力データの宛先を指定する必要があります。どちらのオブジェクトも、最初に OpenStack Data Processing サービスに登録する必要があります。詳細は、「入出力データソースの登録」 を参照してください。
10.1. 既存クラスターでのジョブの起動
Dashboard で既存クラスターの一覧を表示するには、Project > Data Processing > Clusters の順 に選択します。クラスターの起動方法は、8章クラスターの起動 を参照してください。
既存クラスターでジョブを起動するには、以下を実行します。
- Dashboard で プロジェクト > データ処理 > ジョブ を選択します。ジョブテーブルに は、利用可能なすべてのジョブテンプレートが表示されます。新規ジョブテンプレートの作成に関する詳細は、「ジョブテンプレートの作成」 を参照してください。
- 使用するジョブテンプレートを選択してから、ジョブテンプレートの Actions ドロップダウンメニューから Launch On Existing Cluster を選択します。
Launch Job ウィザードで、Input ドロップダウンメニューから入力データソースを選択します。次に、Output ドロップダウンメニューから出力先を選択します。
必要に応じて、ここから入力データソースまたは出力先を登録することもできます。これを行うには、Input または Output ドロップダウンメニューで + をクリックします。これにより、Create Data Source ウィザードが開きます。詳細は、「入出力データソースの登録」 を参照してください。
- Cluster ドロップダウンメニューから、ジョブを実行するクラスターを選択します。
このジョブに特別なジョブプロパティーを設定する必要がある場合は、Configure タブをクリックします。そこから、Configuration または Parameters のどちらかの Add をクリックして、特別な名前と値のペアを指定します。このタブでは、複数の名前と値のペアを指定できます。
サポートされるジョブプロパティーの詳細については、選択したHadoop プラグインのドキュメントを参照してください。
- Launch をクリックします。
起動したジョブのステータスを表示するには、プロジェクト > Data Processing > Jobs を選択します。起動済みのジョブの再起動または削除方法については、「起動したジョブの削除または再起動」 を参照してください。