第1章 概要
OpenStack Data Processing サービス(sahara)は、easy クラスターを簡単にプロビジョニングおよびスケーリングするための強力なインターフェースを提供します。その後、このようなクラスターは、通常は大規模なデータセットを処理するのに、リソース集約型のジョブを実行するために使用できます。OpenStack のコンポーネントとして、OpenStack Data Processing は OpenStack のエコシステムに完全に統合されます。たとえば、ユーザーは OpenStack ダッシュボードでクラスターを構成することで、クラスターを設定し、それらでジョブを起動し、実行するすべての方法により、個々のデータ処理ワークフロー全体を管理できます。
Hadoop の詳細は、http://hadoop.apache.org/ を参照してください。
Data Processing サービス(sahara)は OpenStack Platform バージョン 15 で非推奨となり、バージョン 16 で削除される予定です。
OpenStack Data Processing は、各 Hadoop ディストリビューションの特定クラスターをプロビジョニングするために異なるプラグインを使用します。クラスターの設定に使用できる Hadoop パラメーターは、Hadoop ディストリビューション(およびその拡張で使用されるプラグイン)によって異なります。本リリース(Red Hat OpenStack Platform 15)の時点で、OpenStack Data Processing は以下のプラグインをサポートします。
Cloudera(CDH)
- バージョン 5.7.x (デフォルトは 5.7.0)
- バージョン 5.9.x (デフォルトは 5.9.0)
- バージョン 5.11.x (デフォルトは 5.11.0)
- バージョン 5.13.x (デフォルトは 5.13.0)
Hortonworks Data Platform
- MapR 5.2
OpenStack Data Processing には Guides タブも含まれます。このタブ機能ウィザードは、クラスターを起動し、それらでジョブを実行するために必要なテンプレートの作成に役立ちます。ただし、ovn イメージやジョブバイナリーなどの OpenStack Data Processing を使用するために必要なコンポーネントを引き続き登録する必要があります。そのため、Guides 機能を使用する場合は、最初に 5章必要なコンポーネントの登録 を読むことが推奨されます。