4.3. 高可用性
高可用性とは、コンポーネントサービスで障害から迅速に回復する Service Telemetry Framework (STF) の機能です。Red Hat OpenShift Container Platform (OCP) は、ワークロードをスケジュールするノードが利用可能な場合に、障害のある Pod を再起動しますが、この復旧プロセスではイベントとメトリクスが失われる可能性があります。高可用性設定には、複数の STF コンポーネントのコピーが含まれており、復旧時間が約 2 秒に短縮されます。OCP ノードを障害から保護するには、3 つ以上のノードが含まれる OCP クラスターに STF をデプロイします。
STF はまだ完全な耐障害性システムではありません。復旧期間中のメトリクスやイベントの配信は保証されません。
高可用性を有効にすると、以下のような効果があります。
- 2 つの AMQ Interconnect Pod がデフォルト 1 ではなく実行されます。
- 3 つの ElasticSearch Pod はデフォルト 1 ではなく実行されます。
- これらのサービスのいずれかで失われた Pod からの復旧時間は、約 2 秒減らします。
4.3.1. 高可用性の設定
高可用性に STF を設定するには、OCP の ServiceTelemetry オブジェクトに highAvailabilityEnabled: true
を追加します。このパラメーターはインストール時に設定できます。またはすでに STF をデプロイしている場合には、以下の手順を実行します。
手順
- Red Hat OpenShift Container Platform にログインします。
service-telemetry
namespace に切り替えます。oc project service-telemetry
oc コマンドで ServiceTelemetry オブジェクトを編集します。
$ oc edit ServiceTelemetry
highAvailabilityEnabled: true
をspec
セクションに追加します。spec: eventsEnabled: true metricsEnabled: true highAvailabilityEnabled: true
- 変更内容を保存し、オブジェクトを閉じます。