5.13. 可観測性
Red Hat Advanced Cluster Management (RHACM) のマルチクラスターエンジンの可観測性コンポーネントは、すべてのマネージドクラスターのメトリクスとアラートを、一元的に集約して視覚化します。この監視サービスでは、パフォーマンスとデータ分析のバランスをとるために、ダウンサンプリングにより収集頻度を下げて集約された一部のメトリクスのリストを保持しています。ハブのメトリクスには、事前設定されたさまざまなダッシュボードからアクセスできます。
- 可観測性のインストール
可観測性サービスを有効にして設定するための主な CR は、
MulticlusterObservability
CR です。この CR では、次の設定が定義されています。- 設定可能な保持設定
-
さまざまなコンポーネント (
thanos receive
、thanos compact
、thanos rule
、thanos store
シャーディング、alertmanager
) のストレージ マネージドクラスターの監視設定の調整を可能にする
metadata.annotations.mco-disable-alerting="true"
アノテーション注記この設定がない場合、可観測性コンポーネントがマネージドクラスターの監視設定の実行を試みます。上記の値を設定すると、希望の設定と、アラート転送に必要な可観測性設定を、マネージドクラスター監視用の
ConfigMap
オブジェクトにマージできます。可観測性サービスが有効な場合、RHACM は各マネージドクラスターにワークロードをデプロイし、ローカルのモニタリングによって生成されたメトリクスとアラートをハブクラスターにプッシュします。マネージドクラスターからハブに転送されるメトリクスとアラートは、open-cluster-management-addon-observability
namespace のConfigMap
CR によって定義されます。カスタムメトリクスを指定することもできます。詳細は、カスタムメトリクスの追加 を参照してください。
- Alertmananger の設定
- ハブクラスターは、メールなどの外部システムにアラートをプッシュするように設定できる Observability Alertmanager を備えています。Alertmanager はデフォルトで有効になっています。
- アラート転送を設定する必要があります。
- Alertmanager が有効になっているが設定されていない場合、ハブの Alertmanager はアラートを外部に転送しません。
- 可観測性が有効な場合、ハブの Alertmanager を含む任意のエンドポイントにアラートを送信するようにマネージドクラスターを設定できます。
- マネージドクラスターがアラートを外部ソースに転送するように設定されている場合、アラートはハブクラスター Alertmanager を経由してルーティングされません。
- アラートの状態はメトリクスとして利用できます。
- 可観測性が有効な場合、マネージドクラスターのアラートの状態は、ハブクラスターに転送されるメトリクスの一部に含まれ、可観測性ダッシュボードを通じて提供されます。
- 制限と要件
- 可観測性には、長期間のメトリクス用に永続的なオブジェクトストレージが必要です。詳細は、「ストレージ要件」を参照してください。
- エンジニアリングに関する考慮事項
-
メトリクスの転送は、すべてのメトリクスデータの一部だけが対象です。これには、
observability-metrics-allowlist
config map で定義されたメトリクスと、ユーザーが追加したカスタムメトリクスのみが含まれます。 -
メトリクスはダウンサンプリングにより頻度を下げて転送されます。メトリクスは、5 分間隔 (または
MultiClusterObservability
CR 設定で定義された間隔) で最新のデータポイントを取得して転送されます。 - ネットワークが停止すると、その期間中にハブクラスターに転送されたメトリクスが失われる可能性があります。この問題は、マネージドクラスターからプロバイダーネットワーク内の外部メトリクスコレクターにメトリクスを直接転送すれば、軽減されます。フル分解能のメトリクスは、マネージドクラスターで利用できます。
- ハブのデフォルトのメトリクスダッシュボードに加えて、ユーザーはカスタムダッシュボードを定義できます。
- リファレンス設定は、3500 個のシングルノード OpenShift クラスターのハブクラスターによる 15 日間分のメトリクスを保存する前提でサイズが設定されています。より長い保持期間、またはその他のマネージドクラスタートポロジーやサイズ設定が必要な場合は、ストレージ計算を更新し、十分なストレージ容量を維持する必要があります。新しい値の計算の詳細は、「ストレージ要件」を参照してください。
-
メトリクスの転送は、すべてのメトリクスデータの一部だけが対象です。これには、