5.2. モニタリング UI プラグイン
Cluster Observability Operator のモニタリング UI プラグインは、テクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
モニタリング UI プラグインは、OpenShift Web コンソールの Administrator パースペクティブにモニタリング機能を追加します。
- RHACM: Cluster Observability Operator (COO) のモニタリングプラグインは、Red Hat Advanced Cluster Management (RHACM) 環境で動作し、RHACM に OpenShift Container Platform と同じアラート機能を提供します。このプラグインは、RHACM Alertmanager バックエンドからアラートを取得するように設定できます。これにより、RHACM と OpenShift Container Platform のモニタリングワークフローを連携させることで、シームレスな統合とユーザーエクスペリエンスを実現できます。
インシデント検出: インシデント検出機能は、関連するアラートをインシデントにグループ化します。個々のアラートに圧倒されることなく、アラート急増の根本原因を特定するのに役立ちます。重大度別に色分けされたインシデントのタイムラインが表示され、インシデント内の個々のアラートを詳しく分析できます。また、影響を受けるコンポーネントごとに、重大度別にアラートがグループ化されます。これにより、最も重要な領域に最初から集中できます。
インシデント検出機能は、OpenShift Web コンソールの Administrator パースペクティブの Observe
Incidents で利用できます。
5.2.1. Cluster Observability Operator のモニタリング UI プラグインのインストール
モニタリング UI プラグインは、Advance Cluster Management (ACM) での表示とインシデント検出のために、OpenShift Web コンソールにモニタリング関連の UI 機能を追加します。
前提条件
-
cluster-admin
クラスターロールを持つユーザーとしてクラスターにアクセスできる。 - OpenShift Container Platform Web コンソールにログインしている。
- Cluster Observability Operator がインストールされている。
手順
-
OpenShift Container Platform Web コンソールで、Operator
Installed Operator をクリックし、Cluster Observability Operator を選択します。 - UI Plugin タブ (タブリストの右端) を選択し、Create UIPlugin を押します。
YAML view を選択し、次の内容を入力して、Create を押します。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow apiVersion: observability.openshift.io/v1alpha1 kind: UIPlugin metadata: name: monitoring spec: type: Monitoring monitoring: acm: enabled: true alertmanager: url: 'https://alertmanager.open-cluster-management-observability.svc:9095' thanosQuerier: url: 'https://rbac-query-proxy.open-cluster-management-observability.svc:8443' incidents: enabled: true
apiVersion: observability.openshift.io/v1alpha1 kind: UIPlugin metadata: name: monitoring spec: type: Monitoring monitoring: acm:
1 enabled: true alertmanager: url: 'https://alertmanager.open-cluster-management-observability.svc:9095' thanosQuerier: url: 'https://rbac-query-proxy.open-cluster-management-observability.svc:8443' incidents:
2 enabled: true
5.2.2. Cluster Observability Operator のインシデント検出の概要
クラスターは大量のモニタリングデータを生成することがあります。その場合、重要なシグナルとノイズを区別することが困難になります。1 つのインシデントによって一連のアラートがトリガーされると、問題の検出と解決に時間がかかります。
Cluster Observability Operator のインシデント検出機能は、関連するアラートをいくつかの インシデント にグループ化します。これらのインシデントは、重大度別に色分けされたタイムラインの形で視覚化されます。アラートは特定のコンポーネントにマッピングされ、重大度別にグループ化されます。これにより、影響度の高いコンポーネントに最初から注目して根本原因を特定できます。その後、インシデントのタイムラインから個々のアラートまで詳しく分析して、根本的な問題を解決する方法を決定できます。
Cluster Observability Operator のインシデント検出は、大量のアラートを明確な手順に変換し、クラスターで発生するインシデントをより迅速に把握して解決できるようにします。
5.2.3. Cluster Observability Operator のインシデント検出の使用
前提条件
-
cluster-admin
クラスターロールを持つユーザーとしてクラスターにアクセスできる。 - OpenShift Container Platform Web コンソールにログインしている。
- Cluster Observability Operator がインストールされている。
- Cluster Observability Operator のモニタリング UI プラグインを、インシデント検出を有効にしてインストールした。
手順
-
Web コンソールの Administrator パースペクティブで、Observe
Incidents をクリックします。 インシデントタイムライン UI に、アラートが インシデント にグループ化されて表示されます。グラフ内の線の色分けは、インシデントの重大度に対応しています。デフォルトでは、7 日間のタイムラインが表示されます。
注記インシデント検出を有効にした後、相関関係を処理してタイムラインを表示するのに、少なくとも 10 分かかります。
インシデントの分析とグループ化は、この機能を有効にした後に発生したアラートに対してのみ実行されます。機能の有効化前に解決されたアラートは対象外です。
ドロップダウンをクリックして期間を指定し、1 日間のビューにズームインします。
インシデントをクリックすると、そのインシデントの一部であるアラートのタイムラインがアラートタイムライン UI に表示されます。
次のアラートのリストでは、アラートが特定のコンポーネントにマッピングされ、重大度別にグループ化されています。
リスト内のコンピュートコンポーネントをクリックして展開します。そのコンポーネントに関連する基礎となるアラートが表示されます。
- アラートのリンクをクリックしてアラートの詳細情報を表示します。
既知の問題
- タイムラインバーの順序によっては、ツールヒントが重なり合って、下にあるバーが隠れてしまう場合があります。その場合も、バーをクリックしてインシデントまたはアラートを選択することはできます。