第1章 Cluster Observability Operator リリースノート
Cluster Observability Operator (COO) は、オプションの OpenShift Container Platform Operator です。管理者はこれを使用して、さまざまなサービスやユーザーが使用できるように個別に設定できる、スタンドアロンのモニタリングスタックを作成できます。
COO は、OpenShift Container Platform のビルトインモニタリング機能を補完します。これは、Cluster Monitoring Operator (CMO) で管理されるデフォルトのプラットフォームおよびユーザーワークロードモニタリングスタックと並行してデプロイできます。
これらのリリースノートは、OpenShift Container Platform での Cluster Observability Operator の開発を追跡します。
次の表に、Cluster Observability Operator と OpenShift Container Platform のバージョンに応じて利用可能な機能に関する情報を示します。
| COO のバージョン | OCP のバージョン | 分散トレーシング | ロギング | トラブルシューティングパネル | ACM アラート | インシデント検出 |
|---|---|---|---|---|---|---|
| 1.1 以降 | 4.12 - 4.14 | ✔ | ✔ | ✘ | ✘ | ✘ |
| 1.1 以降 | 4.15 | ✔ | ✔ | ✘ | ✔ | ✘ |
| 1.1 以降 | 4.16 - 4.18 | ✔ | ✔ | ✔ | ✔ | ✘ |
| 1.2 以降 | 4.19 以降 | ✔ | ✔ | ✔ | ✔ | ✔ |
OpenShift Container Platform 4.19 以降、Web コンソールのパースペクティブが統合されました。Developer パースペクティブは、デフォルトでは有効になっていません。
すべてのユーザーは、OpenShift Container Platform Web コンソールのすべての機能を操作できます。ただし、クラスター所有者でない場合は、クラスター所有者に特定の機能に対するパーミッションを要求する必要がある場合があります。
引き続き Developer パースペクティブを有効にできます。Web コンソールの Getting Started ペインでは、コンソールツアーの実行、クラスター設定に関する情報の検索、Developer パースペクティブを有効にするためのクイックスタートの表示、リンク先を表示して新機能の確認などを行えます。
1.1. Cluster Observability Operator 1.3 リンクのコピーリンクがクリップボードにコピーされました!
Cluster Observability Operator 1.3 では、次のアドバイザリーを利用できます。
1.1.1. 新機能および機能拡張 リンクのコピーリンクがクリップボードにコピーされました!
- インシデント検出機能が一般提供に達する
Cluster Observability Operator のインシデント検出機能は、OpenShift Container Platform バージョン 4.19 以降では、本リリースで一般公開(GA)ステータスに到達します。インシデント検出は、関連するアラートをインシデントにグループ化することで、可観測性を簡素化します。これにより、アラートのファトを軽減し、問題の根本原因に集中できるようになります。General Availability (GA)ステータスでは、インシデント検出機能は実稼働環境対応となり、エンタープライズデプロイメントで完全にサポートされます。ユーザーは、
spec.monitoring.incidents.enabled: trueを設定して、モニタリングUIPluginリソースでインシデント検出を有効にできます。詳細は、インシデント検出を参照してください。
- インシデントビューはサイレンスにされたアラートをサポートします
モニタリング UI プラグインのインシデントビューは、本リリースで通知なしのアラートをサポートします。サイレンスにされたアラートは、インシデント検出 UI で
Silencedの状態で表示され、タイムラインで軽量色で表示されます。これにより、それらをアクティブなアラートと区別し、クラスターの可観測性シグナルの完全な状態を理解するのに役立ちます。- トラブルシューティングが一般公開(GA)に達したこと
Cluster Observability Operator のトラブルシューティング機能は、OpenShift Container Platform バージョン 4.19+ では、本リリースで一般公開(GA)ステータスに到達します。トラブルシューティング UI プラグインは、オープンソースの Korrel8r プロジェクト がサポートする可観測性シグナルの相関を提供します。トラブルシューティングパネルを使用すると、さまざまなデータストア間でメトリクス、ログ、アラート、ネットフロー、追加の可観測性シグナルおよびリソースを簡単に関連付けることができます。
詳細は、UI プラグインのトラブルシューティングを参照してください。
- ObservabilityInstaller カスタムリソースを使用したエンドツーエンドの可観測性
-
Cluster Observability Operator は、テクノロジープレビュー機能として最小限の設定でエンドツーエンドの可観測性をデプロイするための
ObservabilityInstallerカスタムリソースを提供します。ObservabilityInstallerカスタムリソースは、Operator のインストール、ストレージ設定、および UI 統合を自動的に管理することで、ロギング、トレース、および OpenTelemetry 機能のデプロイを簡素化します。
1.1.2. バグ修正 リンクのコピーリンクがクリップボードにコピーされました!
- トラブルシューティングパネルが OpenShift Container Platform 4.19 アラート URL を正しく処理する
この更新の前は、OpenShift Container Platform 4.19 では、一部の URL にアラート名のないコンソール内部数値 ID のみが含まれていたアラート URL 形式に変更が導入されました。そのため、korrel8r のトラブルシューティングパネルは、これらの URL を正しく処理できず、アラートを関連リソースに関連付けることができませんでした。
このリリースでは、korrel8r は、数値識別子のみを含む URL を含む OpenShift Container Platform 4.19 のアラート URL を正しく処理します。その結果、トラブルシューティングパネルは OpenShift Container Platform 4.19 クラスターのすべてのアラートタイプで正しく機能します。
UIPluginモニタリング設定は、Operator のアップグレード後も持続します。今回の更新以前は、Cluster Observability Operator をバージョン 1.2.0 から 1.2.1 以降にアップグレードする際に、monitoring
UIPlugin設定がアップグレードプロセス時に削除されました。UIPlugin仕様は空になり、RHACM 統合設定、Perses ダッシュボード、インシデント管理設定など、すべての設定の詳細が失われている間にプラグインタイプのみが表示されるようになりました。その結果、ユーザーはアップグレード後にモニタリングダッシュボードと機能にアクセスできず、プラグインタイプ Monitoring については Operator が監視設定を空にできないというエラーが記録されませんでした。今回のリリースにより、Cluster Observability Operator は、アップグレード中に
UIPlugin設定の監視を正しく保持するようになりました。その結果、監視ダッシュボード、RHACM 統合、およびインシデント管理機能は、Operator を手動で再設定しなくても、Operator のアップグレード後も引き続き使用できます。UIPluginステータスがすべての調整シナリオで正しく更新される今回の更新以前は、
UIPluginコントローラーはすべての調整シナリオのカスタムリソース status フィールドを更新しませんでした。調整エラーが発生したときにコントローラーがステータスの更新に失敗し、設定の変更が適用されていなくてもステータスが success と報告されていました。そのため、ユーザーは status フィールドを介してUIPluginリソースの状態を正確に判別できず、生成フィールドまたは Operator のログを確認して問題をデバッグする必要がありました。このリリースでは、Cluster Observability Operator は、エラー状態を含む、すべての調整シナリオで
UIPluginステータスを正しく更新します。その結果、ユーザーはUIPluginステータスフィールドを使用して、リソースの現在の状態を正確に反映し、設定の問題をより効率的にトラブルシューティングできます。- 分散トレース
UIPluginは TraceQL クエリーで二重引用符を処理します。 この更新の前は、COO 1.2.2 の分散トレース
UIPluginは、TraceQL クエリー式で二重引用符を適切に処理しませんでした。HTTP ルート属性の正規表現パターンなど、属性値に二重引用符が含まれる場合にクエリーパーサーが失敗しました。そのため、ユーザーインターフェイスのドロップダウンメニューからこれらの値が選択されている場合でも、ユーザーは二重引用符を含む属性を含むトレースをクエリーできませんでした。このリリースでは、Red Hat OpenShift Cluster Observability Operator 分散トレースコンソールプラグインは、属性値に二重引用符を含む TraceQL クエリーを正しく処理するようになりました。その結果、ユーザーは二重引用符などの特殊文字を含む任意の属性値でトレースにクエリーを実行できます。
- トラブルシューティングパネルがデプロイされている場合にのみ、ログビュープラグインプロキシーを korrel8r へ
この更新の前に、COO 1.2.1 のロギングビュープラグインは、トラブルシューティングパネル
UIPluginがデプロイされていない場合でも、Red Hat OpenShift Cluster Observability Operator コンソールがトラフィックを korrel8r サービスにプロキシーするように設定していました。コンソールが存在しないサービスに接続しようとしたため、permission denied エラーが発生していました。その結果、ロギングビューで一時的な "Missing permissions to get logs" エラーメッセージが見られました。これは、ユーザーの介入なしに 30 ~ 60 秒後に解決されます。このリリースでは、Cluster Observability Operator は、トラブルシューティングパネル
UIPluginがデプロイされているときに、ロギングビュープラグインで korrel8r プロキシーのみを設定します。その結果、トラブルシューティングパネルなしでログを表示するときに、ユーザーが誤ったパーミッションエラーが発生しなくなりました。- 分散トレース検索フィールドはキーボードナビゲーションをサポートします。
この更新の前は、分散トレースコンソールプラグインの検索フィールドは、キーボードのみのナビゲーションをサポートしていませんでした。ユーザーがフィルター値を
入力し、Enter を押して選択すると、ページはフィルターを適用せずにテナント選択画面にリセットされます。その結果、キーボードのみのユーザーは、サービス名やその他の属性でトレースをフィルタリングできず、マウスベースの選択を強制的に使用していました。このリリースでは、Red Hat OpenShift Cluster Observability Operator 分散トレースコンソールプラグインが検索フィールドの
Enterキーを正しく処理するようになりました。その結果、ユーザーはキーボードのみのナビゲーションを使用してトレースフィルターを適用し、アクセシビリティーが向上します。UIPlugin設定の変更により無効にされた機能 Pod が削除されるこの更新の前は、ユーザーが設定を更新すると、COO 1.2.1 の
UIPluginコントローラーは無効にされた機能の Pod を削除しませんでした。UIPlugin仕様でperses.enabled: falseまたはincidents.enabled: falseを設定すると、関連付けられた Pod (perses-0 および health-analyzer)は実行を継続します。そのため、ユーザーは Perses ダッシュボードまたはインシデント機能を無効にできず、無効にされたコンポーネントは引き続きクラスターリソースを消費していました。このリリースでは、
UIPlugin設定で機能が無効になっていると、Cluster Observability Operator が Pod を正しく削除します。その結果、UIPlugin仕様を更新すると、Perses および incidents 機能を有効または無効にすることができ、関連付けられた Pod はそれに応じて作成または削除されます。