第1章 Cluster Observability Operator リリースノート
Cluster Observability Operator (COO) は、オプションの OpenShift Container Platform Operator です。管理者はこれを使用して、さまざまなサービスやユーザーが使用できるように個別に設定できる、スタンドアロンのモニタリングスタックを作成できます。
COO は、OpenShift Container Platform のビルトインモニタリング機能を補完します。これは、Cluster Monitoring Operator (CMO) で管理されるデフォルトのプラットフォームおよびユーザーワークロードモニタリングスタックと並行してデプロイできます。
これらのリリースノートは、OpenShift Container Platform での Cluster Observability Operator の開発を追跡します。
次の表に、Cluster Observability Operator と OpenShift Container Platform のバージョンに応じて利用可能な機能に関する情報を示します。
| COO のバージョン | OCP のバージョン | 分散トレーシング | ロギング | トラブルシューティングパネル | ACM アラート | インシデント検出 |
|---|---|---|---|---|---|---|
| 1.1 以降 | 4.12 - 4.14 | ✔ | ✔ | ✘ | ✘ | ✘ |
| 1.1 以降 | 4.15 | ✔ | ✔ | ✘ | ✔ | ✘ |
| 1.1 以降 | 4.16 - 4.18 | ✔ | ✔ | ✘ | ✔ | ✘ |
| 1.2 以降 | 4.19 以降 | ✔ | ✔ | ✔ | ✔ | ✔ |
OpenShift Container Platform 4.19 以降、Web コンソールのパースペクティブが統合されました。Developer パースペクティブは、デフォルトでは有効になっていません。
すべてのユーザーは、OpenShift Container Platform Web コンソールのすべての機能を操作できます。ただし、クラスター所有者でない場合は、特定の機能に対する権限をクラスター所有者に要求する必要がある場合があります。
引き続き Developer パースペクティブを有効にできます。Web コンソールの Getting Started ペインでは、コンソールツアーの実行、クラスター設定に関する情報の検索、Developer パースペクティブを有効にするためのクイックスタートの表示、リンク先を表示して新機能の確認などを行えます。
1.1. Cluster Observability Operator 1.3 リンクのコピーリンクがクリップボードにコピーされました!
Cluster Observability Operator 1.3 では、次のアドバイザリーを利用できます。
1.1.1. 新機能および機能拡張 リンクのコピーリンクがクリップボードにコピーされました!
- インシデント検出機能が一般提供になりました
Cluster Observability Operator のインシデント検出機能が、OpenShift Container Platform バージョン 4.19 以降のリリースで一般提供 (GA) ステータスになりました。インシデント検出機能は、関連するアラートをインシデントにグループ化することで、オブザーバビリティーを簡素化します。これにより、アラート疲れが軽減され、問題の根本原因に集中できるようになります。一般提供 (GA) ステータスへの移行に伴い、インシデント検出機能は、実稼働環境に対応し、エンタープライズデプロイメントで完全にサポートされるようになりました。ユーザーは、モニタリング
UIPluginのリソースを通じて、spec.monitoring.incidents.enabled: trueを設定することによりインシデント検出を有効にできます。詳細は、インシデント検出 を参照してください。
- インシデントビューがサイレント化されたアラートをサポートするようになりました
このリリースでは、モニタリング UI プラグインのインシデントビューで、サイレント化されたアラートがサポートされています。サイレント化されたアラートは、インシデント検出 UI では
Silencedというstateとともに表示され、タイムラインでは明るい色で表示されます。これにより、アクティブなアラートと区別し、クラスターのオブザーバビリティーシグナルの完全な状態を把握できるようになります。- トラブルシューティング機能が一般提供になりました
Cluster Observability Operator のトラブルシューティング機能は、本リリースでは、OpenShift Container Platform バージョン 4.19 以降、一般公開(GA)ステータスに到達し、以前のバージョンではサポートされていません。トラブルシューティング UI プラグインは、オープンソースの Korrel8r プロジェクトが提供するオブザーバビリティーシグナル相関付け機能を提供します。トラブルシューティングパネルを使用すると、さまざまなデータストア全体のメトリクス、ログ、アラート、ネットフロー、その他のオブザーバビリティーシグナルおよびリソースを簡単に相関付けることができます。
詳細は、トラブルシューティング UI プラグイン を参照してください。
- ObservabilityInstaller カスタムリソースによるエンドツーエンドオブザーバビリティー
-
Cluster Observability Operator は、最小限の設定でエンドツーエンドのオブザーバビリティーをデプロイするための
ObservabilityInstallerカスタムリソースを、テクノロジープレビュー機能として提供します。ObservabilityInstallerカスタムリソースは、Operator のインストール、ストレージ設定、UI 統合を自動的に管理することで、ロギング、トレーシング、OpenTelemetry 機能のデプロイを簡素化します。
1.1.2. バグ修正 リンクのコピーリンクがクリップボードにコピーされました!
- トラブルシューティングパネルが OpenShift Container Platform 4.19 のアラート URL を正しく処理するようになりました
この更新の前に、OpenShift Container Platform 4.19 でアラート URL の形式が変更されました。これにより、一部の URL にアラート名が含まれなくなり、コンソール内部用の数値 ID のみが含まれるようになりました。その結果、korrel8r トラブルシューティングパネルがこれらの URL を正しく処理できず、アラートを関連リソースと関連付けることができなくなりました。
このリリースでは、korrel8r は数値 ID のみを含む URL を含め、OpenShift Container Platform 4.19 からのアラート URL を正しく処理します。その結果、トラブルシューティングパネルは、OpenShift Container Platform 4.19 クラスター上のすべてのアラートタイプに対応して正常に機能するようになりました。
- モニタリング
UIPluginの設定が Operator のアップグレード後も維持されます この更新前は、Cluster Observability Operator をバージョン 1.2.0 から 1.2.1 以降にアップグレードすると、アップグレードプロセス中にモニタリング
UIPluginの設定が削除されていました。UIPluginの spec が空になり、プラグインタイプのみが表示され、RHACM 統合設定、Perses ダッシュボード、インシデント管理設定などの設定の詳細がすべて失われていました。その結果、アップグレード後にユーザーがモニタリングダッシュボードやモニタリング機能にアクセスできなくなりました。また、Operator がmonitoring configuration can not be empty for plugin type Monitoringというエラーをログに記録していました。このリリースでは、Cluster Observability Operator はアップグレード時にモニタリング
UIPluginの設定を正しく保持します。そのため、Operator のアップグレード後も、モニタリングダッシュボード、RHACM 統合、およびインシデント管理機能を、手動で再設定することなく引き続き利用できます。UIPluginのステータスがすべてのリコンシリエーションシナリオで正しく更新されますこの更新前は、
UIPluginのコントローラーが、すべてのリコンシリエーションシナリオで、カスタムリソースのステータスフィールドを更新していませんでした。コントローラーはリコンシリエーションエラーの発生時にステータスの更新に失敗していました。そのため、設定の変更が適用されていない場合でも、ステータスが成功と報告されていました。その結果、ユーザーはステータスフィールドを通じてUIPluginリソースの状態を正確に確認することができず、問題をデバッグするために世代フィールドや Operator ログを確認する必要がありました。このリリースでは、Cluster Observability Operator は、エラー発生時を含むすべてのリコンシリエーションシナリオで、
UIPluginのステータスを正しく更新します。そのため、ユーザーはUIPluginのステータスフィールドがリソースの現在の状態を正確に反映していると信頼できるようになり、設定の問題をより効果的にトラブルシューティングできます。- 分散トレーシング
UIPluginが TraceQL クエリーの二重引用符を処理するようになりました この更新前は、COO 1.2.2 の分散トレーシング
UIPluginが、TraceQL クエリー式の二重引用符を適切に処理していませんでした。属性値に二重引用符が含まれている場合 (HTTP ルート属性の正規表現パターンなど)、クエリーパーサーが失敗していました。そのため、ユーザーはユーザーインターフェイスのドロップダウンメニューからこのような値を選択しても、二重引用符を含む属性を持つトレースを照会できませんでした。このリリースでは、Red Hat OpenShift Cluster Observability Operator 分散トレーシングコンソールプラグインは、属性値に二重引用符が含まれている TraceQL クエリーを正しく処理します。その結果、ユーザーは、二重引用符などの特殊文字が含まれている属性値を含め、任意の属性値を使用してトレースを照会できるようになりました。
- トラブルシューティングパネルがデプロイされている場合にのみ、ロギングビュープラグインが korrel8r に通信を転送します
この更新前は、トラブルシューティングパネル
UIPluginがデプロイされていない場合でも、COO 1.2.1 のロギングビュープラグインにより、korrel8r サービスにトラフィックを転送するように Red Hat OpenShift Cluster Observability Operator コンソールが設定されていました。コンソールは存在しないサービスに接続しようとしていたため、アクセス拒否エラーが発生していました。その結果、ログビューで "Missing permissions to get logs" というエラーメッセージが表示されていました。このエラーは、ユーザーの介入なしに 30 - 60 秒後に自動的に解決されていました。このリリースでは、トラブルシューティングパネル
UIPluginがデプロイされている場合にのみ、Cluster Observability Operator はロギングビュープラグインで korrel8r のプロキシーを設定します。その結果、トラブルシューティングパネルを使用せずにログを表示するときに、誤った権限エラーが発生しなくなりました。- 分散トレーシングの検索フィールドがキーボードナビゲーションをサポートするようになりました
この更新前は、分散トレーシングコンソールプラグインの検索フィールドが、キーボードのみのナビゲーションをサポートしていませんでした。ユーザーがフィルター値を入力し、
Enterキーを押して選択しても、フィルターが適用されずにページがテナント選択画面にリセットされていました。その結果、キーボードのみを使用するユーザーは、サービス名やその他の属性でトレースをフィルタリングすることができず、マウスを使用して選択する必要がありました。このリリースでは、Red Hat OpenShift Cluster Observability Operator 分散トレーシングコンソールプラグインが、検索フィールドの
Enterキーを正しく処理するようになりました。その結果、ユーザーはキーボードのみのナビゲーションを使用してトレースフィルターを適用できるようになり、アクセシビリティーが向上しました。UIPlugin設定を変更すると無効な機能の Pod が削除されますこの更新前は、COO 1.2.1 の
UIPluginコントローラーは、ユーザーが設定を更新したときに無効な機能の Pod を削除しませんでした。ユーザーがUIPlugin仕様でperses.enabled: falseまたはincidents.enabled: falseを設定しても、関連付けられている Pod (perses-0 および health-analyzer) が引き続き実行されていました。その結果、ユーザーは Perses ダッシュボードやインシデント機能を無効にできず、無効にしたはずのコンポーネントがクラスターリソースを消費し続けていました。このリリースでは、Cluster Observability Operator は、
UIPlugin設定で機能が無効になっている場合に Pod を正しく削除します。そのため、ユーザーはUIPlugin仕様を更新することで、Perses およびインシデント機能を有効または無効にでき、それに応じて関連する Pod が作成または削除されます。