第1章 可観測性について
Red Hat OpenShift Observability は、さまざまなシステムメトリクス、ログ、トレース、イベントのリアルタイムの可視性、モニタリング、分析を提供し、問題がシステムやアプリケーションに影響を与える前に、ユーザーが問題を迅速に診断してトラブルシューティングできるようにします。アプリケーションとインフラストラクチャーの信頼性、パフォーマンス、セキュリティーを確保するために、OpenShift Container Platform は次の監視コンポーネントを提供します。
- モニタリング
- ロギング
- 分散トレーシング
- Red Hat build of OpenTelemetry
- Network Observability
- パワーモニタリング
Red Hat OpenShift Observability は、オープンソースの可観測性ツールとテクノロジーを接続して、統合された可観測性ソリューションを作成します。Red Hat OpenShift Observability のコンポーネントは連携して、データの収集、保存、配信、分析、視覚化を支援します。
モニタリングを除き、Red Hat OpenShift Observability コンポーネントには、コア OpenShift Container Platform リリースサイクルとは別の明確なリリースサイクルがあります。リリースの互換性は、Red Hat OpenShift Operator ライフサイクル ページを参照してください。
1.1. モニタリング
CPU とメモリーの使用状況、ネットワーク接続、その他のリソースの使用状況に関するメトリクスとカスタマイズされたアラートを使用して、OpenShift Container Platform 上で実行しているアプリケーションのクラスター内の健全性とパフォーマンスを監視します。モニタリングスタックコンポーネントは、Cluster Monitoring Operator によってデプロイおよび管理されます。
モニタリングスタックコンポーネントは、すべての OpenShift Container Platform インストールにデフォルトでデプロイされ、Cluster Monitoring Operator (CMO) により管理されます。これらのコンポーネントには、Prometheus、Alertmanager、Thanos Querier などが含まれます。CMO は、プラットフォーム Prometheus インスタンスから Red Hat にデータのサブセットを送信してクラスターの Remote Health Monitoring を容易にする Telemeter クライアントも導入します。
詳細は、モニタリングの概要 および リモートヘルスモニタリングについて を参照してください。
1.2. ロギング
ログデータを収集、視覚化、転送、保存して、問題のトラブルシューティング、パフォーマンスのボトルネックの特定、セキュリティーの脅威の検出を行います。Logging 5.7 以降のバージョンでは、ユーザーは、カスタマイズされたアラートと記録されたメトリクスを生成するように LokiStack デプロイメントを設定できます。
1.3. 分散トレーシング
詳細は、分散トレーシングアーキテクチャー を参照してください。
1.4. Red Hat build of OpenTelemetry
テレメトリートレース、メトリクス、ログを計測、生成、収集、エクスポートして、ソフトウェアのパフォーマンスと動作を分析および理解します。Tempo や Prometheus などのオープンソースのバックエンドを使用するか、商用製品を使用します。1 つの API と規則のセットを確認し、生成したデータを所有できます。
詳細は、Red Hat build of OpenTelemetry を参照してください。
1.5. Network Observability
OpenShift Container Platform クラスターのネットワークトラフィックを監視し、Network Observability Operator を使用してネットワークフローを作成します。さらなる洞察とトラブルシューティングのために、OpenShift Container Platform コンソールに保存されたネットワークフロー情報を表示および分析します。
詳細は、ネットワーク可観測性の概要 を参照してください。
1.6. パワーモニタリング
ワークロードの電力使用量を監視し、コンテナーレベルで測定された CPU や DRAM などの主要な電力消費メトリクスを使用して、クラスター内で実行されている最も電力を消費する namespace を特定します。パワーモニタリング Operator を使用して、エネルギー関連のシステム統計を視覚化します。
詳細は、パワーモニタリングの概要 を参照してください。
