1.8. Workload Availability Operator のメトリクスについて
データ分析の追加により、Workload Availability Operator の可観測性が向上します。データは、Operator のアクティビティーとクラスターへの影響に関するメトリクスを提供します。これらのメトリクスにより、意思決定能力が向上し、データ駆動型の最適化が可能になり、システム全体のパフォーマンスが向上します。
メトリクスを使用して次のタスクを実行できます。
- Operator の包括的な追跡データにアクセスして、システム全体の効率を監視します。
- 頻繁に障害が発生するノードや、Operator の修復によるダウンタイムを特定するなど、追跡データから得られる実用的な洞察にアクセスします。
- Operator の改善によって実際にシステム効率がどのように向上しているかを視覚化します。
1.8.1. Workload Availability Operator のメトリクスの設定
Red Hat OpenShift Web コンソールを使用して、Node Health Check Operator をインストールできます。
前提条件
- まずモニタリングスタックを設定する必要があります。詳細は、モニタリングスタックの設定 を参照してください。
- 使用定義プロジェクトのモニタリングを有効にする必要があります。詳細は、ユーザー定義プロジェクトのモニタリングの有効化 を参照してください。
手順
- 次のように、既存の - prometheus-user-workload-tokenシークレットから- prometheus-user-tokenシークレットを作成します。- Copy to Clipboard Copied! - Toggle word wrap Toggle overflow 
- 次のように ServiceMonitor を作成します。 - Copy to Clipboard Copied! - Toggle word wrap Toggle overflow 
検証
						設定が成功したことを確認するには、OCP Web UI の Observe > Targets タブに Endpoint Up と表示されます。
					
1.8.2. Workload Availability Operator のメトリクスの例
以下は、さまざまな Workload Availability Operator からのメトリクスの例です。
メトリクスには、次の指標に関する情報が含まれます。
- Operator の可用性: 各 Operator が稼働しているかどうか、またいつ稼働しているかを表示します。
- ノード修復数: 同じノード全体およびすべてのノード全体の修復数を表示します。
- ノード修復期間: 修復のダウンタイムまたは回復時間を表示します。
- ノード修復ゲージ: 進行中の修復の数を表示します。