1.7. Workload Availability Operator のメトリクスについて
データ分析の追加により、Workload Availability Operator の可観測性が向上します。データは、Operator のアクティビティーとクラスターへの影響に関するメトリクスを提供します。これらのメトリクスにより、意思決定能力が向上し、データ駆動型の最適化が可能になり、システム全体のパフォーマンスが向上します。
メトリクスを使用して次のタスクを実行できます。
- Operator の包括的な追跡データにアクセスして、システム全体の効率を監視します。
- 頻繁に障害が発生するノードや、Operator の修復によるダウンタイムを特定するなど、追跡データから得られる実用的な洞察にアクセスします。
- Operator の改善によって実際にシステム効率がどのように向上しているかを視覚化します。
1.7.1. Workload Availability Operator のメトリクスの設定 リンクのコピーリンクがクリップボードにコピーされました!
Red Hat OpenShift Web コンソールを使用して、Node Health Check Operator をインストールできます。
前提条件
- まずモニタリングスタックを設定する必要があります。詳細は、モニタリングスタックの設定 を参照してください。
- 使用定義プロジェクトのモニタリングを有効にする必要があります。詳細は、ユーザー定義プロジェクトのモニタリングの有効化 を参照する。
手順
次のように、既存の
prometheus-user-workload-tokenシークレットからprometheus-user-tokenシークレットを作成します。existingPrometheusTokenSecret=$(kubectl get secret --namespace openshift-user-workload-monitoring | grep prometheus-user-workload-token | awk '{print $1}')1 kubectl get secret ${existingPrometheusTokenSecret} --namespace=openshift-user-workload-monitoring -o yaml | \ sed '/namespace: .*==/d;/ca.crt:/d;/serviceCa.crt/d;/creationTimestamp:/d;/resourceVersion:/d;/uid:/d;/annotations/d;/kubernetes.io/d;' | \ sed 's/namespace: .*/namespace: openshift-workload-availability/' | \2 sed 's/name: .*/name: prometheus-user-workload-token/' | \3 sed 's/type: .*/type: Opaque/' | \ > prom-token.yaml kubectl apply -f prom-token.yaml次のように ServiceMonitor を作成します。
apiVersion: monitoring.coreos.com/v1 kind: ServiceMonitor metadata: name: node-healthcheck-metrics-monitor namespace: openshift-workload-availability1 labels: app.kubernetes.io/component: controller-manager spec: endpoints: - interval: 30s port: https scheme: https authorization: type: Bearer credentials: name: prometheus-user-workload-token key: token tlsConfig: ca: configMap: name: nhc-serving-certs-ca-bundle key: service-ca.crt serverName: node-healthcheck-controller-manager-metrics-service.openshift-workload-availability.svc2 selector: matchLabels: app.kubernetes.io/component: controller-manager app.kubernetes.io/name: node-healthcheck-operator app.kubernetes.io/instance: metrics
検証
設定が成功したことを確認するには、OCP Web UI の Observe > Targets タブに Endpoint Up と表示されます。
1.7.2. Workload Availability Operator のメトリクスの例 リンクのコピーリンクがクリップボードにコピーされました!
以下は、さまざまな Workload Availability Operator からのメトリクスの例です。
メトリクスには、次の指標に関する情報が含まれます。
- Operator の可用性: 各 Operator が稼働しているかどうか、またいつ稼働しているかを表示します。
- ノード修復数: 同じノード全体およびすべてのノード全体の修復数を表示します。
- ノード修復期間: 修復のダウンタイムまたは回復時間を表示します。
- ノード修復ゲージ: 進行中の修復の数を表示します。