ホーム
製品
OpenShift Container Platform
4.7
モニタリング
第9章モニタリング関連の問題のトラブルシューティング

第9章モニタリング関連の問題のトラブルシューティング

9.1. ユーザー定義のメトリクスが利用できない理由の調査
リンクのコピー

ServiceMonitor リソースを使用すると、ユーザー定義プロジェクトでサービスによって公開されるメトリクスの使用方法を判別できます。ServiceMonitor リソースを作成している場合で、メトリクス UI に対応するメトリクスが表示されない場合は、この手順で説明されるステップを実行します。

前提条件

cluster-admin ロールを持つユーザーとしてクラスターにアクセスできる。
OpenShift CLI (oc) がインストールされている。
ユーザー定義のワークロードのモニタリングを有効にし、設定している。
user-workload-monitoring-config ConfigMap オブジェクトを作成している。
ServiceMonitor リソースを作成している。

手順

サービスおよび ServiceMonitor リソース設定で、対応するラベルの一致を確認 します。
1. サービスに定義されたラベルを取得します。以下の例では、ns1 プロジェクトの prometheus-example-app サービスをクエリーします。
  $ oc -n ns1 get service prometheus-example-app -o yaml
  出力例
  labels: app: prometheus-example-app
2. ServiceMonitor リソース設定の matchLabels app ラベルが直前のステップのラベルの出力と一致することを確認します。
  $ oc -n ns1 get servicemonitor prometheus-example-monitor -o yaml
  出力例
  spec: endpoints: - interval: 30s port: web scheme: http selector: matchLabels: app: prometheus-example-app
  注記
  プロジェクトの表示パーミッションを持つ開発者として、サービスおよび ServiceMonitor リソースラベルを確認できます。

openshift-user-workload-monitoring プロジェクトの Prometheus Operator のログを検査します。

openshift-user-workload-monitoring プロジェクトの Pod を一覧表示します。

$ oc -n openshift-user-workload-monitoring get pods

出力例

NAME                                   READY   STATUS    RESTARTS   AGE
prometheus-operator-776fcbbd56-2nbfm   2/2     Running   0          132m
prometheus-user-workload-0             5/5     Running   1          132m
prometheus-user-workload-1             5/5     Running   1          132m
thanos-ruler-user-workload-0           3/3     Running   0          132m
thanos-ruler-user-workload-1           3/3     Running   0          132m

prometheus-operator Pod の prometheus-operator コンテナーからログを取得します。以下の例では、Pod は prometheus-operator-776fcbbd56-2nbfm になります。

$ oc -n openshift-user-workload-monitoring logs prometheus-operator-776fcbbd56-2nbfm -c prometheus-operator

サービスモニターに問題がある場合、ログには以下のようなエラーが含まれる可能性があります。

level=warn ts=2020-08-10T11:48:20.906739623Z caller=operator.go:1829 component=prometheusoperator msg="skipping servicemonitor" error="it accesses file system via bearer token file which Prometheus specification prohibits" servicemonitor=eagle/eagle namespace=openshift-user-workload-monitoring prometheus=user-workload

Prometheus UI でプロジェクトのターゲットステータスを直接確認します。
1. openshift-user-workload-monitoring プロジェクトで Prometheus インスタンスへのポート転送を確立します。
  $ oc port-forward -n openshift-user-workload-monitoring pod/prometheus-user-workload-0 9090
2. Web ブラウザーで http://localhost:9090/targets を開き、 Prometheus UI でプロジェクトのターゲットのステータスを直接確認します。ターゲットに関連するエラーメッセージがあるかどうかを確認します。
openshift-user-workload-monitoring プロジェクトで Prometheus Operator のデバッグレベルのロギングを設定 します。
1. openshift-user-workload-monitoring プロジェクトで user-workload-monitoring-config ConfigMap オブジェクトを編集します。
  $ oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config
2. prometheusOperator の logLevel: debug を data/config.yaml に追加し、ログレベルを debug に設定します。
  apiVersion: v1 kind: ConfigMap metadata: name: user-workload-monitoring-config namespace: openshift-user-workload-monitoring data: config.yaml: | prometheusOperator: logLevel: debug
3. 変更を適用するためにファイルを保存します。
  注記
  openshift-user-workload-monitoring プロジェクトの prometheus-operator は、ログレベルの変更時に自動的に再起動します。
4. debug ログレベルが openshift-user-workload-monitoring プロジェクトの prometheus-operator デプロイメントに適用されていることを確認します。
  $ oc -n openshift-user-workload-monitoring get deploy prometheus-operator -o yaml | grep "log-level"
  出力例
  - --log-level=debug
  debug レベルのロギングにより、Prometheus Operator によって行われるすべての呼び出しが表示されます。
5. prometheus-operator Pod が実行されていることを確認します。
  $ oc -n openshift-user-workload-monitoring get pods
  注記
  認識されない Prometheus Operator の loglevel 値が設定マップに含まれる場合、prometheus-operator Pod が正常に再起動されない可能性があります。
6. デバッグログを確認し、Prometheus Operator が ServiceMonitor リソースを使用しているかどうかを確認します。ログで他の関連するエラーの有無を確認します。

第9章モニタリング関連の問題のトラブルシューティング

9.1. ユーザー定義のメトリクスが利用できない理由の調査
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第9章 モニタリング関連の問題のトラブルシューティング

9.1. ユーザー定義のメトリクスが利用できない理由の調査リンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第9章モニタリング関連の問題のトラブルシューティング

9.1. ユーザー定義のメトリクスが利用できない理由の調査
リンクのコピー