第7章モニタリングの問題のトラブルシューティング

プロジェクトがユーザーワークロードの監視から除外されていないことを確認します。次の例では、ns1 プロジェクトを使用します。

プロジェクトに openshift.io/user-monitoring=false ラベルが 割り当てられていない ことを確認します。
```
oc get namespace ns1 --show-labels | grep 'openshift.io/user-monitoring=false'
```
```
$ oc get namespace ns1 --show-labels | grep 'openshift.io/user-monitoring=false'
```
Copy to Clipboard Toggle word wrap
注記
ユーザーワークロードのプロジェクトに設定されるデフォルトのラベルは、openshift.io/user-monitoring=true です。ただし、ラベルは手動で適用しない限り表示されません。
ラベルが割り当てられている場合は、ラベルを削除します。
プロジェクトからラベルを削除する例
```
oc label namespace ns1 'openshift.io/user-monitoring-'
```
```
$ oc label namespace ns1 'openshift.io/user-monitoring-'
```
Copy to Clipboard Toggle word wrap
出力例
```
namespace/ns1 unlabeled
```
```
namespace/ns1 unlabeled
```
Copy to Clipboard Toggle word wrap

サービスと ServiceMonitor リソース設定の対応するラベルが一致していることを確認します。次の例では、prometheus-example-app サービス、prometheus-example-monitor サービスモニター、および ns1 プロジェクトを使用します。

サービスに定義されたラベルを取得します。

oc -n ns1 get service prometheus-example-app -o yaml

$ oc -n ns1 get service prometheus-example-app -o yaml

Copy to Clipboard

Toggle word wrap

出力例

  labels:
    app: prometheus-example-app

  labels:
    app: prometheus-example-app

Copy to Clipboard

Toggle word wrap

ServiceMonitor リソース設定の matchLabels 定義が、直前の手順のラベルの出力と一致することを確認します。

oc -n ns1 get servicemonitor prometheus-example-monitor -o yaml

$ oc -n ns1 get servicemonitor prometheus-example-monitor -o yaml

Copy to Clipboard

Toggle word wrap

出力例

apiVersion: v1
kind: ServiceMonitor
metadata:
  name: prometheus-example-monitor
  namespace: ns1
spec:
  endpoints:
  - interval: 30s
    port: web
    scheme: http
  selector:
    matchLabels:
      app: prometheus-example-app

apiVersion: v1
kind: ServiceMonitor
metadata:
  name: prometheus-example-monitor
  namespace: ns1
spec:
  endpoints:
  - interval: 30s
    port: web
    scheme: http
  selector:
    matchLabels:
      app: prometheus-example-app

Copy to Clipboard

Toggle word wrap

注記

プロジェクトの表示権限を持つ開発者として、サービスおよび ServiceMonitor リソースラベルを確認できます。

openshift-user-workload-monitoring プロジェクトで Prometheus Operator のログを調べます。

openshift-user-workload-monitoring プロジェクトの Pod をリスト表示します。

oc -n openshift-user-workload-monitoring get pods

$ oc -n openshift-user-workload-monitoring get pods

Copy to Clipboard

Toggle word wrap

出力例

NAME                                   READY   STATUS    RESTARTS   AGE
prometheus-operator-776fcbbd56-2nbfm   2/2     Running   0          132m
prometheus-user-workload-0             5/5     Running   1          132m
prometheus-user-workload-1             5/5     Running   1          132m
thanos-ruler-user-workload-0           3/3     Running   0          132m
thanos-ruler-user-workload-1           3/3     Running   0          132m

NAME                                   READY   STATUS    RESTARTS   AGE
prometheus-operator-776fcbbd56-2nbfm   2/2     Running   0          132m
prometheus-user-workload-0             5/5     Running   1          132m
prometheus-user-workload-1             5/5     Running   1          132m
thanos-ruler-user-workload-0           3/3     Running   0          132m
thanos-ruler-user-workload-1           3/3     Running   0          132m

Copy to Clipboard

Toggle word wrap

prometheus-operator Pod の prometheus-operator コンテナーからログを取得します。以下の例では、Pod は prometheus-operator-776fcbbd56-2nbfm になります。

oc -n openshift-user-workload-monitoring logs prometheus-operator-776fcbbd56-2nbfm -c prometheus-operator

$ oc -n openshift-user-workload-monitoring logs prometheus-operator-776fcbbd56-2nbfm -c prometheus-operator

Copy to Clipboard

Toggle word wrap

サービスモニターに問題がある場合、ログには以下のようなエラーが含まれる可能性があります。

level=warn ts=2020-08-10T11:48:20.906739623Z caller=operator.go:1829 component=prometheusoperator msg="skipping servicemonitor" error="it accesses file system via bearer token file which Prometheus specification prohibits" servicemonitor=eagle/eagle namespace=openshift-user-workload-monitoring prometheus=user-workload

level=warn ts=2020-08-10T11:48:20.906739623Z caller=operator.go:1829 component=prometheusoperator msg="skipping servicemonitor" error="it accesses file system via bearer token file which Prometheus specification prohibits" servicemonitor=eagle/eagle namespace=openshift-user-workload-monitoring prometheus=user-workload

Copy to Clipboard

Toggle word wrap

OpenShift Container Platform Web コンソール UI の Metrics targets ページで、エンドポイントのターゲットステータスを確認します。

OpenShift Container Platform の Web コンソールにログインし、管理者 パースペクティブの Observe Targets に移動します。
リストでメトリクスのエンドポイントを探し、Status 列でターゲットのステータスを確認します。
Status が Down の場合、エンドポイントの URL をクリックすると、そのメトリクスターゲットの Target Details ページで詳細情報を見ることができます。

openshift-user-workload-monitoring プロジェクトで Prometheus Operator のデバッグレベルのロギングを設定します。

openshift-user-workload-monitoring プロジェクトで user-workload-monitoring-config ConfigMap オブジェクトを編集します。
```
oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config
```
```
$ oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config
```
Copy to Clipboard Toggle word wrap

prometheusOperator の logLevel: debug を data/config.yaml に追加し、ログレベルを debug に設定します。

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
    prometheusOperator:
      logLevel: debug
# ...

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
    prometheusOperator:
      logLevel: debug
# ...

Copy to Clipboard

Toggle word wrap

変更を適用するためにファイルを保存します。影響を受ける prometheus-operator Pod は自動的に再デプロイされます。
debug ログレベルが openshift-user-workload-monitoring プロジェクトの prometheus-operator デプロイメントに適用されていることを確認します。
```
oc -n openshift-user-workload-monitoring get deploy prometheus-operator -o yaml |  grep "log-level"
```
```
$ oc -n openshift-user-workload-monitoring get deploy prometheus-operator -o yaml |  grep "log-level"
```
Copy to Clipboard Toggle word wrap
出力例
```
        - --log-level=debug
```
```
        - --log-level=debug
```
Copy to Clipboard Toggle word wrap
デバッグレベルのロギングでは、Prometheus Operator によって行われるすべての呼び出しが表示されます。
prometheus-operator Pod が実行されていることを確認します。
```
oc -n openshift-user-workload-monitoring get pods
```
```
$ oc -n openshift-user-workload-monitoring get pods
```
Copy to Clipboard Toggle word wrap
注記
認識されない Prometheus Operator の loglevel 値が config map に含まれる場合、prometheus-operator Pod が正常に再起動されない可能性があります。
デバッグログを確認し、Prometheus Operator が ServiceMonitor リソースを使用しているかどうかを確認します。ログで他の関連するエラーの有無を確認します。

7.1. ユーザー定義のプロジェクトメトリクスが使用できない理由の調査
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第7章 モニタリングの問題のトラブルシューティング

7.1. ユーザー定義のプロジェクトメトリクスが使用できない理由の調査リンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第7章モニタリングの問題のトラブルシューティング

7.1. ユーザー定義のプロジェクトメトリクスが使用できない理由の調査
リンクのコピー