可観測性ガイド

Red Hat build of Keycloak 26.2

Red Hat Customer Content Services

概要

このガイドは、管理者がヘルスチェック、メトリクス、ダッシュボード、トレースを使用して Red Hat build of Keycloak 26.2 を監視およびトラブルシューティングするのに役立ちます。

第1章ヘルスチェックを使用してインスタンスステータスを追跡する
リンクのコピー

ヘルス REST エンドポイントを呼び出して、インスタンスの起動が完了し、リクエストを処理する準備ができているかどうかを確認します。

Red Hat build of Keycloak には、ヘルスチェックのサポートが組み込まれています。この章では、Red Hat build of Keycloak のヘルスチェックを有効にして使用する方法を説明します。Red Hat build of Keycloak ヘルスチェックは、デフォルトで管理ポート 9000 で公開されます。詳細は、管理インターフェイスの設定を参照してください。

1.1. Red Hat build of Keycloak のヘルスチェックエンドポイント
リンクのコピー

Red Hat build of Keycloak は、次の 4 つのヘルスエンドポイントを公開します。

/health/live
/health/ready
/health/started
/health

各エンドポイントの意味は、Quarkus SmallRye Health のドキュメントを参照してください。

これらのエンドポイントは、次のような JSON オブジェクトにより、成功した場合は HTTP ステータス 200 OK、失敗した場合は 503 Service Unavailable で応答します。

追加のチェックごとの情報を含まないエンドポイントの成功応答:

{
    "status": "UP",
    "checks": []
}

データベース接続に関する情報を含むエンドポイントの成功応答:

{
    "status": "UP",
    "checks": [
        {
            "name": "Keycloak database connections health check",
            "status": "UP"
        }
    ]
}

1.2. ヘルスチェックを有効にする
リンクのコピー

ビルド時に health-enabled オプションを使用して、ヘルスチェックを有効にできます。

bin/kc.[sh|bat] build --health-enabled=true

デフォルトでは、ヘルスエンドポイントからチェックは返されません。

1.3. ヘルスチェックを使用する
リンクのコピー

ヘルスエンドポイントは、外部 HTTP 要求でモニタリングすることが推奨されます。セキュリティー対策として、Red Hat build of Keycloak のコンテナーイメージから curl とその他のパッケージを削除しているため、ローカルのコマンドベースのモニタリングは容易には機能しません。

コンテナーで Red Hat build of Keycloak を使用していない場合は、任意の手段でヘルスチェックエンドポイントにアクセスできます。

1.3.1. curl
リンクのコピー

シンプルな HTTP HEAD 要求を使用して、Red Hat build of Keycloak の状態が live か ready かを判断できます。curl は、この目的に適した HTTP クライアントです。

Red Hat build of Keycloak がコンテナーにデプロイされている場合は、前述のセキュリティー対策があるため、このコマンドをコンテナーの外部から実行する必要があります。以下に例を示します。

curl --head -fsS http://localhost:9000/health/ready

コマンドがステータス 0 を返した場合、呼び出したエンドポイントに応じて Red Hat build of Keycloak は live または ready になります。それ以外の場合は問題があります。

1.3.2. Kubernetes
リンクのコピー

Kubernetes が外部からヘルスエンドポイントをモニタリングできるように、HTTP Probe を定義してください。liveness コマンドは使用しないでください。

1.3.3. HEALTHCHECK
リンクのコピー

Containerfile イメージの HEALTHCHECK 命令は、コンテナーの実行中にコンテナー内で定期的に実行されるコマンドを定義します。Red Hat build of Keycloak コンテナーには、CLI HTTP クライアントがインストールされていません。コンテナーで Red Hat build of Keycloak を実行するで詳しく説明されているように、追加の RPM として curl をインストールすることを検討してください。これにより、コンテナーの安全性が低下する可能性がある点に注意してください。

1.4. 利用可能なチェック
リンクのコピー

下表は、使用可能なチェックを示しています。

Expand

チェック	説明	メトリクスの要否
データベース	データベース接続プールのステータスを返します。	はい

一部のチェックでは、Requires Metrics (メトリクスの要否) の列で示されているとおり、メトリクスを有効にする必要があります。メトリクスを有効にするには、次のように metrics-enabled オプションを使用します。

bin/kc.[sh|bat] build --health-enabled=true --metrics-enabled=true

1.5. 関連するオプション
リンクのコピー

Expand

値

	値
`health-enabled` 🛠 サーバーがヘルスチェックエンドポイントを公開する必要があるかどうか。有効にすると、`/health`、`/health/ready`、および `/health/live` エンドポイントでヘルスチェックが利用可能になります。 CLI: `--health-enabled` Env: `KC_HEALTH_ENABLED`	`true`、`false` (デフォルト)

health-enabled 🛠

サーバーがヘルスチェックエンドポイントを公開する必要があるかどうか。

有効にすると、/health、/health/ready、および /health/live エンドポイントでヘルスチェックが利用可能になります。

CLI: --health-enabled
Env: KC_HEALTH_ENABLED

true、false (デフォルト)

第2章メトリクスから洞察を得る
リンクのコピー

メトリクスを収集して、実行中の Red Hat build of Keycloak インスタンスの状態とアクティビティーに関する洞察を得ることができます。

Red Hat build of Keycloak には、メトリクスのサポートが組み込まれています。この章では、サーバーメトリクスを有効にし、設定する方法を説明します。

2.1. メトリクスを有効にする
リンクのコピー

ビルド時に metrics-enabled オプションを使用して、メトリクスを有効にできます。

bin/kc.[sh|bat] start --metrics-enabled=true

2.2. メトリクスのクエリー
リンクのコピー

Red Hat build of Keycloak は、管理インターフェイスの次のエンドポイントでメトリクスを公開します。

/metrics

管理インターフェイスの詳細は、管理インターフェイスの設定を参照してください。エンドポイントからの応答は、application/openmetrics-text コンテンツタイプを使用し、Prometheus (OpenMetrics) テキスト形式に基づいています。以下は、応答例の抜粋です。

# HELP base_gc_total Displays the total number of collections that have occurred. This attribute lists -1 if the collection count is undefined for this collector.
# TYPE base_gc_total counter
base_gc_total{name="G1 Young Generation",} 14.0
# HELP jvm_memory_usage_after_gc_percent The percentage of long-lived heap pool used after the last GC event, in the range [0..1]
# TYPE jvm_memory_usage_after_gc_percent gauge
jvm_memory_usage_after_gc_percent{area="heap",pool="long-lived",} 0.0
# HELP jvm_threads_peak_threads The peak live thread count since the Java virtual machine started or peak was reset
# TYPE jvm_threads_peak_threads gauge
jvm_threads_peak_threads 113.0
# HELP agroal_active_count Number of active connections. These connections are in use and not available to be acquired.
# TYPE agroal_active_count gauge
agroal_active_count{datasource="default",} 0.0
# HELP base_memory_maxHeap_bytes Displays the maximum amount of memory, in bytes, that can be used for memory management.
# TYPE base_memory_maxHeap_bytes gauge
base_memory_maxHeap_bytes 1.6781410304E10
# HELP process_start_time_seconds Start time of the process since unix epoch.
# TYPE process_start_time_seconds gauge
process_start_time_seconds 1.675188449054E9
# HELP system_load_average_1m The sum of the number of runnable entities queued to available processors and the number of runnable entities running on the available processors averaged over a period of time
# TYPE system_load_average_1m gauge
system_load_average_1m 4.005859375

...

2.3. 次のステップ
リンクのコピー

メトリクスの使用方法は、サービスレベルインジケーターを使用してパフォーマンスを監視するおよびメトリクスを使用したトラブルシューティングの章を参照してください。

2.4. 関連するオプション
リンクのコピー

Expand

	値
`cache-metrics-histograms-enabled` 組み込みキャッシュのメトリクスのヒストグラムを有効にします。 CLI: `--cache-metrics-histograms-enabled` Env: `KC_CACHE_METRICS_HISTOGRAMS_ENABLED` メトリクスが有効になっている場合にのみ使用可能	`true`、`false` (デフォルト)
`http-metrics-histograms-enabled` HTTP サーバー要求の継続期間のデフォルトバケットを使用したヒストグラムを有効にします。 CLI: `--http-metrics-histograms-enabled` Env: `KC_HTTP_METRICS_HISTOGRAMS_ENABLED` メトリクスが有効になっている場合にのみ使用可能	`true`、`false` (デフォルト)
`http-metrics-slos` HTTP サーバー要求のサービスレベル目標。デフォルトのヒストグラムの代わりにこれを使用するか、これを組み合わせて追加のバケットを追加します。ミリ秒単位で定義されたコンマ区切りの値のリストを指定します。5ms から 10s までのバケットの例: 5,10,25,50,250,500,1000,2500,5000,10000 CLI: `--http-metrics-slos` Env: `KC_HTTP_METRICS_SLOS` メトリクスが有効になっている場合にのみ使用可能
`metrics-enabled` 🛠 サーバーがメトリクスを公開する必要があるかどうか。有効にすると、`/metrics` エンドポイントでメトリクスを利用できるようになります。 CLI: `--metrics-enabled` Env: `KC_METRICS_ENABLED`	`true`、`false` (デフォルト)

第3章イベントメトリクスを使用してユーザーアクティビティーを監視する
リンクのコピー

イベントメトリクスは、Red Hat build of Keycloak インスタンス内のユーザーアクティビティーの集約ビューを提供します。

現時点では、ユーザーイベントのメトリクスのみがキャプチャーされます。たとえば、ログイン回数、ログイン失敗回数、実行されたトークンの更新回数などを監視できます。

メトリクスは標準メトリクスエンドポイントを使用して公開されます。それを独自のメトリクス収集システムで使用して、ダッシュボードやアラートを作成できます。

メトリクスは、Red Hat build of Keycloak インスタンスごとにカウンターとして報告されます。インスタンスを再起動すると、カウンターはリセットされます。クラスター内で複数のインスタンスが実行されている場合は、すべてのインスタンスからメトリクスを収集し、それらを集約してクラスタービューごとに取得する必要があります。

3.1. イベントメトリクスを有効にする
リンクのコピー

イベントメトリクスの収集を開始するには、メトリクスを有効にし、ユーザーイベントのメトリクスを有効にします。

必要な起動パラメーターは次のとおりです。

bin/kc.[sh|bat] start --metrics-enabled=true --event-metrics-user-enabled=true ...

デフォルトでは、レルムごとに個別のメトリクスが存在します。メトリクスをクライアントおよびアイデンティティープロバイダー別に分類するには、設定オプションの event-metrics-user-tags を使用してメトリクスディメンションを追加できます。これは、クライアントと IDP の数が少ないインストールで役立ちます。しかし、Red Hat build of Keycloak のメモリー使用量、および監視システムの負荷が増加するため、多数のクライアントまたは IDP があるインストールには推奨されません。

以下は、メトリクスを 3 つのメトリクスディメンションすべてに分類するように Red Hat build of Keycloak を設定する方法を示しています。

bin/kc.[sh|bat] start ... --event-metrics-user-tags=realm,idp,clientId ...

Red Hat build of Keycloak がメトリクスを公開するイベントを制限できます。利用可能なイベントの概要は、イベントタイプに関するサーバー管理ガイドを参照してください。

次の例では、収集されるイベントを LOGIN イベントと LOGOUT イベントに制限します。

bin/kc.[sh|bat] start ... --event-metrics-user-events=login,logout ...

収集されるメトリクスの説明は、自己提供メトリクスを参照してください。

3.2. 関連するオプション
リンクのコピー

Expand

	値
`metrics-enabled` 🛠 サーバーがメトリクスを公開する必要があるかどうか。有効にすると、`/metrics` エンドポイントでメトリクスを利用できるようになります。 CLI: `--metrics-enabled` Env: `KC_METRICS_ENABLED`	`true`、`false` (デフォルト)
`event-metrics-user-enabled` 🛠 ユーザーイベントに基づいてメトリクスを作成します。 CLI: `--event-metrics-user-enabled` Env: `KC_EVENT_METRICS_USER_ENABLED` メトリクスが有効で、user-event-metrics 機能が有効になっている場合にのみ使用できます。	`true`、`false` (デフォルト)
`event-metrics-user-events` ユーザーイベントメトリクス用に収集されるイベントのコンマ区切りリスト。デフォルトではすべてのユーザーイベントがメトリクスを作成するため、このオプションを使用すると作成されるメトリクスの数を減らすことができます。 CLI: `--event-metrics-user-events` Env: `KC_EVENT_METRICS_USER_EVENTS` ユーザーイベントメトリクスが有効になっている場合にのみ使用できます。 `remove_totp` の代わりに `remove_credential` を使用し、`update_totp` と `update_password` の代わりに `update_credential` を使用します。非推奨の値: `remove_totp`、`update_totp`、`update_password`	`authreqid_to_token`, `client_delete`, `client_info`, `client_initiated_account_linking`, `client_login`, `client_register`, `client_update`, `code_to_token`, `custom_required_action`, `delete_account`, `execute_action_token`, `execute_actions`, `federated_identity_link`, `federated_identity_override_link`, `grant_consent`, `identity_provider_first_login`, `identity_provider_link_account`, `identity_provider_login`, `identity_provider_post_login`, `identity_provider_response`, `identity_provider_retrieve_token`, `impersonate`, `introspect_token`, `invalid_signature`, `invite_org`, `login`, `logout`, `oauth2_device_auth`, `oauth2_device_code_to_token`, `oauth2_device_verify_user_code`, `oauth2_extension_grant`, `permission_token`, `pushed_authorization_request`, `refresh_token`, `register`, `register_node`, `remove_credential`, `remove_federated_identity`, `remove_totp` (deprecated), `reset_password`, `restart_authentication`, `revoke_grant`, `send_identity_provider_link`, `send_reset_password`, `send_verify_email`, `token_exchange`, `unregister_node`, `update_consent`, `update_credential`, `update_email`, `update_password` (deprecated), `update_profile`, `update_totp` (deprecated), `user_disabled_by_permanent_lockout`, `user_disabled_by_temporary_lockout`, `user_info_request`, `verify_email`, `verify_profile`
`event-metrics-user-tags` ユーザーイベントメトリクス用に収集されるタグのコンマ区切りリスト。デフォルトでは、高いメトリクスカーディナリティーを回避するために、`realm` のみが有効になっています。 CLI: `--event-metrics-user-tags` Env: `KC_EVENT_METRICS_USER_TAGS` ユーザーイベントメトリクスが有効になっている場合にのみ使用できます。	`realm`, `idp`, `clientId`

第4章サービスレベルインジケーターを使用してパフォーマンスを監視する
リンクのコピー

サービスレベルインジケーター (SLI) とサービスレベル目標 (SLO) を使用して、ユーザーが認識するパフォーマンスと信頼性を追跡します。

サービスレベルインジケーター (SLI) とサービスレベル目標 (SLO) は、実稼働環境での Red Hat build of Keycloak のパフォーマンスと信頼性を監視および維持する上で不可欠なコンポーネントです。

Google の書籍「Site Reliability Engineering」には、次のように定義しています。

サービスレベルインジケーター (SLI) は、提供されるサービスレベルの特定の側面を慎重に定義した定量的な尺度です。
サービスレベル目標 (SLO) は、SLI で測定されるサービスレベルの目標とする値または値の範囲です。

定義についてステークホルダーと合意し、追跡することで、サービス所有者は、デプロイメントがユーザーの期待と一致していること、また、過不足なくサービスを提供することを保証できます。

4.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスが有効になっており、かつ以下で定義する SLO を測定するために http-metrics-slos オプションが latency に設定されている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。以下の段落では、PromQL クエリー言語をサポートする Prometheus または同様のシステムが使用されていることを前提としています。

4.2. 提供されるサービスの定義
リンクのコピー

次のステップでは、適切な SLI と SLO を識別するために次のサービス定義が使用されます。ユーザーが観察した行動をキャプチャーする必要があります。

Red Hat build of Keycloak ユーザーとして以下を実行できる必要があります。

ログインする
トークンを更新する
ログアウトする

そうすることで、認証に Red Hat build of Keycloak を使用するアプリケーションを使用できるようにします。

4.3. SLI と SLO の定義
リンクのコピー

以下に、上記のサービスの説明と Red Hat build of Keycloak で利用可能なメトリクスに基づいた SLI と SLO の例を示します。

注記

これらの SLO は実際のシステム負荷とは関係がありませんが、レスポンスが遅い場合にユーザーはシステム負荷を気にしたりしないため、これは意図された設定です。

一方で、ステークホルダーとサービスレベルアグリーメント (SLA) を締結した場合は、これによりシステム負荷が増加し、スケーリングのしきい値に到達するため、Red Hat build of Keycloak の実行者として Red Hat build of Keycloak が受信するトラフィックに対して制限を定義することを検討するでしょう。

Expand

特徴	サービスレベルインジケーター	サービスレベル目標^*	メトリクスソース
可用性	監視システムによって測定された、Red Hat build of Keycloak がリクエストに応答できる時間の割合	Red Hat build of Keycloak は、1 カ月の 99.9% が利用可能であること (1 カ月あたり 44 分間は利用不可)。	Prometheus `up` メトリクスを使用します。これは、Prometheus サーバーが Red Hat build of Keycloak からメトリクスを取得できるかどうかを示します。
レイテンシー	サーバーが測定する、認証関連の HTTP リクエストに対するレスポンス時間	30 日間で、認証関連リクエスト全体の 95% が 250 ミリ秒未満であること。	`http_server_requests_seconds_bucket` と `http_server_requests_seconds_count` を使用して、特定のエンドポイントのレイテンシーとレスポンス時間の分布を追跡する、Red Hat build of Keycloak サーバー側のメトリクス。
エラー	サーバーが測定する、サーバーの問題により失敗した認証リクエスト	サーバー問題を原因とする認証リクエストのエラー率は、30 日間で 0.1% 未満である必要があります。	`outcome` タグの `http_server_requests_seconds_count` メトリクスを `SERVER_ERROR` の値でフィルタリングして、サーバー側のエラーを識別します。

^* これらの SLO ターゲット値は例であり、ユースケースとデプロイメントに合わせて調整する必要があります。

4.4. PromQL クエリー
リンクのコピー

これらは、Kubernetes 環境で作成され、監視ツールとして Prometheus で使用されるサンプルクエリーです。ブループリントとして提供されており、ランタイムや監視環境に合わせて調整する必要があります。

注記

アラートやライブダッシュボードに使用する場合、実稼働環境ではこれらのクエリーまたはサブクエリーを recording rule に置き換えて、リソースを使いすぎないようにする必要があります。

4.4.1. 可用性
リンクのコピー

このメトリクスの値は、Red Hat build of Keycloak インスタンスが利用可能で、Prometheus スクレイプリクエストに応答している場合は少なくとも 1 になり、サービスがダウンしているかアクセスできない場合は 0 になります。

次に、Grafana などのツールを使用して 30 日間の時間範囲を表示し、その期間内のメトリクスの平均を計算します。

count_over_time(
  sum (up{
    container="keycloak",


    namespace="$namespace"
  } > 0)[30d:15s]
)


/
count_over_time(vector(1)[30d:15s])

1: 追加のタグでフィルタリングして Red Hat build of Keycloak ノードを識別します
2: 少なくとも 1 つの Red Hat build of Keycloak ノードが利用可能であった場合、指定された範囲と間隔内のすべてのデータポイントをカウントします。
3: 同じ範囲と間隔内のすべてのデータポイントの数で割ります

注記

Grafana では、値 30d:15s を $range:$interval に置き換えて、ダッシュボードで選択した時間範囲内の可用性 SLI を計算できます。

4.4.2. 認証リクエストのレイテンシー
リンクのコピー

この Prometheus クエリーは、過去 30 日間に特定の namespace と Pod を対象とする特定の Red Hat build of Keycloak エンドポイントにおける過去 30 日間のすべての認証リクエストのうち、0.25 秒以内に完了した認証リクエストの割合を計算します。

この例では、Red Hat build of Keycloak 設定の http-metrics-slos に値 250 が含まれている必要があります。これは、250 ミリ秒より速いリクエストと遅いリクエストのバケットが記録されることを示しています。http-metrics-histograms-enabled を true に設定すると、パフォーマンスのトラブルシューティングに役立つ追加のバケットがキャプチャーされます。

sum(
  rate(
    http_server_requests_seconds_bucket{
      uri=~"/realms/{realm}/protocol/{protocol}.*|/realms/{realm}/login-actions.*",


      le="0.25",


      container="keycloak",


      namespace="$namespace"}
    [30d]


  )
) without (le,uri,status,outcome,method,pod,instance)


/
sum(
  rate(
    http_server_requests_seconds_count{
      uri=~"/realms/{realm}/protocol/{protocol}.*|/realms/{realm}/login-actions.*",


      container="keycloak",
      namespace="$namespace"}
    [30d]


  )
) without (le,uri,status,outcome,method,pod,instance)

1 6: ログインに関連する URL
2: SLO で定義されたレスポンス時間
3 7: 追加のタグでフィルタリングして Red Hat build of Keycloak ノードを識別します
4: SLO で指定された時間範囲
5 8: 単一の合計を作成するために必要な数のラベルを無視します

注記

Grafana では、値 30d を $__range に置き換えて、ダッシュボードで選択した時間範囲内のレイテンシー SLI を計算できます。

4.4.3. 認証リクエストのエラー
リンクのコピー

この Prometheus クエリーは、過去 30 日間に特定の namespace を対象とするすべての認証リクエストのうち、サーバー側エラーを返した認証リクエストの割合を計算します。

sum(
  rate(
    http_server_requests_seconds_count{
      uri=~"/realms/{realm}/protocol/{protocol}.*|/realms/{realm}/login-actions.*",


      outcome="SERVER_ERROR",


      container="keycloak",


      namespace="$namespace"}
    [30d]


  )
) without (le,uri,status,outcome,method,pod,instance)


/
sum(
  rate(
    http_server_requests_seconds_count{
      uri=~"/realms/{realm}/protocol/{protocol}.*|/realms/{realm}/login-actions.*",


      container="keycloak",


      namespace="$namespace"}
    [30d]


  )
) without (le,uri,status,outcome,method,pod,instance)

1 6: ログインに関連する URL
2: サーバーエラー (HTTP ステータス 5xx) で応答したすべてのリクエストをフィルタリングします。
3 7: 追加のタグでフィルタリングして Red Hat build of Keycloak ノードを識別します
4 8: SLO で指定された時間範囲
5 9: 単一の合計を作成するために必要な数のラベルを無視します

注記

Grafana では、値 30d を $__range に置き換えて、ダッシュボードで選択した時間範囲内のエラー SLI を計算できます。

4.5. 参考文献
リンクのコピー

第5章メトリクスを使用したトラブルシューティング
リンクのコピー

エラーやパフォーマンスの問題のトラブルシューティングにメトリクスを使用します。

実行中の Red Hat build of Keycloak デプロイメントでは、システムのパフォーマンスを把握し、パフォーマンスがサービスレベル目標 (SLO) を満たしているかどうかを認識することが重要です。SLO の詳細は、サービスレベルインジケーターを使用してパフォーマンスを監視するの章を参照してください。

このガイドでは、「SLO が満たされない場合はどうすればよいか」という質問への回答を示します。

Red Hat build of Keycloak は複数のコンポーネントで構成されており、そのうちの 1 つに問題や誤設定があると、サービスレベルインジケーターが望ましくない数値に変化する可能性があります。

次の例は、このガイドで提供されている内容を表しています。

観測内容: レイテンシーのサービスレベル目標が達成されていません。

問題を示すメトリクス:

Red Hat build of Keycloak のデータベース接続プールが頻繁に枯渇し、プールから接続を取得するのを待つスレッドのキューが発生します。
Red Hat build of Keycloak の users キャッシュヒット率は低く、5% 程度です。これは、20 回のユーザー検索のうちキャッシュからユーザーデータを取得できるのは 1 回のみで、残りはデータベースからデータをロードする必要があることを意味します。

提案される緩和策:

users のキャッシュサイズの数値を増やすと、データベースからの読み取り回数が減少します。
接続プール内の接続数を増やします。これは、データベースのメトリクスで確認し、使用可能なプロセッサーの数を増やすなどして、より高い負荷に合わせて調整する必要があります。

注記

このガイドでは、Red Hat build of Keycloak メトリクスに焦点を当てています。データベース自体のトラブルシューティングは範囲外です。
このガイドは一般的なガイダンスを提供します。必ず、古い設定と新しい設定の該当するメトリクスを比較するパフォーマンステストを実行して、設定の変更を確認する必要があります。

注記

以下のメトリクスの Grafana ダッシュボードは、ダッシュボードでのアクティビティーの可視化の章を参照してください。

5.1. Red Hat build of Keycloak 主要メトリクスのリスト
リンクのコピー

自己提供のメトリクス
JVM メトリック
データベースメトリクス
HTTP メトリック
シングルサイトメトリクス (外部 Data Grid なし)
- クラスタリングメトリクス
- シングルサイトデプロイメント用の埋め込み Infinispan メトリクス
複数サイトのメトリクス (マルチサイトデプロイメントで説明)
- マルチサイトデプロイメント用の埋め込み Infinispan メトリクス
- 外部 Data Grid メトリクス

5.2. 自己提供のメトリクス
リンクのコピー

Red Hat build of Keycloak が提供する主要なメトリクスを説明します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.2.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.2.2. メトリクス
リンクのコピー

5.2.2.1. ユーザーイベントメトリクス
リンクのコピー

ユーザーイベントメトリクスはデフォルトで無効になっています。イベントメトリクスを有効にする方法と、記録するタグを設定する方法は、イベントメトリクスを使用してユーザーアクティビティーを監視するを参照してください。

Expand

メトリクス	説明
`keycloak_user_events_total`	ユーザーイベントの発生をカウントします。

タグ

カーディナリティーが高くなりすぎないようにするため、client_id および idp タグはデフォルトで無効になっています。

realm: レルム
client_id: クライアント ID
idp: アイデンティティープロバイダー
event: login や logout などのユーザーイベント。利用可能なイベントの概要は、イベントタイプに関するサーバー管理ガイドを参照してください。
error: login イベントの invalid_user_credentials などのイベント固有のエラー。エラーが発生しなかった場合は空の文字列。

以下のスニペットは、メトリクスエンドポイントによって提供されるレスポンスの例です。

# HELP keycloak_user_events_total Keycloak user events
# TYPE keycloak_user_events_total counter
keycloak_user_events_total{client_id="security-admin-console",error="",event="code_to_token",idp="",realm="master",} 1.0
keycloak_user_events_total{client_id="security-admin-console",error="",event="login",idp="",realm="master",} 1.0
keycloak_user_events_total{client_id="security-admin-console",error="",event="logout",idp="",realm="master",} 1.0
keycloak_user_events_total{client_id="security-admin-console",error="invalid_user_credentials",event="login",idp="",realm="master",} 1.0

5.2.2.2. パスワードのハッシュ
リンクのコピー

Expand

メトリクス	説明
`keycloak_credentials_password_hashing_validations_total`	パスワードハッシュの検証をカウントします。

タグ

realm

レルム

algorithm

パスワードのハッシュ化に使用されるアルゴリズム (例: argon2)

hashing_strength

ハッシュアルゴリズムの強度 (アルゴリズムに応じた反復回数など) を示す文字列 (例: Argon2id-1.3[m=7168,t=5,p=1])

outcome

パスワード検証の結果。可能な値:

valid: 正しいパスワード
invalid: 不正なパスワード
error: パスワードのハッシュ化時にエラーが発生しました

使用可能なタグを設定するには、オプション spi-credential-keycloak-password-validations-counter-tags にタグ名のコンマ区切りリストを指定します。デフォルトでは、すべてのタグが有効になっています。

以下のスニペットは、メトリクスエンドポイントによって提供されるレスポンスの例です。

# HELP keycloak_credentials_password_hashing_validations_total Password validations
# TYPE keycloak_credentials_password_hashing_validations_total counter
keycloak_credentials_password_hashing_validations_total{algorithm="argon2",hashing_strength="Argon2id-1.3[m=7168,t=5,p=1]",outcome="valid",realm="realm-0",} 39949.0

5.2.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、JVM メトリクスに進みます。

5.3. JVM メトリック
リンクのコピー

JVM メトリクスを使用して Red Hat build of Keycloak のパフォーマンスを観察します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.3.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.3.2. メトリクス
リンクのコピー

5.3.2.1. JVM 情報
リンクのコピー

Expand

メトリクス	説明
`jvm_info_total`	バージョン、ランタイム、ベンダーなどの JVM に関する情報。

5.3.2.2. ヒープメモリー使用率
リンクのコピー

Expand

メトリクス	説明
`jvm_memory_committed_bytes`	JVM が使用するためにコミットされたメモリーの量。割り当てられたメモリーのうち、必ず JVM が使用できる量を反映します。
`jvm_memory_used_bytes`	JVM によって現在使用されているメモリーの量。アプリケーションと JVM 内部による実際のメモリー消費量を示します。

5.3.2.3. ガベージコレクション
リンクのコピー

Expand

メトリクス	説明
`jvm_gc_pause_seconds_max`	特定の原因により JVM で発生するガベージコレクションの一時停止の最大継続時間 (秒)。これにより、GC の一時停止のタイプ (マイナー、メジャー) を素早く区別できます。
`jvm_gc_pause_seconds_sum`	ガベージコレクションの一時停止の合計累積時間。JVM でのアプリケーションパフォーマンスに対する GC 一時停止の影響を示します。
`jvm_gc_pause_seconds_count`	ガベージコレクションの一時停止イベントの合計数をカウントします。JVM での GC 一時停止の頻度を評価するのに役立ちます。
`jvm_gc_overhead`	ガベージコレクションに費やされた CPU 時間の割合。JVM でのアプリケーションパフォーマンスに対する GC の影響を示します。これは、アプリケーションコードの実行やその他のタスクの実行ではなく、ガベージコレクション (GC) 操作の実行に費やされる合計 CPU 処理時間の割合を指します。このメトリクスは、GC によってどの程度のオーバーヘッドが発生し、Red Hat build of Keycloak の全体的なパフォーマンスに影響するかどうかを判断するのに役立ちます。

5.3.2.4. Kubernetes の CPU 使用率
リンクのコピー

Expand

メトリクス	説明
`container_cpu_usage_seconds_total`	コンテナーによって消費された累積 CPU 時間 (コア秒)。

5.3.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、データベースメトリクスに進みます

5.4. データベースメトリクス
リンクのコピー

メトリクスを使用して、Red Hat build of Keycloak のデータベースへの接続を記述します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.4.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.4.2. データベース接続プールのメトリクス
リンクのコピー

固定サイズのデータベース接続プールを使用するように、Red Hat build of Keycloak を設定します。詳細は、データベース接続プールの概念の章を参照してください。

ヒント

データベース接続を待機しているスレッドの数が多い場合、データベース接続プールのサイズを増やすことが必ずしも最適なオプションとは限りません。データベースに負荷がかかり過ぎ、ボトルネックになる可能性があります。代わりに次のオプションを検討してください。

http-pool-max-threads オプションを使用して HTTP ワーカースレッドの数を減らし、利用可能なデータベース接続と一致させます。そうすることで、Red Hat build of Keycloak での競合とリソース使用量が減少し、スループットが向上します。
データベース上で実行されるデータベースステートメントを確認します。たとえば、クライアントとグループに関する大量の情報が取得され、users と realms のキャッシュがいっぱいになっている場合、これらのキャッシュのサイズを増やすことでデータベースの負荷が軽減されるかどうかを確認する必要がある可能性があります。

Expand

メトリクス	説明
`agroal_available_count`	アイドル状態のデータベース接続。
`agroal_active_count`	進行中のトランザクションで使用されるデータベース接続。
`agroal_awaiting_count`	データベース接続が利用可能になるのを待機しているスレッド。

5.4.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、HTTP メトリクスに進みます。

5.5. HTTP メトリック
リンクのコピー

メトリクスを使用して、Red Hat build of Keycloak HTTP リクエストの処理を監視します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.5.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.5.2. メトリクス
リンクのコピー

5.5.2.1. Processing time
リンクのコピー

これらのメトリクスによって処理時間が公開され、Red Hat build of Keycloak のパフォーマンスとリクエストの処理にかかる時間を監視できます。

ヒント

健全なクラスターでは、平均処理時間は安定しています。処理時間の急増や増加は、一部のノードに負荷がかかっていることを示す初期兆候である可能性があります。

タグ

method: HTTP メソッド。
outcome: より一般的な結果タグ。
status: HTTP ステータスコード。
uri: リクエストされた URI。

Expand

メトリクス	説明
`http_server_requests_seconds_count`	処理されたリクエストの合計数。
`http_server_requests_seconds_sum`	処理されたすべてのリクエストの合計所要時間。

http-metrics-histograms-enabled を true に設定することでこのメトリクスのヒストグラムを有効にでき、オプション http-metrics-slos を使用してサービスレベル目標の追加バケットを追加できます。

注記

ヒストグラムを有効にすると、パーセンタイルバケットが利用可能になります。これらはヒートマップを作成し、レイテンシーを分析するのに役立ちますが、パーセンタイルバケットの収集と公開を行うことで監視システムの負荷が増加します。

5.5.2.2. アクティブなリクエスト
リンクのコピー

現在アクティブなリクエストの数も確認できます。

Expand

メトリクス	説明
`http_server_active_requests`	現在アクティブなリクエストの数

5.5.2.3. 帯域幅
リンクのコピー

以下のメトリクスは、Red Hat build of Keycloak によって使用され、受信または送信されたリクエストとレスポンスによって消費される帯域幅とトラフィックを監視するのに役立ちます。

Expand

メトリクス	説明
`http_server_bytes_written_count`	送信されたレスポンスの合計数。
`http_server_bytes_written_sum`	送信されたバイトの合計数。
`http_server_bytes_read_count`	受信したリクエストの合計数。
`http_server_bytes_read_sum`	受信したバイトの合計数。

注記

5.5.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、以下に進みます

シングルサイトデプロイメントの場合は、クラスタリングメトリクスに進みます。
マルチサイトデプロイメントの場合は、マルチサイトデプロイメント用の埋め込み Infinispan メトリクスに進みます。

5.5.4. 関連するオプション
リンクのコピー

Expand

値

	値
`http-metrics-histograms-enabled` HTTP サーバー要求の継続期間のデフォルトバケットを使用したヒストグラムを有効にします。 CLI: `--http-metrics-histograms-enabled` Env: `KC_HTTP_METRICS_HISTOGRAMS_ENABLED` メトリクスが有効になっている場合にのみ使用可能	`true`、`false` (デフォルト)
`http-metrics-slos` HTTP サーバー要求のサービスレベル目標。デフォルトのヒストグラムの代わりにこれを使用するか、これを組み合わせて追加のバケットを追加します。ミリ秒単位で定義されたコンマ区切りの値のリストを指定します。5ms から 10s までのバケットの例: 5,10,25,50,250,500,1000,2500,5000,10000 CLI: `--http-metrics-slos` Env: `KC_HTTP_METRICS_SLOS` メトリクスが有効になっている場合にのみ使用可能

http-metrics-histograms-enabled

HTTP サーバー要求の継続期間のデフォルトバケットを使用したヒストグラムを有効にします。

CLI: --http-metrics-histograms-enabled
Env: KC_HTTP_METRICS_HISTOGRAMS_ENABLED

メトリクスが有効になっている場合にのみ使用可能

true、false (デフォルト)

http-metrics-slos

HTTP サーバー要求のサービスレベル目標。

デフォルトのヒストグラムの代わりにこれを使用するか、これを組み合わせて追加のバケットを追加します。ミリ秒単位で定義されたコンマ区切りの値のリストを指定します。5ms から 10s までのバケットの例: 5,10,25,50,250,500,1000,2500,5000,10000

CLI: --http-metrics-slos
Env: KC_HTTP_METRICS_SLOS

メトリクスが有効になっている場合にのみ使用可能

5.6. クラスタリングメトリクス
リンクのコピー

メトリクスを使用して、Red Hat build of Keycloak のノード間の通信を監視します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.6.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.6.2. メトリクス
リンクのコピー

複数の Red Hat build of Keycloak ノードをデプロイすると、それらのノード間で負荷を分散できますが、そのためにはノード間の通信が必要です。このセクションでは、Red Hat build of Keycloak 間の通信を監視して、起こりうる障害を特定するのに役立つメトリクスを説明します。

注記

これはシングルサイトデプロイメントにのみ適用されます。マルチサイトデプロイメントで説明されているように、複数のサイトを使用する場合、Red Hat build of Keycloak ノードはクラスター化されないため、ノード間の直接通信は行われません。

グローバルタグ

cluster=<name>: クラスター名。複数のクラスターからメトリクスを収集している場合、このタグを使用してメトリクスの所属先を識別できます。
node=<node>: メトリクスを報告するノードの名前。

警告

vendor_jgroups_ で始まるすべてのメトリクス名は、トラブルシューティングとデバッグのためだけに提供されています。メトリクス名は、Red Hat build of Keycloak の今後のリリースで予告なく変更される可能性があります。したがって、ダッシュボードや監視およびアラートでは使用しないことが推奨されます。

5.6.2.1. レスポンス時間
リンクのコピー

次のメトリクスは、リモートリクエストのレスポンス時間を公開します。レスポンス時間は 2 つのノード間で測定され、処理時間も含まれます。すべてのリクエストはこれらのメトリクスによって測定され、レスポンス時間はクラスターのライフサイクルを通じて安定しているはずです。

ヒント

健全なクラスターでは、レスポンス時間は安定しています。レスポンス時間が増加した場合は、クラスターの性能が低下しているか、ノードの負荷が大きいことを示している可能性があります。

タグ

node=<node>: 送信側ノードを識別します。
target_node=<node>: 受信ノードを識別します。

Expand

メトリクス	説明
`vendor_jgroups_stats_sync_requests_seconds_count`	受信ノードへの同期リクエストの数。
`vendor_jgroups_stats_sync_requests_seconds_sum`	受信ノードへの同期リクエストの合計期間

注記

ヒストグラムを有効にすると、パーセンタイルバケットが利用可能になります。これらはヒートマップを作成するのに役立ちますが、パーセンタイルバケットを収集して公開すると、デプロイメントのパフォーマンスに悪影響を与える可能性があります。

5.6.2.2. 帯域幅
リンクのコピー

Red Hat build of Keycloak によって送受信されるすべてのバイトは、これらのメトリクスによって収集されます。また、ハートビートなどのすべての内部メッセージもカウントされます。そのため、各ノードで現在使用されている帯域幅の計算が可能になります。

重要

メトリクス名は、使用されている JGroups トランスポートプロトコルによって異なります。

Expand

メトリクス	Protocol	説明
`vendor_jgroups_tcp_get_num_bytes_received`	`TCP`	ノードが受信したバイトの合計数。
`vendor_jgroups_udp_get_num_bytes_received`	`UDP`
`vendor_jgroups_tunnel_get_num_bytes_received`	`TUNNEL`
`vendor_jgroups_tcp_get_num_bytes_sent`	`TCP`	ノードが送信したバイトの合計数。
`vendor_jgroups_udp_get_num_bytes_sent`	`UDP`
`vendor_jgroups_tunnel_get_num_bytes_sent`	`TUNNEL`

5.6.2.3. スレッドプール
リンクのコピー

スレッドプールのサイズを監視することは、ノードに大きな負荷がかかっているかどうかを示す良い指標となります。受信したすべてのリクエストは処理のためにスレッドプールに追加され、スレッドプールがいっぱいになると、リクエストは破棄されます。再送信メカニズムにより、リソース使用量が増加しても信頼性の高い通信が確保されます。

ヒント

正常なクラスターでは、スレッドプールが最大サイズ (デフォルトでは 200 スレッド) に近づくことはありません。

注記

スレッドプールメトリクスは仮想スレッドでは使用できません。OpenJDK 21 で実行する場合、仮想スレッドはデフォルトで有効になります。

重要

メトリクス名は、使用されている JGroups トランスポートプロトコルによって異なります。デフォルトのトランスポートプロトコルは TCP です。

Expand

メトリクス	Protocol	説明
`vendor_jgroups_tcp_get_thread_pool_size`	`TCP`	スレッドプール内の現在のスレッド数。
`vendor_jgroups_udp_get_thread_pool_size`	`UDP`
`vendor_jgroups_tunnel_get_thread_pool_size`	`TUNNEL`
`vendor_jgroups_tcp_get_largest_size`	`TCP`	これまでにプール内で同時に存在したスレッドの最大数。
`vendor_jgroups_udp_get_largest_size`	`UDP`
`vendor_jgroups_tunnel_get_largest_size`	`TUNNEL`

5.6.2.4. フロー制御
リンクのコピー

フロー制御は、時間の経過とともに、メッセージ送信側の速度を最も遅い受信側の速度に合わせて調整します。これはクレジットベースのシステムを通じて実装され、各送信側のクレジットが送信時に減少します。送信側は、クレジットが 0 を下回るとブロックし、受信側から補充メッセージを受信した場合にのみメッセージの送信を再開します。

以下のメトリクスは、ブロックされたメッセージの数と平均ブロック時間を示しています。値がゼロではない場合、受信側が過負荷になっているためにクラスターのパフォーマンスが低下する可能性があることを示しています。

各ノードには、ユニキャストメッセージ用の UFC とマルチキャストメッセージ用の MFC という、2 つの独立したフロー制御プロトコルがあります。

ヒント

正常なクラスターでは、すべてのメトリクスの値がゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_ufc_get_number_of_blockings`	フロー制御がユニキャストメッセージの送信側をブロックした回数。
`vendor_jgroups_ufc_get_average_time_blocked`	ユニキャストメッセージを送信しようとしたときにフロー制御でブロックされた平均時間 (ミリ秒)。
`vendor_jgroups_mfc_get_number_of_blockings`	フロー制御がマルチキャストメッセージの送信側をブロックした回数。
`vendor_jgroups_mfc_get_average_time_blocked`	マルチキャストメッセージを送信しようとしたときにフロー制御でブロックされた平均時間 (ミリ秒)。

5.6.2.5. 再送信
リンクのコピー

JGroups は信頼性の高いメッセージ配信を提供します。メッセージがネットワーク上でドロップされた場合、または送信側がメッセージを処理できない場合は、再送信する必要があります。再送信によりリソース使用量が増加し、通常これはシステムの過負荷を示しています。

Random Early Drop (RED) は送信側のキューを監視します。キューがほぼいっぱいになると、メッセージはドロップされ、再送信が必要になります。これは、送信側のキューがいっぱいになってスレッドがブロックされることを防ぎます。

ヒント

正常なクラスターでは、すべてのメトリクスの値がゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_unicast3_get_num_xmits`	再送信されたメッセージの数。
`vendor_jgroups_red_get_dropped_messages`	送信側によってドロップされたメッセージの合計数。
`vendor_jgroups_red_get_drop_rate`	送信がによってドロップされた全メッセージの割合。

5.6.2.6. ネットワークパーティション
リンクのコピー

5.6.2.6.1. クラスターサイズ
リンクのコピー

クラスターサイズメトリクスは、クラスター内に存在するノードの数を報告します。異なる場合は、ノードが参加途中か、シャットダウンしているか、最悪の場合はネットワークパーティションの発生を示している可能性があります。

ヒント

正常なクラスターでは、すべてのノードで同じ値が示されます。

Expand

メトリクス	説明
`vendor_cluster_size`	クラスター内のノード数。

5.6.2.6.2. ネットワークパーティションイベント
リンクのコピー

クラスター内のネットワークパーティションはさまざまな理由で発生します。このメトリクスは、ネットワーク分割を予測するためには使用できませんが、ネットワーク分割が発生してクラスターが統合されたことを示します。

ヒント

正常なクラスターでは、このメトリクスの値はゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_merge3_get_num_merge_events`	ネットワーク分割が検出されてから復旧するまでの時間。

5.6.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、シングルサイトデプロイメント用の埋め込み Infinispan メトリクスに進みます

5.7. シングルサイトデプロイメント用の埋め込み Infinispan メトリクス
リンクのコピー

メトリクスを使用して、キャッシュの健全性とクラスターのレプリケーションを監視します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.7.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.7.2. メトリクス
リンクのコピー

グローバルタグ

cache=<name>: キャッシュの名前。

5.7.2.1. サイズ
リンクのコピー

これら 2 つのメトリクスを使用して、キャッシュ内のエントリーの数を監視します。キャッシュがクラスター化されている場合、各エントリーには所有者ノードと、異なるノードの 0 個以上のバックアップコピーが存在します。

ヒント

一意のエントリーサイズメトリクスを合計して、クラスターのエントリーの合計数を取得します。

Expand

メトリクス	説明
`vendor_statistics_approximate_entries`	バックアップコピーを含む、ノードによって保存されるエントリーの概数。
`vendor_statistics_approximate_entries_unique`	バックアップコピーを除く、ノードによって保存されるエントリーの概数。

5.7.2.2. データアクセス
リンクのコピー

次のメトリクスは、読み取り、書き込み、およびその期間などのキャッシュアクセスを監視します。

5.7.2.2.1. 保存
リンクのコピー

保存操作は、キャッシュに保存されている値を書き込む、または更新する書き込み操作です。

Expand

メトリクス	説明
`vendor_statistics_store_times_seconds_count`	保存リクエストの合計数。
`vendor_statistics_store_times_seconds_sum`	すべての保存リクエストの合計所要時間。

注記

5.7.2.2.2. 読み取り
リンクのコピー

読み取り操作はキャッシュから値を読み取ります。2 つのグループに分類でき、値が見つかった場合はヒット、見つからなかった場合はミスとなります。

Expand

メトリクス	説明
`vendor_statistics_hit_times_seconds_count`	ヒットに該当する読み取りリクエストの合計数。
`vendor_statistics_hit_times_seconds_sum`	ヒットに該当するすべての読み取りリクエストの合計所要時間。
`vendor_statistics_miss_times_seconds_count`	ミスに該当する読み取りリクエストの合計数。
`vendor_statistics_miss_times_seconds_sum`	ミスに該当するすべての読み取りリクエストの合計所要時間。

注記

5.7.2.2.3. 削除
リンクのコピー

削除操作はキャッシュから値を削除します。2 つのグループに分類でき、値が存在する場合はヒット、値が存在しない場合はミスとなります。

Expand

メトリクス	説明
`vendor_statistics_remove_hit_times_seconds_count`	ヒットに該当する削除リクエストの合計数。
`vendor_statistics_remove_hit_times_seconds_sum`	ヒットに該当するすべての削除リクエストの合計所要時間。
`vendor_statistics_remove_miss_times_seconds_count`	ミスに該当する削除リクエストの合計数。
`vendor_statistics_remove_miss_times_seconds_sum`	ミスに該当するすべての削除リクエストの合計所要時間。

注記

ヒント

users および realms キャッシュの場合、データベースの無効化は削除操作に変換されます。これらのメトリクスは、データベースエンティティーがどのくらいの頻度で変更され、そのためにキャッシュから削除されるかを示す優れた指標です。

Hit Ratio for read and remove operations

式を使用して、Prometheus などのシステムのキャッシュのヒット率を計算できます。たとえば、読み取り操作のヒット率は次のように表されます。

vendor_statistics_hit_times_seconds_count
/
(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count)

Read/Write ratio

上記のメトリクスを使用すると、式を使用してキャッシュの読み取り/書き込み比率を計算できます。

(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count)
/
(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count
 + vendor_statistics_remove_hit_times_seconds_count
 + vendor_statistics_remove_miss_times_seconds_count
 + vendor_statistics_store_times_seconds_count)

5.7.2.2.4. エビクション
リンクのコピー

エビクションは、キャッシュサイズを制限するプロセスであり、いっぱいになるとエントリーが削除され、新しいエントリーをキャッシュするためのスペースが確保されます。Red Hat build of Keycloak は、users、realms、authorization 内のデータベースエンティティーをキャッシュするため、データベースアクセスは常にエビクションイベントで進行します。

Expand

メトリクス	説明
`vendor_statistics_evictions`	エビクションイベントの合計数。

エビクション率

エビクションの急増と非常に高いデータベース CPU 使用率は、users または realms のキャッシュが小さすぎて、データベースからデータを頻繁に再ロードする必要があるためレスポンスが遅くなり、Red Hat build of Keycloak の操作がスムーズに実行できないことを意味します。十分なメモリーが利用可能な場合は、CLI オプションの cache-embedded-users-max-count または cache-embedded-realms-max-count を使用して、最大キャッシュサイズを増やすことを検討してください。

5.7.2.3. ロック
リンクのコピー

書き込みおよび削除操作では、値がローカルクラスター内とリモートサイトに複製されるまでロックが保持されます。

ヒント

正常なクラスターでは、保持されるロックの数は一定に保たれますが、デッドロックによって一時的な急増が生じる可能性があります。

Expand

メトリクス	説明
`vendor_lock_manager_number_of_locks_held`	現在このノードによって保持されているロックの数。

5.7.2.4. トランザクション
リンクのコピー

トランザクションキャッシュは、トランザクションを完了するために、One-Phase-Commit と Two-Phase-Commit の両方のプロトコルを使用します。これらのメトリクスは操作時間を追跡します。

注記

PESSMISTIC ロックモードでは、One-Phase-Commit が使用され、コミットリクエストは作成されません。

ヒント

正常なクラスターでは、ロールバックの数はゼロになります。デッドロックはまれですが、ロールバックの回数は増加します。

Expand

メトリクス	説明
`vendor_transactions_prepare_times_seconds_count`	準備リクエストの合計数。
`vendor_transactions_prepare_times_seconds_sum`	すべての準備リクエストの合計所要時間。
`vendor_transactions_rollback_times_seconds_count`	ロールバックリクエストの合計数。
`vendor_transactions_rollback_times_seconds_sum`	すべてのロールバックリクエストの合計所要時間。
`vendor_transactions_commit_times_seconds_count`	コミットリクエストの合計数。
`vendor_transactions_commit_times_seconds_sum`	すべてのコミットリクエストの合計所要時間。

注記

5.7.2.5. 状態遷移
リンクのコピー

状態遷移は、ノードがクラスターに参加したり、クラスターから離脱したりするときに発生します。保存されたデータのバランスを取り、必要なコピー数を保証する必要があります。

この操作によりリソースの使用量が増加し、全体的なパフォーマンスに悪影響を及ぼします。

Expand

メトリクス	説明
`vendor_state_transfer_manager_inflight_transactional_segment_count`	ローカルノードが他のノードに要求した処理中のトランザクションセグメントの数。
`vendor_state_transfer_manager_inflight_segment_transfer_count`	ローカルノードが他のノードに要求した処理中のセグメントの数。

5.7.2.6. クラスターデータレプリケーション
リンクのコピー

クラスターデータレプリケーションが障害の主な原因となる場合があります。これらのメトリクスは、レスポンス時間を報告します。つまり、更新のレプリケートにかかる時間だけでなく、失敗も報告します。

ヒント

正常なクラスターでは、平均レプリケーション時間はまったく、またはほとんど変動しません。失敗の数は増加しないはずです。

Expand

メトリクス	説明
`vendor_rpc_manager_replication_count`	成功したレプリケーションの合計数。
`vendor_rpc_manager_replication_failures`	失敗したレプリケーションの合計数。
`vendor_rpc_manager_average_replication_time`	クラスター内でのデータのレプリケートに費やされた平均時間 (ミリ秒)。

成功率

次の式を使用して、レプリケーション成功率を計算できます。

(vendor_rpc_manager_replication_count)
/
(vendor_rpc_manager_replication_count
 + vendor_rpc_manager_replication_failures)

5.7.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻ります。

5.8. マルチサイトデプロイメント用の埋め込み Infinispan メトリクス
リンクのコピー

メトリクスを使用してキャッシュの健全性を監視します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.8.1. 前提条件
リンクのコピー

Red Hat build of Keycloak でメトリクスを有効にしている。詳細は、メトリクスから洞察を得るの章を参照してください。
メトリクスを収集する監視システム。

5.8.2. メトリクス
リンクのコピー

グローバルタグ

cache=<name>: キャッシュの名前。

5.8.2.1. サイズ
リンクのコピー

ヒント

一意のエントリーサイズメトリクスを合計して、クラスターのエントリーの合計数を取得します。

Expand

メトリクス	説明
`vendor_statistics_approximate_entries`	バックアップコピーを含む、ノードによって保存されるエントリーの概数。
`vendor_statistics_approximate_entries_unique`	バックアップコピーを除く、ノードによって保存されるエントリーの概数。

5.8.2.2. データアクセス
リンクのコピー

次のメトリクスは、読み取り、書き込み、およびその期間などのキャッシュアクセスを監視します。

5.8.2.2.1. 保存
リンクのコピー

保存操作は、キャッシュに保存されている値を書き込む、または更新する書き込み操作です。

Expand

メトリクス	説明
`vendor_statistics_store_times_seconds_count`	保存リクエストの合計数。
`vendor_statistics_store_times_seconds_sum`	すべての保存リクエストの合計所要時間。

注記

5.8.2.2.2. 読み取り
リンクのコピー

Expand

メトリクス	説明
`vendor_statistics_hit_times_seconds_count`	ヒットに該当する読み取りリクエストの合計数。
`vendor_statistics_hit_times_seconds_sum`	ヒットに該当するすべての読み取りリクエストの合計所要時間。
`vendor_statistics_miss_times_seconds_count`	ミスに該当する読み取りリクエストの合計数。
`vendor_statistics_miss_times_seconds_sum`	ミスに該当するすべての読み取りリクエストの合計所要時間。

注記

5.8.2.2.3. 削除
リンクのコピー

削除操作はキャッシュから値を削除します。2 つのグループに分類でき、値が存在する場合はヒット、値が存在しない場合はミスとなります。

Expand

メトリクス	説明
`vendor_statistics_remove_hit_times_seconds_count`	ヒットに該当する削除リクエストの合計数。
`vendor_statistics_remove_hit_times_seconds_sum`	ヒットに該当するすべての削除リクエストの合計所要時間。
`vendor_statistics_remove_miss_times_seconds_count`	ミスに該当する削除リクエストの合計数。
`vendor_statistics_remove_miss_times_seconds_sum`	ミスに該当するすべての削除リクエストの合計所要時間。

注記

ヒント

Hit Ratio for read and remove operations

式を使用して、Prometheus などのシステムのキャッシュのヒット率を計算できます。たとえば、読み取り操作のヒット率は次のように表されます。

vendor_statistics_hit_times_seconds_count
/
(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count)

Read/Write ratio

上記のメトリクスを使用すると、式を使用してキャッシュの読み取り/書き込み比率を計算できます。

(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count)
/
(vendor_statistics_hit_times_seconds_count
 + vendor_statistics_miss_times_seconds_count
 + vendor_statistics_remove_hit_times_seconds_count
 + vendor_statistics_remove_miss_times_seconds_count
 + vendor_statistics_store_times_seconds_count)

5.8.2.2.4. エビクション
リンクのコピー

Expand

メトリクス	説明
`vendor_statistics_evictions`	エビクションイベントの合計数。

エビクション率

5.8.2.3. トランザクション
リンクのコピー

注記

PESSMISTIC ロックモードでは、One-Phase-Commit が使用され、コミットリクエストは作成されません。

ヒント

正常なクラスターでは、ロールバックの数はゼロになります。デッドロックはまれですが、ロールバックの回数は増加します。

Expand

メトリクス	説明
`vendor_transactions_prepare_times_seconds_count`	準備リクエストの合計数。
`vendor_transactions_prepare_times_seconds_sum`	すべての準備リクエストの合計所要時間。
`vendor_transactions_rollback_times_seconds_count`	ロールバックリクエストの合計数。
`vendor_transactions_rollback_times_seconds_sum`	すべてのロールバックリクエストの合計所要時間。
`vendor_transactions_commit_times_seconds_count`	コミットリクエストの合計数。
`vendor_transactions_commit_times_seconds_sum`	すべてのコミットリクエストの合計所要時間。

注記

5.8.3. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻るか、外部 Data Grid メトリクスに進みます。

5.9. 外部 Data Grid メトリクス
リンクのコピー

メトリクスを使用して外部の Data Grid パフォーマンスを監視します。

これは、メトリクスを使用したトラブルシューティング章の一部です。

5.9.1. 前提条件
リンクのコピー

5.9.1.1. Data Grid サーバーメトリクスを有効にした。
リンクのコピー

Data Grid がエンドポイント /metrics でメトリクスを公開している。デフォルトでは有効になっています。メトリクス名がキャッシュ名に依存しなくなるため、name-as-tags 属性を有効にすることが推奨されます。

Data Grid サーバーでメトリクスを設定するには、以下の XML で示すとおり有効にします。

infinispan.xml

<infinispan>
    <cache-container statistics="true">
        <metrics gauges="true" histograms="false" name-as-tags="true" />
    </cache-container>
</infinispan>

Kubernetes の Data Grid Operator を使用すると、カスタム設定の ConfigMap を使用してメトリクスを有効にできます。以下に例を示します。

ConfigMap

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-config
data:
  infinispan-config.yaml: >
    infinispan:
      cacheContainer:
        metrics:
          gauges: true
          namesAsTags: true
          histograms: false

infinispan.yaml CR

apiVersion: infinispan.org/v1
kind: Infinispan
metadata:
  name: infinispan
  annotations:
    infinispan.org/monitoring: 'true'


spec:
  configMapName: "cluster-config"

1: デプロイメントの監視を有効にします
2: カスタム設定で ConfigMap 名を設定します。

関連情報は、Infinispan のドキュメントおよび Infinispan Operator のドキュメントを参照してください。

5.9.2. クラスタリングとネットワーク
リンクのコピー

このセクションでは、Data Grid ノード間の通信を監視して、起こりうるネットワークの問題を特定するために役立つメトリクスを説明します。

グローバルタグ

cluster=<name>: クラスター名。複数のクラスターからメトリクスを収集している場合、このタグを使用してメトリクスの所属先を識別できます。
node=<node>: メトリクスを報告するノードの名前。

警告

5.9.2.1. レスポンス時間
リンクのコピー

ヒント

タグ

node=<node>: 送信側ノードを識別します。
target_node=<node>: 受信ノードを識別します。

Expand

メトリクス	説明
`vendor_jgroups_stats_sync_requests_seconds_count`	受信ノードへの同期リクエストの数。
`vendor_jgroups_stats_sync_requests_seconds_sum`	受信ノードへの同期リクエストの合計期間

注記

5.9.2.2. 帯域幅
リンクのコピー

Data Grid が送受信するすべてのバイトは、これらのメトリクスによって収集されます。また、ハートビートなどのすべての内部メッセージもカウントされます。そのため、各ノードで現在使用されている帯域幅の計算が可能になります。

重要

メトリクス名は、使用されている JGroups トランスポートプロトコルによって異なります。

Expand

メトリクス	Protocol	説明
`vendor_jgroups_tcp_get_num_bytes_received`	`TCP`	ノードが受信したバイトの合計数。
`vendor_jgroups_udp_get_num_bytes_received`	`UDP`
`vendor_jgroups_tunnel_get_num_bytes_received`	`TUNNEL`
`vendor_jgroups_tcp_get_num_bytes_sent`	`TCP`	ノードが送信したバイトの合計数。
`vendor_jgroups_udp_get_num_bytes_sent`	`UDP`
`vendor_jgroups_tunnel_get_num_bytes_sent`	`TUNNEL`

5.9.2.3. スレッドプール
リンクのコピー

ヒント

正常なクラスターでは、スレッドプールが最大サイズ (デフォルトでは 200 スレッド) に近づくことはありません。

注記

スレッドプールメトリクスは仮想スレッドでは使用できません。OpenJDK 21 で実行する場合、仮想スレッドはデフォルトで有効になります。

重要

メトリクス名は、使用されている JGroups トランスポートプロトコルによって異なります。デフォルトのトランスポートプロトコルは TCP です。

Expand

メトリクス	Protocol	説明
`vendor_jgroups_tcp_get_thread_pool_size`	`TCP`	スレッドプール内の現在のスレッド数。
`vendor_jgroups_udp_get_thread_pool_size`	`UDP`
`vendor_jgroups_tunnel_get_thread_pool_size`	`TUNNEL`
`vendor_jgroups_tcp_get_largest_size`	`TCP`	これまでにプール内で同時に存在したスレッドの最大数。
`vendor_jgroups_udp_get_largest_size`	`UDP`
`vendor_jgroups_tunnel_get_largest_size`	`TUNNEL`

5.9.2.4. フロー制御
リンクのコピー

各ノードには、ユニキャストメッセージ用の UFC とマルチキャストメッセージ用の MFC という、2 つの独立したフロー制御プロトコルがあります。

ヒント

正常なクラスターでは、すべてのメトリクスの値がゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_ufc_get_number_of_blockings`	フロー制御がユニキャストメッセージの送信側をブロックした回数。
`vendor_jgroups_ufc_get_average_time_blocked`	ユニキャストメッセージを送信しようとしたときにフロー制御でブロックされた平均時間 (ミリ秒)。
`vendor_jgroups_mfc_get_number_of_blockings`	フロー制御がマルチキャストメッセージの送信側をブロックした回数。
`vendor_jgroups_mfc_get_average_time_blocked`	マルチキャストメッセージを送信しようとしたときにフロー制御でブロックされた平均時間 (ミリ秒)。

5.9.2.5. 再送信
リンクのコピー

ヒント

正常なクラスターでは、すべてのメトリクスの値がゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_unicast3_get_num_xmits`	再送信されたメッセージの数。
`vendor_jgroups_red_get_dropped_messages`	送信側によってドロップされたメッセージの合計数。
`vendor_jgroups_red_get_drop_rate`	送信がによってドロップされた全メッセージの割合。

5.9.2.6. ネットワークパーティション
リンクのコピー

5.9.2.6.1. クラスターサイズ
リンクのコピー

ヒント

正常なクラスターでは、すべてのノードで同じ値が示されます。

Expand

メトリクス	説明
`vendor_cluster_size`	クラスター内のノード数。

5.9.2.6.2. クロスサイトステータス
リンクのコピー

クロスサイトステータスは、他のサイトへの接続ステータスを報告します。オンラインの場合は 1 を、オフラインの場合は 0 を返します。2 の値は、ステータスが不明なノードで使用されます。すべてのノードがリモートサイトへの接続を確立するわけではなく、その場合はこの情報は含まれません。

ヒント

正常なクラスターはゼロより大きい値を示します。

Expand

メトリクス	説明
`vendor_jgroups_site_view_status`	シングルサイトのステータス (オンラインの場合は 1)。

タグ

site=<name>: 宛先サイトの名前。

5.9.2.6.3. ネットワークパーティションイベント
リンクのコピー

ヒント

正常なクラスターでは、このメトリクスの値はゼロになります。

Expand

メトリクス	説明
`vendor_jgroups_merge3_get_num_merge_events`	ネットワーク分割が検出されてから復旧するまでの時間。

5.9.3. Data Grid キャッシュ
リンクのコピー

このセクションのメトリクスは、Data Grid キャッシュの健全性とクラスターのレプリケーションを監視するために役立ちます。

グローバルタグ

cache=<name>: キャッシュの名前。

5.9.3.1. サイズ
リンクのコピー

ヒント

一意のエントリーサイズメトリクスを合計して、クラスターのエントリーの合計数を取得します。

Expand

メトリクス	説明
`vendor_statistics_approximate_entries`	バックアップコピーを含む、ノードによって保存されるエントリーの概数。
`vendor_statistics_approximate_entries_unique`	バックアップコピーを除く、ノードによって保存されるエントリーの概数。

5.9.3.2. データアクセス
リンクのコピー

次のメトリクスは、読み取り、書き込み、およびその期間などのキャッシュアクセスを監視します。

5.9.3.2.1. 保存
リンクのコピー

保存操作は、キャッシュに保存されている値を書き込む、または更新する書き込み操作です。

Expand

メトリクス	説明
`vendor_statistics_store_times_seconds_count`	保存リクエストの合計数。
`vendor_statistics_store_times_seconds_sum`	すべての保存リクエストの合計所要時間。

注記

5.9.3.2.2. 読み取り
リンクのコピー

Expand

メトリクス	説明
`vendor_statistics_hit_times_seconds_count`	ヒットに該当する読み取りリクエストの合計数。
`vendor_statistics_hit_times_seconds_sum`	ヒットに該当するすべての読み取りリクエストの合計所要時間。
`vendor_statistics_miss_times_seconds_count`	ミスに該当する読み取りリクエストの合計数。
`vendor_statistics_miss_times_seconds_sum`	ミスに該当するすべての読み取りリクエストの合計所要時間。

注記

5.9.3.2.3. 削除
リンクのコピー

削除操作はキャッシュから値を削除します。2 つのグループに分類でき、値が存在する場合はヒット、値が存在しない場合はミスとなります。

Expand

メトリクス	説明
`vendor_statistics_remove_hit_times_seconds_count`	ヒットに該当する削除リクエストの合計数。
`vendor_statistics_remove_hit_times_seconds_sum`	ヒットに該当するすべての削除リクエストの合計所要時間。
`vendor_statistics_remove_miss_times_seconds_count`	ミスに該当する削除リクエストの合計数。
`vendor_statistics_remove_miss_times_seconds_sum`	ミスに該当するすべての削除リクエストの合計所要時間。

注記

5.9.3.3. ロック
リンクのコピー

書き込みおよび削除操作では、値がローカルクラスター内とリモートサイトに複製されるまでロックが保持されます。

ヒント

正常なクラスターでは、保持されるロックの数は一定に保たれますが、デッドロックによって一時的な急増が生じる可能性があります。

Expand

メトリクス	説明
`vendor_lock_manager_number_of_locks_held`	現在このノードによって保持されているロックの数。

5.9.3.4. トランザクション
リンクのコピー

注記

PESSMISTIC ロックモードでは、One-Phase-Commit が使用され、コミットリクエストは作成されません。

ヒント

正常なクラスターでは、ロールバックの数はゼロになります。デッドロックはまれですが、ロールバックの回数は増加します。

Expand

メトリクス	説明
`vendor_transactions_prepare_times_seconds_count`	準備リクエストの合計数。
`vendor_transactions_prepare_times_seconds_sum`	すべての準備リクエストの合計所要時間。
`vendor_transactions_rollback_times_seconds_count`	ロールバックリクエストの合計数。
`vendor_transactions_rollback_times_seconds_sum`	すべてのロールバックリクエストの合計所要時間。
`vendor_transactions_commit_times_seconds_count`	コミットリクエストの合計数。
`vendor_transactions_commit_times_seconds_sum`	すべてのコミットリクエストの合計所要時間。

注記

5.9.3.5. 状態遷移
リンクのコピー

この操作によりリソースの使用量が増加し、全体的なパフォーマンスに悪影響を及ぼします。

Expand

メトリクス	説明
`vendor_state_transfer_manager_inflight_transactional_segment_count`	ローカルノードが他のノードに要求した処理中のトランザクションセグメントの数。
`vendor_state_transfer_manager_inflight_segment_transfer_count`	ローカルノードが他のノードに要求した処理中のセグメントの数。

5.9.3.6. クラスターデータレプリケーション
リンクのコピー

ヒント

正常なクラスターでは、平均レプリケーション時間はまったく、またはほとんど変動しません。失敗の数は増加しないはずです。

Expand

メトリクス	説明
`vendor_rpc_manager_replication_count`	成功したレプリケーションの合計数。
`vendor_rpc_manager_replication_failures`	失敗したレプリケーションの合計数。
`vendor_rpc_manager_average_replication_time`	クラスター内でのデータのレプリケートに費やされた平均時間 (ミリ秒)。

成功率

次の式を使用して、レプリケーション成功率を計算できます。

(vendor_rpc_manager_replication_count)
/
(vendor_rpc_manager_replication_count
 + vendor_rpc_manager_replication_failures)

5.9.3.7. クロスサイトデータレプリケーション
リンクのコピー

このセクションのメトリクスは、クラスターデータレプリケーションと同様に、データを他のサイトにレプリケートするためにかかる時間を測定します。

ヒント

正常なクラスターでは、クロスサイトレプリケーションの平均時間はまったく、またはほとんど変動しません。

タグ

site=<name>: 受信サイトを示します。

Expand

メトリクス	説明
`vendor_rpc_manager_cross_site_replication_times_seconds_count`	クロスサイトリクエストの合計数。
`vendor_rpc_manager_cross_site_replication_times_seconds_sum`	すべてのクロスサイトリクエストの合計所要時間。
`vendor_rpc_manager_replication_times_to_site_seconds_count`	クロスサイトリクエストの合計数。このメトリクスは、サイトごとのカウンターを使用することで、さらに詳細になります。
`vendor_rpc_manager_replication_times_to_site_seconds_sum`	すべてのクロスサイトリクエストの合計所要時間。このメトリクスは、サイトごとの所要時間を使用することで、さらに詳細になります。
`vendor_rpc_manager_number_xsite_requests_received_from_site`	このノードによって処理されるクロスサイトリクエストの合計数。このメトリクスは、サイトごとのカウンターを使用することで、さらに詳細になります。
`vendor_x_site_admin_status`	サイトのステータス。値が 1 の場合、オンラインであることを示します。この値は、Data Grid CLI コマンドの `bring-online` および `take-offline` に反応します。

注記

5.9.4. 次のステップ
リンクのコピー

メトリクスを使用したトラブルシューティングに戻ります。

第6章トレーシングによる根本原因分析
リンクのコピー

OpenTelementry トレーシングを使用してリクエストライフサイクル中に情報を記録し、Red Hat build of Keycloak と接続されたシステムにおけるレイテンシーとエラーの根本原因を特定します。

この章では、OpenTelemetry (OTel) を利用して、Red Hat build of Keycloak で分散トレーシングを有効にして設定する方法を説明します。トレーシングにより、各リクエストのライフサイクルを詳細に監視できるため、問題を迅速に特定して診断し、デバッグとメンテナンスをより効率的に行うことができます。

パフォーマンスのボトルネックに関する貴重な洞察を得ることができ、システム全体の効率とシステム境界を越えた最適化に役立ちます。Red Hat build of Keycloak では、アプリケーショントレースのスムーズなインテグレーションと公開を提供する、サポート対象の Quarkus OTel エクステンションが使用されます。

6.1. トレーシングを有効にする
リンクのコピー

次のようにビルド時のオプション tracing-enabled を使用して、トレースの公開を有効にできます。

bin/kc.[sh|bat] start --tracing-enabled=true

デフォルトでは、トレースエクスポーターは gRPC プロトコルとエンドポイント http://localhost:4317 を使用して、データをバッチで送信します。

デフォルトのサービス名は keycloak で、tracing-service-name プロパティーで指定され、tracing-resource-attributes プロパティーで定義された service.name よりも優先されます。

tracing-resource-attributes プロパティーを介して提供できるリソース属性の詳細は、Quarkus OpenTelemetry リソースガイドを参照してください。

注記

トレーシングは、opentelemetry 機能が有効になっている場合 (デフォルト) のみ有効にできます。

詳細なトレーシング設定は、以下の可能なすべての設定を参照してください。

6.2. 開発セットアップ
リンクのコピー

キャプチャーされた Red Hat build of Keycloak トレースを表示するには、Jaeger トレーシングプラットフォームを活用した基本的なセットアップを使用できます。開発目的の場合は、Jaeger-all-in-one を使用してトレースをできるだけ簡単に確認できます。

注記

Jaeger-all-in-one には、Jaeger エージェント、OTel コレクター、クエリーサービス/UI が含まれています。トレースデータを Jaeger に直接送信できるため、別のコレクターをインストールする必要はありません。

podman run --name jaeger \
-p 16686:16686 \
-p 4317:4317 \
-p 4318:4318 \
jaegertracing/all-in-one

6.2.1. 公開されたポート
リンクのコピー

16686: Jaeger UI
4317: OpenTelemetry Protocol gRPC レシーバー (デフォルト)
4318: OpenTelemetry Protocol HTTP レシーバー

トレーシング情報を確認するには、http://localhost:16686/ の Jaeger UI にアクセスしてください。Jaeger UI は、任意の Red Hat build of Keycloak トレースを使用した場合、以下のように表示される可能性があります。

6.3. トレースする情報
リンクのコピー

6.3.1. スパン
リンクのコピー

Red Hat build of Keycloak は次のアクティビティーのスパンを作成します。

受信 HTTP リクエスト
送信データベース (データベース接続の取得を含む)
送信 LDAP リクエスト (LDAP サーバーへの接続を含む)
送信 HTTP リクエスト (IdP 仲介を含む)

6.3.2. タグ
リンクのコピー

Red Hat build of Keycloak は、リクエストの種類に応じてトレースにタグを追加します。すべてのタグには kc. という接頭辞が付きます。

以下はタグの例です。

kc.clientId: クライアント ID
kc.realmName: レルム名
kc.sessionId: ユーザーセッション ID
kc.token.id: トークンに記載されている ID
kc.token.issuer: トークンに記載されている issuer
kc.token.sid: トークンに記載されている sid
kc.authenticationSessionId: 認証セッション ID
kc.authenticationTabId: 認証タブ ID

6.3.3. Logs
リンクのコピー

トレースがサンプリングされている場合、リクエスト中に作成されたすべてのユーザーイベントが含まれます。これには、ユーザーイベントで見つかったすべての詳細と ID を含む LOGIN、LOGOUT、または REFRESH_TOKEN イベントなどが含まれます。

LDAP 通信エラーは、スタックトレースと失敗した操作の詳細とともに、記録されたトレースのログエントリーとして表示されます。

6.4. ログ内のトレース ID
リンクのコピー

トレースを有効にすると、有効なすべてのログハンドラーのログメッセージにトレース ID が含まれます (詳細は、ロギングの設定を参照してください)。ログイベントをリクエスト実行に関連付ける場合に役立ち、トレーサビリティーとデバッグが向上する可能性があります。同じリクエストから生成されたすべてのログ行は、ログ内で同じ traceId を持ちます。

ログメッセージには、以下で説明するサンプリングに関連し、スパンがサンプリングされてコレクターに送信されたかを示す sampled フラグも含まれます。

ログレコードの形式は次のように始まります。

2024-08-05 15:27:07,144 traceId=b636ac4c665ceb901f7fdc3fc7e80154, parentId=d59cea113d0c2549, spanId=d59cea113d0c2549, sampled=true WARN  [org.keycloak.events] ...

6.4.1. ログ内のトレース ID を非表示にする
リンクのコピー

特定のログハンドラーのトレース ID を非表示にするには、関連する Red Hat build of Keycloak オプション log-<handler-name>-include-trace を指定します。ここで、<handler-name> はログハンドラーの名前になります。たとえば、console ログのトレース情報を無効にするには、次のようにオフにします。

bin/kc.[sh|bat] start --tracing-enabled=true --log=console --log-console-include-trace=false

注記

特定のログハンドラーのログ形式を明示的にオーバーライドすると、*-include-trace オプションは効果がなく、トレーシングは含まれません。

6.5. サンプリング
リンクのコピー

サンプラーは、トレースを破棄するか転送するかを決定し、コレクターに送信される収集されたトレースの数を制限することでオーバーヘッドを効果的に削減します。これはリソース消費の管理に役立ち、すべてのリクエストをトレーシングするための膨大なストレージコストと潜在的なパフォーマンスの低下を回避します。

警告

実稼働環境の場合は、インフラストラクチャーコストを最小限に抑えるために、サンプリングを適切に設定する必要があります。

Red Hat build of Keycloak は、次のようないくつかの組み込み OpenTelemetry サンプラーをサポートしています。

always_on
always_off
traceidratio (デフォルト)
parentbased_always_on
parentbased_always_off
parentbased_traceidratio

使用されるサンプラーは、tracing-sampler-type プロパティーを介して変更できます。

6.5.1. デフォルトのサンプラー
リンクのコピー

Red Hat build of Keycloak のデフォルトのサンプラーは traceidratio です。これは、tracing-sampler-ratio プロパティーで設定可能な指定された比率に基づいてトレースサンプリングのレートを制御します。

6.5.1.1. トレース比率
リンクのコピー

デフォルトのトレース比率は 1.0 です。これは、すべてのトレースがサンプリングされ、コレクターに送信されることを意味します。比率は [0,1] の範囲の浮動小数点数です。たとえば、比率が 0.1 の場合、トレースの 10% のみがサンプリングされます。

警告

実稼働環境の場合、トレースストアインフラストラクチャーの膨大なコストを防ぎ、パフォーマンスのオーバーヘッドを回避するために、トレース比率を小さくする必要があります。

ヒント

比率を 0.0 に設定すると、実行時 のサンプリングが完全に無効になります。

6.5.1.2. 理由
リンクのコピー

サンプラーは、parentbased_traceidratio サンプラーを使用する場合と同様に、親スパンで行われた決定に関係なく、サンプリングされたスパンの現在の比率に基づいて独自のサンプリング決定を行います。

parentbased_traceidratio サンプラーは、親スパンと子スパンの間のサンプリングの一貫性を確保するため、推奨されるデフォルトタイプになる可能性があります。具体的には、親スパンがサンプリングされると、そのすべての子スパンもサンプリングされます。つまり、すべてに対して同じサンプリング決定が行われます。すべてのスパンをまとめて保持し、不完全なトレースの保存を防ぐのに役立ちます。

ただし、DoS 攻撃につながる特定のセキュリティーリスクが発生する可能性があります。外部の呼び出し元がトレースヘッダーを操作したり、親スパンを注入したり、トレースストアが過負荷になったりする可能性があります。適切な HTTP ヘッダー (特に tracestate) フィルタリングと、呼び出し元の信頼性を評価するための十分な対策が必要です。

詳細は、W3C Trace コンテキストドキュメントを参照してください。

6.6. Kubernetes 環境でのトレーシング
リンクのコピー

Red Hat build of Keycloak Operator を使用しているときにトレーシングを有効にすると、デプロイメントに関する特定の情報が基盤となるコンテナーに伝播されます。

6.6.1. Keycloak CR を介した設定
リンクのコピー

Keycloak CR を介してトレース設定を変更できます。詳細は、詳細設定を参照してください。

6.6.2. Kubernetes 属性に基づきトレースをフィルタリングする
リンクのコピー

タグに基づいて、トレーシングバックエンドで必要なトレースをフィルター処理できます。

service.name - Red Hat build of Keycloak デプロイメント名
k8s.namespace.name - namespace
host.name - Pod 名

Red Hat build of Keycloak Operator は、管理する Pod に含まれる Red Hat build of Keycloak コンテナーごとに、KC_TRACING_SERVICE_NAME および KC_TRACING_RESOURCE_ATTRIBUTES 環境変数を自動的に設定します。

注記

KC_TRACING_RESOURCE_ATTRIBUTES 変数には、必ず (オーバーライドされない場合) 現在の namespace を表す k8s.namespace.name 属性が含まれます。

6.7. 関連するオプション
リンクのコピー

Expand

	値
`log-console-include-trace` コンソールログにトレーシング情報を含めます。 `log-console-format` オプションが指定されている場合、このオプションは効果がありません。 CLI: `--log-console-include-trace` Env: `KC_LOG_CONSOLE_INCLUDE_TRACE` コンソールログハンドラーとトレーシングが有効な場合にのみ使用可能	`true` (デフォルト)、`false`
`log-file-include-trace` ファイルログにトレーシング情報を含めます。 `log-file-format` オプションが指定されている場合、このオプションは効果がありません。 CLI: `--log-file-include-trace` Env: `KC_LOG_FILE_INCLUDE_TRACE` File ログハンドラーとトレーシングが有効な場合にのみ使用可能	`true` (デフォルト)、`false`
`log-syslog-include-trace` Syslog にトレーシング情報を含めます。 `log-syslog-format` オプションが指定されている場合、このオプションは効果がありません。 CLI: `--log-syslog-include-trace` Env: `KC_LOG_SYSLOG_INCLUDE_TRACE` Syslog ハンドラーとトレーシングが有効な場合にのみ使用可能	`true` (デフォルト)、`false`
`tracing-compression` ペイロードを圧縮するために使用される OpenTelemetry 圧縮方法。設定されていない場合は、圧縮は無効になります。 CLI: `--tracing-compression` Env: `KC_TRACING_COMPRESSION` トレースが有効な場合にのみ使用可能	`gzip`、`none` (デフォルト)
`tracing-enabled` 🛠 OpenTelemetry トレースを有効にします。 CLI: `--tracing-enabled` Env: `KC_TRACING_ENABLED` 'opentelemetry' 機能が有効になっている場合にのみ利用可能	`true`、`false` (デフォルト)
`tracing-endpoint` 接続する OpenTelemetry エンドポイント。 CLI: `--tracing-endpoint` Env: `KC_TRACING_ENDPOINT` トレースが有効な場合にのみ使用可能	`http://localhost:4317` (デフォルト)
`tracing-jdbc-enabled` 🛠 OpenTelemetry JDBC トレースを有効にします。 CLI: `--tracing-jdbc-enabled` Env: `KC_TRACING_JDBC_ENABLED` トレースが有効な場合にのみ使用可能	`true` (デフォルト)、`false`
`tracing-protocol` テレメトリーデータに使用される OpenTelemetry プロトコル。 CLI: `--tracing-protocol` Env: `KC_TRACING_PROTOCOL` トレースが有効な場合にのみ使用可能	`grpc` (デフォルト)、`http/protobuf`
`tracing-resource-attributes` テレメトリープロデューサーを特定するためにトレースとしてエクスポートされるデータに含まれる OpenTelemetry リソース属性。値は `key1=val1,key2=val2` の形式です。詳細は、トレーシングガイドを参照してください。 CLI: `--tracing-resource-attributes` Env: `KC_TRACING_RESOURCE_ATTRIBUTES` トレースが有効な場合にのみ使用可能
`tracing-sampler-ratio` OpenTelemetry サンプラー比率。スパンのサンプリングが行われる確率。範囲 [0,1] 内の double 値が期待されます。 CLI: `--tracing-sampler-ratio` Env: `KC_TRACING_SAMPLER_RATIO` トレースが有効な場合にのみ使用可能	`1.0` (デフォルト)
`tracing-sampler-type` 🛠 トレースに使用する OpenTelemetry サンプラー。 CLI: `--tracing-sampler-type` Env: `KC_TRACING_SAMPLER_TYPE` トレースが有効な場合にのみ使用可能	`always_on`、`always_off`、`traceidratio` (デフォルト)、`parentbased_always_on`、`parentbased_always_off`、`parentbased_traceidratio`
`tracing-service-name` OpenTelemetry サービス名。 `tracing-resource-attributes` プロパティーで定義された `service.name` よりも優先されます。 CLI: `--tracing-service-name` Env: `KC_TRACING_SERVICE_NAME` トレースが有効な場合にのみ使用可能	`keycloak` (デフォルト)

第7章ダッシュボードでアクティビティーを可視化する
リンクのコピー

Red Hat build of Keycloak Grafana ダッシュボードをインストールして、デプロイメントのステータスとアクティビティーをキャプチャーするメトリクスを可視化します。

Red Hat build of Keycloak は、デプロイメント内で何が起こっているかを観察するためのメトリクスを提供します。メトリクスが時間の経過とともにどのように変化するかを理解するには、それらを収集してグラフで可視化すると役立ちます。

このガイドでは、実行中の Grafana インスタンスで収集された Red Hat build of Keycloak メトリクスを可視化する方法を説明します。

7.1. 前提条件
リンクのコピー

Red Hat build of Keycloak が有効になっている。詳細は、メトリクスから洞察を得るの章を参照してください。
Grafana インスタンスが実行されており、Red Hat build of Keycloak メトリクスは Prometheus インスタンスに集約される。
HTTP リクエストのレイテンシーヒートマップを機能させるために、http-metrics-histograms-enabled を true に設定して、HTTP メトリクスのヒストグラムを有効にした。

7.2. Red Hat build of Keycloak Grafana ダッシュボード
リンクのコピー

Grafana ダッシュボードは、Grafana インスタンスにインポートされる JSON ファイル形式で配布されます。Red Hat build of Keycloak Grafana ダッシュボードの JSON 定義は、keycloak/keycloak-grafana-dashboard GitHub repository で入手できます。

次のステップを実行して、JSON ファイル定義をダウンロードします。

次の表から、使用する keycloak-grafana-dashboards のブランチを特定します。
Expand
Red Hat build of Keycloak バージョン keycloak-grafana-dashboards ブランチ

26.1 以降

main

GitHub リポジトリーのクローンを作成します。

git clone -b BRANCH_FROM_STEP_1 https://github.com/keycloak/keycloak-grafana-dashboard.git

ダッシュボードは keycloak-grafana-dashboard/dashboards ディレクトリーにあります。

次のセクションでは、各ダッシュボードの目的を説明します。

7.2.1. Red Hat build of Keycloak トラブルシューティングダッシュボード
リンクのコピー

このダッシュボードは、JSON ファイル keycloak-troubleshooting-dashboard.json として利用できます。

ダッシュボードの上部には、サービスレベルインジケーターを使用してパフォーマンスを監視するで定義されているサービスレベルインジケーターがグラフに表示されます。このダッシュボードは、SLI グラフに想定された結果が表示されない場合などに、メトリクスを使用したトラブルシューティングに従って Red Hat build of Keycloak デプロイメントのトラブルシューティングを行うときにも使用できます。

図7.1 トラブルシューティングダッシュボード

7.2.2. Keycloak キャパシティープランニングダッシュボード
リンクのコピー

このダッシュボードは、JSON ファイル keycloak-capacity-planning-dashboard.json として利用できます。

このダッシュボードには、Red Hat build of Keycloak デプロイメントによって処理される負荷を見積もる際に重要なメトリクスが表示されます。たとえば、Red Hat build of Keycloak によって実行されたパスワード検証またはログインフローの数が表示されます。これらのメトリクスの詳細は、自己提供メトリクスの章を参照してください。

注記

このダッシュボードが正しく機能するには、Red Hat build of Keycloak イベントメトリクスを有効にする必要があります。これらを有効にするには、イベントメトリクスを使用してユーザーアクティビティーを関しするの章を参照してください。

図7.2 キャパシティープランニングダッシュボード

7.3. ダッシュボードのインポート
リンクのコピー

左側の Grafana メニューからダッシュボードページを開きます。
New および Import をクリックします。
Upload dashboard JSON file をクリックし、インポートするダッシュボードの JSON ファイルを選択します。
Prometheus データソースを選択します。
Import をクリックします。

7.4. ダッシュボードのエクスポート
リンクのコピー

ダッシュボードを JSON 形式でエクスポートすると便利な場合があります。たとえば、ダッシュボードリポジトリーの変更を提案したい場合などです。

エクスポートするダッシュボードを開きます。
ダッシュボード名の横の左上隅にある share をクリックします。
Export タブをクリックします。
Export for sharing externally を有効にします。
結果として得た JSON を保存する場所に応じて、Save to file または View JSON、および Copy to Clipboard をクリックします。

7.5. 関連資料
リンクのコピー

ダッシュボードにトレースを接続する方法は、エグゼンプラーを使用して外れ値とエラーを分析するの章を引き続きお読みください。

第8章エグゼンプラーを使用して外れ値とエラーを例を分析する
リンクのコピー

エグゼンプラーを使用して、記録されたトレースにメトリクスを接続し、エラーまたはレイテンシーの根本原因を分析します。

メトリクスは複数のイベントを集計したもので、システムが定義された範囲内で動作しているかどうかを示します。メトリクスは、エラー率やテールレイテンシーの監視、アラートの設定、パフォーマンス最適化の推進に使用できます。しかし、集約されることで、メトリクスで報告されるレイテンシーやエラーの根本原因を見つけることが難しくなります。

トレーシングを有効にすると、エラーやレイテンシーの根本原因を見つけることができます。記録されたトレースにメトリクスを接続する場合、エグゼンプラーという概念を使用します。

エグゼンプラーが設定されると、Red Hat build of Keycloak は最後に記録されたトレースをエグゼンプラーとしてメトリクスを報告します。Grafana のようなダッシュボードツールは、メトリクスダッシュボードからトレースビューにエグゼンプラーをリンクできます。

次のメトリクスは、エグゼンプラーをサポートしています。

http_server_requests_seconds_count (ヒストグラムを含む)
このメトリクスの詳細は、HTTP メトリクスの章を参照してください。
keycloak_credentials_password_hashing_validations_total
このメトリクスの詳細は、自己提供メトリクスの章を参照してください。
keycloak_user_events_total
このメトリクスの詳細は、自己提供メトリクスの章を参照してください。

以下に、レイテンシーを可視化したヒートマップのスクリーンショットを示します。ピンク色のインジケーターのいずれかにマウスを移動すると、エグゼンプラーが表示されます。

図8.1 ヒートマップ図とエグゼンプラー

8.1. エグゼンプラーを設定する
リンクのコピー

エグゼンプラーを活用するには、次のステップを実行します。

メトリクスから洞察を得るの章の説明に従って、Red Hat build of Keycloak のメトリクスを有効にします。
トレーシングによる根本原因分析の章の説明に従って、Red Hat build of Keycloak のトレーシングを有効にします。
監視システムでエグゼンプラーストレージを有効にします。
Prometheus の場合、これは有効化が必須のプレビュー機能です。
Prometheus ではデフォルトで有効になっていない OpenMetricsText1.0.0 プロトコルを使用して、メトリクスをスクレイピングします。
Kubernetes 環境で PodMonitor などを使用している場合は、カスタムリソースの仕様にこれを追加することで実現できます。
```
apiVersion: monitoring.coreos.com/v1
kind: PodMonitor
metadata:
  ...
spec:
  scrapeProtocols:
    - OpenMetricsText1.0.0
```
トレースのリンク先となるメトリクスデータソースを設定します。
Grafana と Prometheus を使用する場合、これは Prometheus データソースの exemplarTraceIdDestinations を設定することを意味し、これは Jaeger や Tempo などのツールが提供するトレーシングデータソースを指します。
ダッシュボードでエグゼンプラーを有効にします。
エグゼンプラーを表示する各ダッシュボードの各クエリーで、Exemplars の切り替えを有効にします。正しく設定するとダッシュボードに小さな点や星マークが表示され、これをクリックするとトレースが表示されます。

注記

スクレイププロトコルを指定しない場合、Prometheus はデフォルトでコンテンツネゴシエーションでそれを送信せず、Keycloak はエグゼンプラーが含まれない PrometheusText プロトコルにフォールバックします。
トレーシングとメトリクスを有効にしたが、リクエストサンプリングでトレースが記録されなかった場合、公開されたメトリクスにエグゼンプラーは含まれません。
ブラウザーでメトリクスエンドポイントにアクセスすると、コンテンツネゴシエーションによって PrometheusText 形式が返され、エグゼンプラーは表示されません。

8.2. エグゼンプラーが期待通りに動作するか検証する
リンクのコピー

以下のステップを実行して、Red Hat build of Keycloak でエグゼンプラーが正しく設定されていることを確認します。

指示に従って、Red Hat build of Keycloak のメトリクスとトレーシングを設定します。
テストのために、トレーシング比率を 1.0 に設定してすべてのトレースを記録します。実稼働システムで推奨されるサンプリング設定は、トレーシングによる根本原因分析を参照してください。
Keycloak インスタンスにログインして、トレースを作成します。
次のようなコマンドを使用してメトリクスをスクレイピングし、エグゼンプラーが設定されているメトリクスを検索します。
```
$ curl -s http://localhost:9000/metrics \
-H 'Accept: application/openmetrics-text; version=1.0.0; charset=utf-8' \
| grep "#.*trace_id"
```
次のような出力になるはずです。追加の # の後に、スパン ID とトレース ID が追加されることに注意してください。
```
http_server_requests_seconds_count {...} ... # {span_id="...",trace_id="..."} ...
```

法律上の通知
リンクのコピー

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License.You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.See the License for the specific language governing permissions and limitations under the License.

可観測性ガイド

第1章 ヘルスチェックを使用してインスタンスステータスを追跡するリンクのコピーリンクがクリップボードにコピーされました!

1.1. Red Hat build of Keycloak のヘルスチェックエンドポイントリンクのコピーリンクがクリップボードにコピーされました!

1.2. ヘルスチェックを有効にするリンクのコピーリンクがクリップボードにコピーされました!

1.3. ヘルスチェックを使用するリンクのコピーリンクがクリップボードにコピーされました!

1.3.1. curlリンクのコピーリンクがクリップボードにコピーされました!

1.3.2. Kubernetesリンクのコピーリンクがクリップボードにコピーされました!

1.3.3. HEALTHCHECKリンクのコピーリンクがクリップボードにコピーされました!

1.4. 利用可能なチェックリンクのコピーリンクがクリップボードにコピーされました!

1.5. 関連するオプションリンクのコピーリンクがクリップボードにコピーされました!

第2章 メトリクスから洞察を得るリンクのコピーリンクがクリップボードにコピーされました!

2.1. メトリクスを有効にするリンクのコピーリンクがクリップボードにコピーされました!

2.2. メトリクスのクエリーリンクのコピーリンクがクリップボードにコピーされました!

2.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

2.4. 関連するオプションリンクのコピーリンクがクリップボードにコピーされました!

第3章 イベントメトリクスを使用してユーザーアクティビティーを監視するリンクのコピーリンクがクリップボードにコピーされました!

3.1. イベントメトリクスを有効にするリンクのコピーリンクがクリップボードにコピーされました!

3.2. 関連するオプションリンクのコピーリンクがクリップボードにコピーされました!

第4章 サービスレベルインジケーターを使用してパフォーマンスを監視するリンクのコピーリンクがクリップボードにコピーされました!

4.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

4.2. 提供されるサービスの定義リンクのコピーリンクがクリップボードにコピーされました!

4.3. SLI と SLO の定義リンクのコピーリンクがクリップボードにコピーされました!

4.4. PromQL クエリーリンクのコピーリンクがクリップボードにコピーされました!

4.4.1. 可用性リンクのコピーリンクがクリップボードにコピーされました!

4.4.2. 認証リクエストのレイテンシーリンクのコピーリンクがクリップボードにコピーされました!

4.4.3. 認証リクエストのエラーリンクのコピーリンクがクリップボードにコピーされました!

4.5. 参考文献リンクのコピーリンクがクリップボードにコピーされました!

第5章 メトリクスを使用したトラブルシューティングリンクのコピーリンクがクリップボードにコピーされました!

5.1. Red Hat build of Keycloak 主要メトリクスのリストリンクのコピーリンクがクリップボードにコピーされました!

5.2. 自己提供のメトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.2.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.2.2. メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.2.2.1. ユーザーイベントメトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.2.2.2. パスワードのハッシュリンクのコピーリンクがクリップボードにコピーされました!

5.2.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

5.3. JVM メトリックリンクのコピーリンクがクリップボードにコピーされました!

5.3.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.3.2. メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.3.2.1. JVM 情報リンクのコピーリンクがクリップボードにコピーされました!

5.3.2.2. ヒープメモリー使用率リンクのコピーリンクがクリップボードにコピーされました!

5.3.2.3. ガベージコレクションリンクのコピーリンクがクリップボードにコピーされました!

5.3.2.4. Kubernetes の CPU 使用率リンクのコピーリンクがクリップボードにコピーされました!

5.3.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

5.4. データベースメトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.4.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.4.2. データベース接続プールのメトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.4.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

5.5. HTTP メトリックリンクのコピーリンクがクリップボードにコピーされました!

5.5.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.5.2. メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.5.2.1. Processing timeリンクのコピーリンクがクリップボードにコピーされました!

5.5.2.2. アクティブなリクエストリンクのコピーリンクがクリップボードにコピーされました!

5.5.2.3. 帯域幅リンクのコピーリンクがクリップボードにコピーされました!

5.5.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

5.5.4. 関連するオプションリンクのコピーリンクがクリップボードにコピーされました!

5.6. クラスタリングメトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.6.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.6.2. メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.6.2.1. レスポンス時間リンクのコピーリンクがクリップボードにコピーされました!

5.6.2.2. 帯域幅リンクのコピーリンクがクリップボードにコピーされました!

5.6.2.3. スレッドプールリンクのコピーリンクがクリップボードにコピーされました!

5.6.2.4. フロー制御リンクのコピーリンクがクリップボードにコピーされました!

5.6.2.5. 再送信リンクのコピーリンクがクリップボードにコピーされました!

5.6.2.6. ネットワークパーティションリンクのコピーリンクがクリップボードにコピーされました!

5.6.2.6.1. クラスターサイズリンクのコピーリンクがクリップボードにコピーされました!

5.6.2.6.2. ネットワークパーティションイベントリンクのコピーリンクがクリップボードにコピーされました!

5.6.3. 次のステップリンクのコピーリンクがクリップボードにコピーされました!

5.7. シングルサイトデプロイメント用の埋め込み Infinispan メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.7.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

5.7.2. メトリクスリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.1. サイズリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.2. データアクセスリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.2.1. 保存リンクのコピーリンクがクリップボードにコピーされました!

5.7.2.2.2. 読み取りリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.2.3. 削除リンクのコピーリンクがクリップボードにコピーされました!

5.7.2.2.4. エビクションリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.3. ロックリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.4. トランザクションリンクのコピーリンクがクリップボードにコピーされました!

5.7.2.5. 状態遷移リンクのコピーリンクがクリップボードにコピーされました!

5.7.2.6. クラスターデータレプリケーションリンクのコピーリンクがクリップボードにコピーされました!

第1章ヘルスチェックを使用してインスタンスステータスを追跡する
リンクのコピー

1.1. Red Hat build of Keycloak のヘルスチェックエンドポイント
リンクのコピー

1.2. ヘルスチェックを有効にする
リンクのコピー

1.3. ヘルスチェックを使用する
リンクのコピー

1.3.1. curl
リンクのコピー

1.3.2. Kubernetes
リンクのコピー

1.3.3. HEALTHCHECK
リンクのコピー

1.4. 利用可能なチェック
リンクのコピー

1.5. 関連するオプション
リンクのコピー

第2章メトリクスから洞察を得る
リンクのコピー

2.1. メトリクスを有効にする
リンクのコピー

2.2. メトリクスのクエリー
リンクのコピー

2.3. 次のステップ
リンクのコピー

2.4. 関連するオプション
リンクのコピー

第3章イベントメトリクスを使用してユーザーアクティビティーを監視する
リンクのコピー

3.1. イベントメトリクスを有効にする
リンクのコピー

3.2. 関連するオプション
リンクのコピー

第4章サービスレベルインジケーターを使用してパフォーマンスを監視する
リンクのコピー

4.1. 前提条件
リンクのコピー

4.2. 提供されるサービスの定義
リンクのコピー

4.3. SLI と SLO の定義
リンクのコピー

4.4. PromQL クエリー
リンクのコピー

4.4.1. 可用性
リンクのコピー

4.4.2. 認証リクエストのレイテンシー
リンクのコピー

4.4.3. 認証リクエストのエラー
リンクのコピー

4.5. 参考文献
リンクのコピー

第5章メトリクスを使用したトラブルシューティング
リンクのコピー

5.1. Red Hat build of Keycloak 主要メトリクスのリスト
リンクのコピー

5.2. 自己提供のメトリクス
リンクのコピー

5.2.1. 前提条件
リンクのコピー

5.2.2. メトリクス
リンクのコピー

5.2.2.1. ユーザーイベントメトリクス
リンクのコピー

5.2.2.2. パスワードのハッシュ
リンクのコピー

5.2.3. 次のステップ
リンクのコピー

5.3. JVM メトリック
リンクのコピー

5.3.1. 前提条件
リンクのコピー

5.3.2. メトリクス
リンクのコピー

5.3.2.1. JVM 情報
リンクのコピー

5.3.2.2. ヒープメモリー使用率
リンクのコピー

5.3.2.3. ガベージコレクション
リンクのコピー

5.3.2.4. Kubernetes の CPU 使用率
リンクのコピー

5.3.3. 次のステップ
リンクのコピー

5.4. データベースメトリクス
リンクのコピー

5.4.1. 前提条件
リンクのコピー

5.4.2. データベース接続プールのメトリクス
リンクのコピー

5.4.3. 次のステップ
リンクのコピー

5.5. HTTP メトリック
リンクのコピー

5.5.1. 前提条件
リンクのコピー

5.5.2. メトリクス
リンクのコピー

5.5.2.1. Processing time
リンクのコピー

5.5.2.2. アクティブなリクエスト
リンクのコピー

5.5.2.3. 帯域幅
リンクのコピー

5.5.3. 次のステップ
リンクのコピー

5.5.4. 関連するオプション
リンクのコピー

5.6. クラスタリングメトリクス
リンクのコピー

5.6.1. 前提条件
リンクのコピー

5.6.2. メトリクス
リンクのコピー

5.6.2.1. レスポンス時間
リンクのコピー

5.6.2.2. 帯域幅
リンクのコピー

5.6.2.3. スレッドプール
リンクのコピー

5.6.2.4. フロー制御
リンクのコピー

5.6.2.5. 再送信
リンクのコピー

5.6.2.6. ネットワークパーティション
リンクのコピー

5.6.2.6.1. クラスターサイズ
リンクのコピー

5.6.2.6.2. ネットワークパーティションイベント
リンクのコピー

5.6.3. 次のステップ
リンクのコピー

5.7. シングルサイトデプロイメント用の埋め込み Infinispan メトリクス
リンクのコピー

5.7.1. 前提条件
リンクのコピー

5.7.2. メトリクス
リンクのコピー

5.7.2.1. サイズ
リンクのコピー

5.7.2.2. データアクセス
リンクのコピー

5.7.2.2.1. 保存
リンクのコピー

5.7.2.2.2. 読み取り
リンクのコピー

5.7.2.2.3. 削除
リンクのコピー

5.7.2.2.4. エビクション
リンクのコピー

5.7.2.3. ロック
リンクのコピー

5.7.2.4. トランザクション
リンクのコピー

5.7.2.5. 状態遷移
リンクのコピー

5.7.2.6. クラスターデータレプリケーション
リンクのコピー

5.7.3. 次のステップ
リンクのコピー