第 5 章 访问指标


5.1. 以管理员身份访问指标

您可以访问指标来监控集群组件和工作负载的性能。

其他资源

5.1.1. 查看可用指标列表

作为集群管理员或具有所有项目查看权限的用户,您可以查看集群中可用的指标列表,并以 JSON 格式输出列表。

先决条件

  • 您是一个集群管理员,或者您可以使用具有 cluster-monitoring-view 集群角色的用户访问集群。
  • 已安装 OpenShift Container Platform CLI (oc)。
  • 您已获取 Thanos Querier 的 OpenShift Container Platform API 路由。
  • 您可以使用 oc whoami -t 命令获取 bearer 令牌。

    重要

    您只能使用 bearer 令牌身份验证来访问 Thanos Querier API 路由。

流程

  1. 如果您还没有为 Thanos Querier 获取 OpenShift Container Platform API 路由,请运行以下命令:

    $ oc get routes -n openshift-monitoring thanos-querier -o jsonpath='{.status.ingress[0].host}'
  2. 运行以下命令,以 JSON 格式从 Thanos Querier API 路由检索指标列表。此命令使用 oc 通过 bearer 令牌进行身份验证。

    $ curl -k -H "Authorization: Bearer $(oc whoami -t)" https://<thanos_querier_route>/api/v1/metadata 1
    1
    <thanos_querier_route> 替换为 Thanos Querier 的 OpenShift Container Platform API 路由。

5.1.2. 使用 OpenShift Container Platform Web 控制台查询所有项目的指标

您可以使用 OpenShift Container Platform 指标查询浏览器来运行 Prometheus Query Language (PromQL)查询来检查图表中呈现的指标。此功能提供有关集群以及要监控的任何用户定义工作负载的状态信息。

作为集群管理员,或具有所有项目的查看权限的用户,您可以在 Metrics UI 中访问所有 OpenShift Container Platform 默认项目和用户定义的项目的指标。

先决条件

  • 您可以使用具有 cluster-admin 集群角色的用户访问集群,或者具有所有项目的查看权限。
  • 已安装 OpenShift CLI(oc)。

流程

  1. 从 OpenShift Container Platform Web 控制台中的 Administrator 视角,选择 Observe Metrics
  2. 要添加一个或多个查询,请执行以下操作之一:

    选项描述

    创建自定义查询。

    将 Prometheus Query Language (PromQL) 查询添加到 Expression 字段中。

    当您输入 PromQL 表达式时,自动完成建议会出现在下拉列表中。这些建议包括功能、指标、标签和时间令牌。您可以使用键盘箭头选择其中一项建议的项目,然后按 Enter 将项目添加到您的表达式中。您还可以将鼠标指针移到建议的项目上,以查看该项目的简短描述。

    添加多个查询。

    选择 Add query

    复制现有的查询。

    选择查询旁边的 Options 菜单 kebab ,然后选择 Duplicate 查询

    禁用查询正在运行。

    选择查询旁边的 Options 菜单 kebab 并选择 Disable query

  3. 要运行您创建的查询,请选择 Run queries。图表中会直观呈现查询的指标。如果查询无效,则 UI 会显示错误消息。

    注意

    如果查询对大量数据进行运算,这可能会在绘制时序图时造成浏览器超时或过载。要避免这种情况,请选择 Hide graph 并且仅使用指标表来校准查询。然后,在找到可行的查询后,启用图表来绘制图形。

    注意

    默认情况下,查询表会显示一个展开的视图,列出每个指标及其当前值。您可以选择 ˅ 来最小化查询的展开视图。

  4. 可选:保存页面 URL,以便在将来再次使用此查询。
  5. 探索视觉化指标。最初,图表中显示所有启用的查询中的所有指标。您可以通过执行以下操作来选择显示哪些指标:

    选项描述

    隐藏查询中的所有指标。

    点查询的 Options 菜单 kebab 并点 Hide all series

    隐藏特定指标。

    前往查询表,再点指标名称旁边的带颜色的方格。

    放大图表并更改时间范围。

    任一:

    • 点击图表并在水平方向上拖动,以可视化方式选择时间范围。
    • 使用左上角的菜单来选择时间范围。

    重置时间范围。

    选择 Reset zoom

    在特定时间点显示所有查询的输出。

    将鼠标光标悬停在图表上。弹出框中会显示查询输出。

    隐藏图表。

    选择 Hide graph

其他资源

5.1.3. 获取有关指标目标的详细信息

您可以使用 OpenShift Container Platform Web 控制台来查看、搜索和过滤当前用于提取的端点,这有助于识别和排除问题。例如,您可以查看目标端点的当前状态,以查看 OpenShift Container Platform 监控无法从目标组件中提取指标。

Metrics Targets 页面显示默认 OpenShift Container Platform 项目和用户定义的项目的目标。

先决条件

  • 您可以访问集群,作为您要查看指标目标的项目的管理员。

流程

  1. 在 OpenShift Container Platform Web 控制台的 Administrator 视角中,进入 Observe Targets。此时会打开 Metrics targets 页面,其中包含为指标提取的所有服务端点目标的列表。

    本页显示了 OpenShift Container Platform 默认项目和用户定义的项目的目标的详细信息。本页列出了每个目标的以下信息:

    • 正在提取的服务端点 URL
    • 被监控的 ServiceMonitor 资源
    • 目标的 updown 状态
    • 命名空间
    • 最后提取的时间
    • 最后一次提取持续的时间
  2. 可选: 要查找特定的目标,请执行以下操作:

    选项描述

    根据状态和源过滤目标。

    Filter 列表中选择过滤器。

    可用的过滤选项如下:

    • Status 过滤器:

      • Up。目标当前已启动,正在主动抓取指标。
      • Down。目标当前已停机,没有提取指标。
    • Source 过滤器:

      • Platform。平台级别的目标仅与 AWS 默认项目的 Red Hat OpenShift Service 相关。这些项目提供 Red Hat OpenShift Service on AWS 核心功能。
      • User。用户目标与用户定义的项目相关。这些项目是用户创建的,可以进行自定义。

    根据名称或标签搜索目标。

    在搜索框旁边的 TextLabel 字段中输入搜索词。

    对目标进行排序。

    点一个或多个 Endpoint Status,Namespace,Last Scrape, 和 Scrape Duration 列标头。

  3. 点目标的 Endpoint 列中的 URL,以进入其 Target 详情页面。本页提供有关目标的信息,包括以下信息:

    • 为指标提取的端点 URL
    • 目标的当前 UpDown 状态
    • 到命名空间的链接
    • ServiceMonitor 资源详情的链接
    • 附加到目标的标签
    • 为指标提取目标的最长时间

5.1.4. 以集群管理员身份查看监控仪表板

Administrator 视角中,您可以查看与 OpenShift Container Platform 集群核心组件相关的仪表板。

先决条件

  • 您可以使用具有 cluster-admin 集群角色的用户身份访问集群。

流程

  1. 在 OpenShift Container Platform web 控制台的 Administrator 视角中,进入到 Observe Dashboards
  2. Dashboard 列表中选择一个仪表板。有些仪表板(如 etcdPrometheus 仪表板)在被选中时会生成额外的子菜单。
  3. 可选:在 Time Range 列表中为图形选择一个时间范围。

    • 选择预定义的时间段。
    • Time Range 列表中的 Custom 时间范围 来设置自定义时间范围。

      1. 输入或选择 FromTo date and time。
      2. 单击 Save 以保存自定义时间范围。
  4. 可选:选择一个 Refresh Interval
  5. 将鼠标悬停在仪表板中的每个图形上,以显示特定项目的详细信息。

其他资源

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.