主页
产品
OpenShift Container Platform
4.12
监控
第 3 章配置外部 alertmanager 实例

第 3 章配置外部 alertmanager 实例

OpenShift Container Platform 监控堆栈包含一个本地 Alertmanager 实例，用于从 Prometheus 路由警报。您可以通过在 openshift-monitoring 项目或 user-workload-monitoring-config 项目中配置 cluster-monitoring-config 配置映射来添加外部 Alertmanager 实例。

如果您为多个集群添加相同的外部 Alertmanager 配置，并且为每个集群禁用本地实例，则可以使用单个外部 Alertmanager 实例管理多个集群的警报路由。

先决条件

已安装 OpenShift CLI(oc)。
如果要在 openshift-monitoring 项目中配置 OpenShift Container Platform 核心监控组件 ：
- 您可以使用具有 cluster-admin 集群角色的用户身份访问集群。
- 您已创建了 cluster-monitoring-config 配置映射。
如果您要配置用于监控用户定义的项目的组件：
- 您可以使用具有 cluster-admin 集群角色的用户访问集群，也可以使用在 openshift-user-workload-monitoring 项目中具有 user-workload-monitoring-config-edit 角色的用户访问集群。
- 集群管理员为用户定义的项目启用了监控。

流程

编辑 ConfigMap 对象。

配置额外的 Alertmanager 以路由来自 OpenShift Container Platform 核心项目的警报 ：

编辑 openshift-monitoring 项目中的 cluster-monitoring-config 配置映射：

oc -n openshift-monitoring edit configmap cluster-monitoring-config

$ oc -n openshift-monitoring edit configmap cluster-monitoring-config

Copy to Clipboard

Toggle word wrap

在 data/config.yaml/prometheusK8s 下添加一个 additionalAlertmanagerConfigs: 小节。

在本节中添加其他 Alertmanager 的配置详情：

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
    prometheusK8s:
      additionalAlertmanagerConfigs:
      - <alertmanager_specification>

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
    prometheusK8s:
      additionalAlertmanagerConfigs:
      - <alertmanager_specification>

Copy to Clipboard

Toggle word wrap

对于 <alertmanager_specification>，请替换额外的 Alertmanager 实例的身份验证和其他配置详情。目前支持的身份验证方法有 bearer 令牌 (bearerToken) 和客户端 TLS (tlsConfig)。以下示例配置映射使用 bearer 令牌和客户端 TLS 身份验证配置额外的 Alertmanager：

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
    prometheusK8s:
      additionalAlertmanagerConfigs:
      - scheme: https
        pathPrefix: /
        timeout: "30s"
        apiVersion: v1
        bearerToken:
          name: alertmanager-bearer-token
          key: token
        tlsConfig:
          key:
            name: alertmanager-tls
            key: tls.key
          cert:
            name: alertmanager-tls
            key: tls.crt
          ca:
            name: alertmanager-tls
            key: tls.ca
        staticConfigs:
        - external-alertmanager1-remote.com
        - external-alertmanager1-remote2.com

apiVersion: v1
kind: ConfigMap
metadata:
  name: cluster-monitoring-config
  namespace: openshift-monitoring
data:
  config.yaml: |
    prometheusK8s:
      additionalAlertmanagerConfigs:
      - scheme: https
        pathPrefix: /
        timeout: "30s"
        apiVersion: v1
        bearerToken:
          name: alertmanager-bearer-token
          key: token
        tlsConfig:
          key:
            name: alertmanager-tls
            key: tls.key
          cert:
            name: alertmanager-tls
            key: tls.crt
          ca:
            name: alertmanager-tls
            key: tls.ca
        staticConfigs:
        - external-alertmanager1-remote.com
        - external-alertmanager1-remote2.com

Copy to Clipboard

Toggle word wrap

配置额外的 Alertmanager 实例以路由来自用户定义的项目的警报 ：

编辑 openshift-user-workload-monitoring 项目中的 user-workload-monitoring-config 配置映射：

oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config

$ oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config

Copy to Clipboard

Toggle word wrap

在 data/config.yaml/ 下添加一个 <component>/additionalAlertmanagerConfigs: 部分。

在本节中添加其他 Alertmanager 的配置详情：

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
    <component>:
      additionalAlertmanagerConfigs:
      - <alertmanager_specification>

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
    <component>:
      additionalAlertmanagerConfigs:
      - <alertmanager_specification>

Copy to Clipboard

Toggle word wrap

对于 <component>，替换两个支持的外部 Alertmanager 组件之一：prometheus 或 thanosRuler。

对于 <alertmanager_specification>，请替换额外的 Alertmanager 实例的身份验证和其他配置详情。目前支持的身份验证方法有 bearer 令牌 (bearerToken) 和客户端 TLS (tlsConfig)。以下示例配置映射使用带有 bearer 令牌和客户端 TLS 身份验证的 Thanos Ruler 配置额外的 Alertmanager：

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
   thanosRuler:
     additionalAlertmanagerConfigs:
    - scheme: https
      pathPrefix: /
      timeout: "30s"
      apiVersion: v1
      bearerToken:
        name: alertmanager-bearer-token
        key: token
      tlsConfig:
        key:
          name: alertmanager-tls
          key: tls.key
        cert:
          name: alertmanager-tls
          key: tls.crt
        ca:
          name: alertmanager-tls
          key: tls.ca
      staticConfigs:
      - external-alertmanager1-remote.com
      - external-alertmanager1-remote2.com

apiVersion: v1
kind: ConfigMap
metadata:
  name: user-workload-monitoring-config
  namespace: openshift-user-workload-monitoring
data:
  config.yaml: |
   thanosRuler:
     additionalAlertmanagerConfigs:
    - scheme: https
      pathPrefix: /
      timeout: "30s"
      apiVersion: v1
      bearerToken:
        name: alertmanager-bearer-token
        key: token
      tlsConfig:
        key:
          name: alertmanager-tls
          key: tls.key
        cert:
          name: alertmanager-tls
          key: tls.crt
        ca:
          name: alertmanager-tls
          key: tls.ca
      staticConfigs:
      - external-alertmanager1-remote.com
      - external-alertmanager1-remote2.com

Copy to Clipboard

Toggle word wrap

保存文件以使改变生效。受新配置影响的 Pod 会自动重新部署。

3.1. 在时间序列和警报中附加额外标签
复制链接

您可以使用 Prometheus 的外部标签功能，将自定义标签附加到离开 Prometheus 的所有时间序列和警报。

先决条件

如果要配置 OpenShift Container Platform 核心监控组件：
- 您可以使用具有 cluster-admin 集群角色的用户身份访问集群。
- 您已创建 cluster-monitoring-config ConfigMap 对象。
如果您要配置用于监控用户定义的项目的组件：
- 您可以使用具有 cluster-admin 集群角色的用户访问集群，也可以使用在 openshift-user-workload-monitoring 项目中具有 user-workload-monitoring-config-edit 角色的用户访问集群。
- 集群管理员为用户定义的项目启用了监控。
已安装 OpenShift CLI(oc)。

流程

编辑 ConfigMap 对象：
- 对于监控 OpenShift Container Platform 核心项目的 Prometheus 实例，要将自定义标签附加到离开的所有时间序列和警报：
  1. 编辑 openshift-monitoring 项目中的 cluster-monitoring-config ConfigMap 对象：
    
    $ oc -n openshift-monitoring edit configmap cluster-monitoring-config
    
    Copy to Clipboard Toggle word wrap
  2. 在 data/config.yaml 下定义每个指标要添加的标签映射:
    
    apiVersion: v1 kind: ConfigMap metadata: name: cluster-monitoring-config namespace: openshift-monitoring data: config.yaml: | prometheusK8s: externalLabels: <key>: <value>
    1
    
    Copy to Clipboard Toggle word wrap
    
    1
    使用键值对替换 <key>: <value>，其中 <key> 是新标签的唯一名称，<value> 是它的值。
    警告
    不要使用 prometheus 或 prometheus_replica 作为键的名称，因为它们是保留的并会被覆盖。
    不要使用 cluster 或 managed_cluster 作为密钥名称。使用它们可能会导致您无法在开发人员仪表板中看到数据的问题。
    例如，要将关于区域和环境的元数据添加到所有时间序列和警报中，请使用以下示例：
    
    apiVersion: v1 kind: ConfigMap metadata: name: cluster-monitoring-config namespace: openshift-monitoring data: config.yaml: | prometheusK8s: externalLabels: region: eu environment: prod
    
    Copy to Clipboard Toggle word wrap
  3. 保存文件以使改变生效。新的配置会被自动应用。
- 对于监控用户定义的项目的 Prometheus 实例，要将自定义标签附加到离开的所有时间序列和警报：
  1. 在 openshift-user-workload-monitoring 项目中编辑 user-workload-monitoring-config ConfigMap 对象：
    
    $ oc -n openshift-user-workload-monitoring edit configmap user-workload-monitoring-config
    
    Copy to Clipboard Toggle word wrap
  2. 在 data/config.yaml 下定义每个指标要添加的标签映射:
    
    apiVersion: v1 kind: ConfigMap metadata: name: user-workload-monitoring-config namespace: openshift-user-workload-monitoring data: config.yaml: | prometheus: externalLabels: <key>: <value>
    1
    
    Copy to Clipboard Toggle word wrap
    
    1
    使用键值对替换 <key>: <value>，其中 <key> 是新标签的唯一名称，<value> 是它的值。
    警告
    不要使用 prometheus 或 prometheus_replica 作为键的名称，因为它们是保留的并会被覆盖。
    不要使用 cluster 作为密钥名称。使用它可能会导致开发人员仪表板无法看到数据的问题。
    注意
    在 openshift-user-workload-monitoring 项目中，Prometheus 负责处理指标，而 Thanos Ruler 负责处理警报和记录规则。在 user-workload-monitoring-config ConfigMap 中为 prometheus 设置 externalLabels 只会为指标配置外部标签，而不会为任何规则配置外部标签。
    例如，要将有关地区和环境的元数据添加到与用户定义的项目相关的所有时间序列和警报中，请使用以下示例：
    
    apiVersion: v1 kind: ConfigMap metadata: name: user-workload-monitoring-config namespace: openshift-user-workload-monitoring data: config.yaml: | prometheus: externalLabels: region: eu environment: prod
    
    Copy to Clipboard Toggle word wrap
  3. 保存文件以使改变生效。受新配置影响的 Pod 会自动重新部署。

返回顶部

第 3 章配置外部 alertmanager 实例

3.1. 在时间序列和警报中附加额外标签
复制链接

学习

尝试、购买和销售

社区

关于红帽文档

让开源更具包容性

關於紅帽

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第 3 章 配置外部 alertmanager 实例

3.1. 在时间序列和警报中附加额外标签复制链接链接已复制到粘贴板!

学习

尝试、购买和销售

社区

关于红帽文档

让开源更具包容性

關於紅帽

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

第 3 章配置外部 alertmanager 实例

3.1. 在时间序列和警报中附加额外标签
复制链接