第 5 章 定制可观察性


使用 OpenShift 上的 Red Hat OpenStack Services (RHOSO)的可观察性,深入了解您的部署的指标、日志和警报。

RHOSO 中的可观察性架构由 Red Hat OpenShift Container Platform (RHOCP)中的服务组成,以及在您的 Compute 节点上公开指标、日志和警报的服务。您可以使用 Red Hat OpenShift Observability 深入了解 RHOSO 环境。另外,您还可以访问日志基础架构,以便收集、存储和搜索日志。RHOSO 服务(如 ceilometer 和 sg-core)使计算节点的指标和相关的虚拟基础架构可供 OpenShift 观察框架使用。

重要

Red Hat OpenStack Services on OpenShift (RHOSO)、Red Hat OpenShift Container Platform (RHOCP)和 Service Telemetry Framework (STF)中的可观察性通常是不适合的(如按请求的账单)。

5.1. 在 control plane 中配置可观察性

在 OpenShift (RHOSO)部署的 Red Hat OpenStack Services (RHOSO)部署中默认启用 Telemetry 服务(ceilometer、prometheus)。您可以通过编辑 OpenStackControlPlane 自定义资源(CR)文件中的 Telemetry 服务来配置可观察性。

先决条件

  • control plane 包括 Telemetry 服务的初始配置。如需更多信息,请参阅在 OpenShift 上部署 Red Hat OpenStack Services 中的 创建 control plane 中的 遥测 配置。

流程

  1. 在工作站上打开 OpenStackControlPlane CR 文件 openstack_control_plane.yaml
  2. 根据您的环境配置 Telemetry 服务:

     telemetry:
        enabled: true
        template:
          metricStorage:
            enabled: true
            dashboardsEnabled: true
            dataplaneNetwork: ctlplane
            networkAttachments:
              - ctlplane
            monitoringStack:
              alertingEnabled: true
              scrapeInterval: 30s
              storage:
                strategy: persistent
                retention: 24h
                persistent:
                  pvcStorageRequest: 20G
          autoscaling:
            enabled: false
            aodh:
              databaseAccount: aodh
              databaseInstance: openstack
              secret: osp-secret
            heatInstance: heat
          ceilometer:
            enabled: true
            secret: osp-secret
          logging:
            enabled: false
            annotations:
              metallb.universe.tf/address-pool: internalapi
              metallb.universe.tf/allow-shared-ip: internalapi
              metallb.universe.tf/loadBalancerIPs: 172.17.0.80
    • metricStorage.monitoringStack.scrapeInterval: 指定收集新指标的时间间隔。更改此间隔可能会影响性能。
    • metricStorage.monitoringStack.storage.retention: 指定遥测指标存储的时间长度。持续时间会影响所需的存储量。
    • storage.persistent.pvcStorageRequest :指定分配给 Prometheus 时间序列数据库的存储量。
    • autoscaling.enabled: 设置为 true 以启用自动扩展。即使禁用了自动扩展,也必须存在 autoscaling 字段。有关自动扩展的更多信息,请参阅实例自动扩展
    • ceilometer.enabled :设置为 false 以禁用 ceilometer 服务。如果不禁用 ceilometer,则会通过以下 URL 从集群内部创建并公开 Prometheus 指标导出器 :http://ceilometer-internal.openstack.svc:3000/metrics
    • logging.enabled: 设置为 true 以启用可观察性日志记录。有关配置可观察日志记录的更多信息,请参阅启用 RHOSO 可观察性日志
  3. 更新 control plane:

    $ oc apply -f openstack_control_plane.yaml -n openstack
  4. 等待 RHOCP 创建与 OpenStackControlPlane CR 相关的资源。运行以下命令来检查状态:

    $ oc get openstackcontrolplane -n openstack
    NAME 						STATUS 	MESSAGE
    openstack-control-plane 	Unknown 	Setup started

    当状态为 "Setup complete" 时,会创建 OpenStackControlPlane 资源。

    提示

    -w 选项附加到 get 命令的末尾,以跟踪部署进度。

  5. 可选:通过查看 openstack 命名空间中的 pod 来查看每个单元,确认部署了 control plane:

    $ oc get pods -n openstack

    当所有 pod 都已完成或运行时,会部署 control plane。

验证

  1. 从您的工作站访问 OpenStackClient pod 的远程 shell:

    $ oc rsh -n openstack openstackclient
  2. 确认您可以查询 prometheus,并且提取端点处于活跃状态:

    $ openstack metric query up --disable-rbac -c container -c instance  -c value

    输出示例:

    +-----------------+------------------------+-------+
    | container       | instance               | value |
    +-----------------+------------------------+-------+
    | alertmanager    | 10.217.1.112:9093	   | 1     |
    | prometheus      | 10.217.1.63:9090 	   | 0     |
    | proxy-httpd     | 10.217.1.52:3000       | 1     |
    |                 | 192.168.122.100:9100   | 1     |
    |                 | 192.168.122.101:9100   | 1     |
    +-----------------+------------------------+-------+
    注意

    当集群中调度活跃工作负载时,value 字段中的每个条目都应该为 "1",但 prometheus 容器除外。因为 TLS,prometheus 容器会报告一个 "0" 的值,它会被默认启用。

  3. 您可以通过点 RHOCP 控制台中的 Observe,找到 openstack-telemetry-operator 仪表板。有关 RHOCP 仪表板的更多信息,请参阅 RHOCP Monitoring Guide 中的 以集群管理员身份查看监控仪表板
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部