第 8 章 监控 Network Observability Operator
您可以使用 Web 控制台监控与 Network Observability Operator 健康相关的警报。
8.1. 查看健康信息
您可从 web 控制台的 Dashboards 页面中访问 Network Observability Operator 健康和资源使用的指标。当触发警报时,您定向到仪表板的健康警报横幅可能会出现在 Network Traffic 和 Home 页面中。在以下情况下生成警报:
-
如果
flowlogs-pipeline
工作负载因为 Loki 错误而丢弃流,如已经达到 Loki ingestion 速率限制,则NetObservLokiError
警报发生。 -
如果在一个时间段内没有流,则会发出
NetObservNoFlows
警报。
先决条件
- 已安装 Network Observability Operator。
-
您可以使用具有
cluster-admin
角色或所有项目的查看权限的用户访问集群。
流程
-
从 web 控制台中的 Administrator 视角,进入到 Observe
Dashboards。 - 从 Dashboards 下拉菜单中选择 Netobserv/Health。有关 Operator 健康的指标显示在页面中。
8.1.1. 禁用健康警报
您可以通过编辑 FlowCollector
资源来选择不使用健康警报:
-
在 Web 控制台中,进入到 Operators
Installed Operators。 - 在 NetObserv Operator 的 Provided APIs 标题下,选择 Flow Collector。
- 选择 cluster,然后选择 YAML 选项卡。
-
添加
spec.processor.metrics.disableAlerts
来禁用健康警报,如下例所示:
apiVersion: flows.netobserv.io/v1alpha1
kind: FlowCollector
metadata:
name: cluster
spec:
processor:
metrics:
disableAlerts: [NetObservLokiError, NetObservNoFlows] 1
- 1
- 您可以指定一个或多个包含要禁用的警报类型的列表。