28.2. 关于网络可观察性
红帽为集群管理员提供 Network Observability Operator 来观察 OpenShift Container Platform 集群的网络流量。Network Observability Operator 使用 eBPF 技术创建网络流。然后,OpenShift Container Platform 信息会增强网络流,并存储在 Loki 中。您可以在 OpenShift Container Platform 控制台中查看和分析所存储的 netflow 信息,以进一步洞察和故障排除。
28.2.1. Network Observability Operator 的依赖项
Network Observability Operator 需要以下 Operator:
- Loki:您必须安装 Loki。Loki 是用于存储所有收集的流的后端。建议您通过为安装 Red Hat Loki Operator 来为 Network Observability Operator 安装 Loki。
28.2.2. Network Observability Operator 的可选依赖项
- Grafana :您可以使用 Grafana Operator 安装 Grafana 以使用自定义仪表板和查询功能。红帽不支持 Grafana Operator。
- Kafka:它在 OpenShift Container Platform 集群中提供可扩展性、弹性和高可用性。建议您使用 AMQ Streams Operator 安装 Kafka 进行大规模部署。
28.2.3. Network Observability Operator
Network Observability Operator 提供 Flow Collector API 自定义资源定义。流收集器实例是在安装过程中创建的,并启用网络流集合的配置。Flow Collector 实例部署 pod 和服务,它们组成一个监控管道,然后收集网络流并将其与 Kubernetes 元数据一起增强,然后再存储在 Loki 中。eBPF 代理作为 daemonset
对象部署,会创建网络流。
28.2.4. OpenShift Container Platform 控制台集成
OpenShift Container Platform 控制台集成提供了概述、拓扑视图和流量流表。
28.2.4.1. 网络 Observability 指标
OpenShift Container Platform 控制台提供 Overview 选项卡,它显示集群上网络流量流的整体聚合指标。信息可以被节点、命名空间、所有者、pod 和服务显示。过滤器和显示选项可以进一步优化指标。
在 Observe
- 每个源和目标命名空间的顶流率(1 分钟比率)
- 每个源和目标节点发出的前字节率(1 分钟比率)
- 每个源和目标节点接收的前字节率(1 分钟比率)
- 每个源和目标工作负载发出的前字节率(1 分钟率)
- 每个源和目标工作负载接收的字节率(1 分钟比率)
- 每个源和目标工作负载发送的最大数据包率(1 分钟率)
- 每个源和目标工作负载接收的顶级数据包率(1 分钟比率)
您可以通过更改 ignoreTags
列表,将 FlowCollector
spec.processor.metrics
配置为添加或删除指标。有关可用标签的更多信息,请参阅流收集器 API 参考
另外,在 Observe
28.2.4.2. Network Observability 拓扑视图
OpenShift Container Platform 控制台提供 Topology 选项卡,显示网络流的图形表示和流量数量。拓扑视图代表 OpenShift Container Platform 组件之间的流量,作为网络图。您可以使用过滤器和显示选项重新定义图形。您可以访问节点、命名空间、所有者、pod 和服务的信息。
28.2.4.3. 流量流表
流量流表视图为原始流、非聚合过滤选项和可配置列提供视图。OpenShift Container Platform 控制台提供 流量流 标签页,显示网络流的数据和流量数量。