1.3. Network Observability Operator 1.6.0
以下公告可用于 Network Observability Operator 1.6.0:
在升级到 Network Observability Operator 的最新版本前,您必须迁移已删除的 FlowCollector CRD 版本。NETOBSERV-1747 包括了对这个临时解决方案进行自动化的信息。
1.3.1. 新功能及功能增强
1.3.1.1. 增强了在没有 Loki 的情况下 Network Observability Operator 的使用
现在,在使用 Network Observability Operator 时,您可以使用 Prometheus 指标并依赖 Loki 进行存储。如需更多信息,请参阅没有 Loki 的网络可观察性。
1.3.1.2. 自定义 metrics API
您可以使用 FlowMetrics
API 从 flowlogs 数据中创建自定义指标。flowlogs 数据可用于 Prometheus 标签,以便在仪表板上自定义集群信息。您可以为要在流和指标中识别的任何子网添加自定义标签。此功能增强还可用于使用新标签 SrcSubnetLabel
和 DstSubnetLabel
来更轻松地识别外部流量,它们同时存在于流日志和指标中。当存在外部流量时,这些字段为空,它提供了一种方法来识别它。如需更多信息,请参阅 自定义指标和 FlowMetric API 参考。
1.3.1.3. eBPF 性能增强
提高了 eBPF 代理的性能,在 CPU 和内存方面有以下更新:
- eBPF 代理现在使用 TCX Webhook 而不是 TC。
NetObserv / Health 仪表板有一个新的部分,显示 eBPF 指标。
- 根据新的 eBPF 指标,当 eBPF 代理丢弃流时,会向您发送警报。
- 现在,因为删除了重复的流,Loki 存储需求会显著减少。现在,使用一个带有相关网络接口列表的非重复的流,而不是使用多个流,每个网络接口都带有独立重复的流。
通过对重复流机制的更新,网络流量表中的Interface和Interface Direction 字段被重命名为 Interfaces 和 Interface Directions,任何使用这些字段的 快速过滤查询都需要更新为使用新的 interfaces
和 ifdirections
。
如需更多信息,请参阅使用 eBPF 代理警报和快速过滤器。
1.3.1.4. 基于 eBPF 集合规则的过滤
您可以使用基于规则的过滤来减少创建的流的数量。启用这个选项后,eBPF 代理统计的 Netobserv / Health 仪表板会提供一个过滤的流速率视图。如需更多信息,请参阅 eBPF 流规则过滤器。
1.3.2. 技术预览功能
这个版本中的一些功能当前还处于技术预览状态。它们并不适用于在生产环境中使用。请参阅红帽门户网站中关于对技术预览功能支持范围的信息:
1.3.2.1. Network Observability CLI
Network Observability CLI (oc netobserv
)暂时不可用,并预期会通过 OCPBUGS-36146 解决。
您可以使用 Network Observability CLI 调试网络流量问题并进行故障排除,而无需安装 Network Observability Operator。实时捕获和视觉化流和数据包数据,在捕获过程中不需要持久性存储。如需更多信息,请参阅 Network Observability CLI 和 Network Observability CLI 1.6.0
1.3.3. 程序错误修复
-
在以前的版本中,Operator Lifecycle Manager (OLM) 表单中会显示到 OpenShift 的死链接,用于创建
FlowMetrics
API。现在,链接已被更新以指向有效的页面。(NETOBSERV-1607) - 在以前的版本中,Operator Hub 中的 Network Observability Operator 描述信息中显示的一个到文档的链接有问题。在这个版本中,这个链接也被修正。(NETOBSERV-1544)
-
在以前的版本中,如果 Loki 被禁用,且 Loki
Mode
被设置为LokiStack
,或者配置了 Loki manual TLS 配置,Network Observability Operator 仍然会尝试读取 Loki CA 证书。在这个版本中,当 Loki 被禁用时,即使在 Loki 配置中有设置,也不会读 Loki 证书。(NETOBSERV-1647) -
在以前的版本中,Network Observability Operator 的
oc
must-gather
插件只适用于amd64
架构,并在所有其他架构上都会失败,这是因为对于oc
,插件使用了amd64
。现在,Network Observability Operatoroc
must-gather
插件会在任何架构平台上收集日志。 -
在以前的版本中,当使用
不等于
逻辑过滤 IP 地址时,Network Observability Operator 会返回请求错误。现在,对于 IP 地址和范围的 IP 过滤,可以正常使用等于
和不等于
逻辑。(NETOBSERV-1630) -
在以前的版本中,当用户不是管理员时,错误消息与 web 控制台中的 Network Traffic 视图的所选标签页不一致。现在,
user not admin
错误可以正确地在任何标签页中显示。(NETOBSERV-1621)
1.3.4. 已知问题
-
当 eBPF 代理
PacketDrop
功能被启用,并抽样被配置为一个大于1
的值时,报告的丢弃的字节并丢弃数据包会忽略抽样配置。虽然这样做的目的为了不遗漏任何数据丢弃,但这样做的一个副作用是报告的丢弃数据与非丢弃数据的比例变得有倾向性。例如,对于一个非常高的抽样率(如1:1000
)中,在控制台插件中观察到的情况是,几乎所有流量都被丢弃。(NETOBSERV-1676) - 在 Overview 选项卡中的 Manage panels 弹出窗口中,根据 total, bar, donut, 或 line 不会显示任何结果。(NETOBSERV-1540)
- 如果首先创建了接口,然后才部署 eBPF 代理,则不会检测到这个 SR-IOV 二级接口。只有在先部署了代理,然后再创建 SR-IOV 接口时,才会检测到它。(NETOBSERV-1697)
- 当禁用 Loki 时,OpenShift Web 控制台中的 Topology 视图始终会在网络拓扑图旁边的滑块中显示集群和 区域聚合选项,即使未启用相关的功能。现在还没有可以解决这个问题的临时解决方案,只能忽略这些滑块选项。(NETOBSERV-1705)
-
当 Loki 被禁用时,OpenShift Web 控制台第一次加载时,可能会显示错误:
Request failed with status code 400 Loki is disabled
。作为临时解决方案,您可以继续在 Network Traffic 页面中切换内容,如点 Topology 和 Overview 选项卡。这个错误应该会消失。(NETOBSERV-1706)