5.7. 资源管理和性能注意事项

Network Observability 所需的资源量取决于集群的大小以及集群要存储可观察数据的要求。要管理集群的资源并设置性能标准，请考虑配置以下设置。配置这些设置可能会满足您的最佳设置和可观察性需求。

以下设置可帮助您管理 outset 中的资源和性能：

eBPF Sampling: 您可以设置 Sampling 规格 spec.agent.ebpf.sampling，以管理资源。较小的抽样值可能会消耗大量计算、内存和存储资源。您可以通过指定一个抽样比率值来缓解这个问题。100 表示每 100 个流进行 1 个抽样。值 0 或 1 表示捕获所有流。较小的值会导致返回的流和派生指标的准确性增加。默认情况下，eBPF 抽样设置为 50，因此每 50 个流抽样 1 个。请注意，更多抽样流也意味着需要更多存储。考虑以默认值开始，并逐步优化，以确定您的集群可以管理哪些设置。
限制或排除接口: 通过为 spec.agent.ebpf.interfaces 和 spec.agent.ebpf.excludeInterfaces 设置值来减少观察到的流量。默认情况下，代理获取系统中的所有接口，但 excludeInterfaces 和 lo （本地接口）中列出的接口除外。请注意，接口名称可能会因使用的 Container Network Interface (CNI) 而异。

以下设置可用于在 Network Observability 运行后对性能进行微调：

资源要求和限制: 使用 spec.agent.ebpf.resources 和 spec.processor.resources 规格，将资源要求和限制调整为集群中预期的负载和内存用量。800MB 的默认限制可能足以满足大多数中型集群。
缓存最大流超时: 使用 eBPF 代理的 spec.agent.ebpf.cacheMaxFlows 和 spec.agent.ebpf.cacheActiveTimeout 规格来控制代理报告的频率。较大的值会导致代理生成较少的流量，与较低 CPU 负载相关联。但是，较大的值会导致内存消耗稍有更高的，并可能会在流集合中生成更多延迟。

下表概述了具有特定工作负载的集群的资源注意事项示例。

重要

表中概述的示例演示了为特定工作负载量身定制的场景。每个示例仅作为基准，可以进行调整以适应您的工作负载需求。

Expand

表 5.2. 资源建议
	Extra small (10 个节点)	Small (25 个节点)	Medium (65 个节点) ^[2]	Large (120 个节点) ^[2]
Worker 节点 vCPU 和内存	4 个 vCPU\| 16GiB 内存 ^[1]	16 个 vCPU\| 64GiB 内存 ^[1]	16 个 vCPU\| 64GiB 内存 ^[1]	16 个 vCPU\| 64GiB Mem ^[1]
LokiStack 大小	`1x.extra-small`	`1x.small`	`1x.small`	`1x.medium`
Network Observability 控制器内存限值	400Mi （默认）	400Mi （默认）	400Mi （默认）	800Mi
eBPF 抽样率	50 （默认）	50 （默认）	50 （默认）	50 （默认）
eBPF 内存限值	800Mi （默认）	800Mi （默认）	2000Mi	800Mi （默认）
FLP 内存限制	800Mi （默认）	800Mi （默认）	800Mi （默认）	800Mi （默认）
FLP Kafka 分区	N/A	48	48	48
Kafka 消费者副本	N/A	24	24	24
Kafka 代理	N/A	3 （默认）	3 （默认）	3 （默认）

使用 AWS M6i 实例测试。
除了此 worker 及其控制器外，还会测试 3 infra 节点 (size M6i.12xlarge) 和 1 个工作负载节点 (size M6i.8xlarge)。

返回顶部