第 2 章 经常发生的错误条件
当 Collector 配置自身并将 eBPF 探测加载到系统时,大多数错误都会发生。
收集器启动过程涉及以下阶段:
- 解析配置
- 分析主机
- 连接到 Sensor
- 加载 eBPF 探测
任何步骤上的故障都被视为致命。如果启动过程的任何部分失败,日志会显示一个诊断概述,其中包含关于哪些步骤成功或失败的详细信息。
以下日志文件示例演示了成功启动:
[INFO 2025/07/24 10:05:54] == Collector Startup Diagnostics: ==
[INFO 2025/07/24 10:05:54] Connected to Sensor? false
[INFO 2025/07/24 10:05:54] Kernel driver candidates:
[INFO 2025/07/24 10:05:54] core_bpf (available)
[INFO 2025/07/24 10:05:54] Driver loaded into kernel: core_bpf
[INFO 2025/07/24 10:05:54] ====================================
日志输出确认 Collector 连接到 Sensor 并载入 eBPF 探测。您可以使用此日志检查 Collector 是否成功启动。
2.1. 无法连接到 Sensor 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
在启动时,首先检查您可以连接到 Sensor。Sensor 负责下载处理网络事件的内核驱动程序和 CIDR 块,使其成为启动过程的基本部分。以下日志表示您无法连接到 Sensor:
Collector Version: 3.15.0
OS: Ubuntu 20.04.4 LTS
Kernel Version: 5.4.0-126-generic
[...]
[INFO 2023/05/13 12:20:43] Sensor configured at address: sensor.stackrox.svc:9998
[INFO 2023/05/13 12:20:43] Attempting to connect to Sensor
[INFO 2023/05/13 12:21:13]
[INFO 2023/05/13 12:21:13] == Collector Startup Diagnostics: ==
[INFO 2023/05/13 12:21:13] Connected to Sensor? false
[INFO 2023/05/13 12:21:13] Kernel driver candidates:
[INFO 2023/05/13 12:21:13] ====================================
[INFO 2023/05/13 12:21:13]
[FATAL 2023/05/13 12:21:13] Unable to connect to Sensor at 'sensor.stackrox.svc:9998'.
这个错误可能意味着 Sensor 没有正确启动,或者 Collector 配置不正确。要解决这个问题,您必须验证 Collector 配置以确保 Sensor 地址正确,并且 Sensor pod 正常运行。
查看 Collector 日志,以专门检查配置的 Sensor 地址。另外,您可以运行以下命令:
$ kubectl -n stackrox get pod <collector_pod_name> -o jsonpath='{.spec.containers[0].env[?(@.name=="GRPC_SERVER")].value}'
- 1
- 对于
<collector_pod_name>,指定 Collector pod 的名称,如collector-vclg5。