5.7. Telemetry 模块
telemetry 模块发送有关存储集群的数据,以帮助了解 Ceph 的使用方式以及操作过程中遇到哪些问题。数据在公共仪表板上视觉化,以查看报告集群数量、其总容量和 OSD 计数以及版本分布趋势的摘要统计。
Channels
遥测报告分为不同的频道,每种频道都有不同类型的信息。启用遥测后,您可以打开或关闭单独的频道。
以下是四个不同的频道:
basic
- 默认在上
。此频道提供有关集群的基本信息,其中包括以下信息:- 集群的容量。
- 监视器、管理器、OSD、MDS、对象网关或其他守护进程的数量。
- 当前正在使用的软件版本。
- RADOS 池和 Ceph 文件系统的数量和类型。
- 从其默认值更改的配置选项的名称(而不是其值)。
crash
- 默认在上
。这个频道提供有关守护进程崩溃的信息,其中包括以下信息:- 守护进程的类型。
- 守护进程的版本。
- 操作系统、操作系统分发和内核版本。
- 堆栈追踪,用于标识崩溃发生 Ceph 代码中的位置。
-
device
- 默认在上
。此频道提供有关设备指标的信息,其中包括匿名 SMART 指标。 -
Ident
- 默认是off
。此频道为用户提供有关集群的标识信息,如集群描述和联系电子邮件地址。 perf
- 默认是off
。此频道提供集群的各种性能指标,可用于以下内容:- 显示集群的整体健康状况。
- 识别工作负载模式。
- 对延迟、节流、内存管理和其他类似问题相关的问题进行故障排除。
- 通过守护进程监控集群性能。
报告的数据不包含任何敏感数据,如池名称、对象名称、对象内容、主机名或设备序列号。
它包含关于如何部署集群、Ceph 版本、主机分发和其他参数的计数器和统计信息,它们可帮助项目更好地理解 Ceph 的使用方式。
数据是安全的,发送到 https://telemetry.ceph.com。
启用遥测(telemetry)
在启用频道前,请确保遥测位于 上
。
启用遥测:
ceph telemetry on
启用和禁用频道
启用或禁用单个频道:
ceph telemetry enable channel basic ceph telemetry enable channel crash ceph telemetry enable channel device ceph telemetry enable channel ident ceph telemetry enable channel perf ceph telemetry disable channel basic ceph telemetry disable channel crash ceph telemetry disable channel device ceph telemetry disable channel ident ceph telemetry disable channel perf
启用或禁用多个频道:
ceph telemetry enable channel basic crash device ident perf ceph telemetry disable channel basic crash device ident perf
启用或禁用所有频道:
ceph telemetry enable channel all ceph telemetry disable channel all
报告示例
要随时查看报告的数据,请生成示例报告:
ceph telemetry show
如果遥测
关闭
,请预览示例报告:ceph telemetry preview
为具有数百个 OSD 或更多的存储集群生成示例报告需要更长的时间。
为了保护您的隐私,需要单独生成设备报告,主机名和设备序列号等数据会被匿名处理。设备遥测发送到不同的端点,不会将设备数据与特定集群关联。要查看设备报告,请运行以下命令:
ceph telemetry show-device
如果遥测
关闭
,请预览示例设备报告:ceph telemetry preview-device
在 上获取两个带有遥测的报告的单一输出:
ceph telemetry show-all
获取与遥测
关闭
的报告的单一输出:ceph telemetry preview-all
按频道生成示例报告:
语法
ceph telemetry show CHANNEL_NAME
按频道生成示例报告的预览:
语法
ceph telemetry preview CHANNEL_NAME
集合
集合是在频道中收集的数据的不同方面。
列出集合:
ceph telemetry collection ls
查看您注册的集合和新的可用集合之间的区别:
ceph telemetry diff
注册最新集合:
语法
ceph telemetry on ceph telemetry enable channel CHANNEL_NAME
Interval(间隔)
默认情况下,模块每 24 小时编译并发送一个新的报告。
调整间隔:
语法
ceph config set mgr mgr/telemetry/interval INTERVAL
Example
[ceph: root@host01 /]# ceph config set mgr mgr/telemetry/interval 72
在示例中,报告每三天(72 小时)生成。
Status
查看当前的配置:
ceph telemetry status
手动发送遥测
临时发送遥测数据:
ceph telemetry send
如果禁用了遥测,请将-
license share-1-0
添加到ceph telemetry send
命令。
通过代理发送遥测
如果集群无法直接连接到配置的 telemetry 端点,您可以配置 HTTP/HTTPs 代理服务器:
语法
ceph config set mgr mgr/telemetry/proxy PROXY_URL
Example
[ceph: root@host01 /]# ceph config set mgr mgr/telemetry/proxy https://10.0.0.1:8080
您可以在命令中包含用户 pass :
Example
[ceph: root@host01 /]# ceph config set mgr mgr/telemetry/proxy https://10.0.0.1:8080
联系和描述
可选:在报告中添加联系人和描述:
语法
ceph config set mgr mgr/telemetry/contact '_CONTACT_NAME_' ceph config set mgr mgr/telemetry/description '_DESCRIPTION_' ceph config set mgr mgr/telemetry/channel_ident true
Example
[ceph: root@host01 /]# ceph config set mgr mgr/telemetry/contact 'John Doe <john.doe@example.com>' [ceph: root@host01 /]# ceph config set mgr mgr/telemetry/description 'My first Ceph cluster' [ceph: root@host01 /]# ceph config set mgr mgr/telemetry/channel_ident true
如果启用了
ident
标志,则领导板中不会显示其详情。
Leaderboard
参与公共仪表板的领导板:
Example
[ceph: root@host01 /]# ceph config set mgr mgr/telemetry/leaderboard true
领导板显示有关存储集群的基本信息。此板包括存储容量和 OSD 数量。
禁用遥测(telemetry)
随时禁用遥测:
Example
ceph telemetry off