搜索

第 15 章 Cephadm 健康检查

download PDF

作为存储管理员,您可以使用 Cephadm 模块提供的附加健康检查来监控 Red Hat Ceph Storage 集群。这是存储集群提供的默认健康检查补充。

15.1. Cephadm 操作健康检查

当 Cephadm 模块激活时,将执行健康检查。您可以收到以下健康警告:

CEPHADM_PAUSED

Cephadm 后台工作可以使用 ceph orch pause 命令暂停。Cephadm 继续执行被动监控活动,如检查主机和守护进程状态,但它不会像部署或移除守护进程一样进行任何更改。您可以使用 ceph orch resume 命令恢复 Cephadm 工作。

CEPHADM_STRAY_HOST

一个或多个主机正在运行 Ceph 守护进程,但未注册为由 Cephadm 模块管理的主机。这意味着这些服务目前不由 Cephadm 管理,例如,ceph orch ps 命令中包含的重启和升级。您可以使用 ceph orch host add HOST_NAME 命令来管理主机,但请确保已配置了对远程主机的 SSH 访问。或者,您可以手动连接到主机,并确保该主机上的服务被删除或迁移到由 Cephadm 管理的主机。您还可以通过设置 ceph config set mgr mgr/cephadm/warn_on_stray_hosts false来禁用此警告

CEPHADM_STRAY_DAEMON

一个或多个 Ceph 守护进程正在运行,但不由 Cephadm 模块管理。这可能是因为使用其他工具部署,或者因为手动启动它们。这些服务目前不由 Cephadm 管理,例如,ceph orch ps 命令中包含的重启和升级。

如果守护进程是 monitor 或 OSD 守护进程的有状态,则 Cephadm 应该采用这些守护进程。对于无状态守护进程,您可以使用 ceph orch apply 命令置备新的守护进程,然后停止非受管守护进程。

您可以通过设置 ceph config set mgr/cephadm/warn_on_stray_daemons false 来禁用此运行状况警告。

CEPHADM_HOST_CHECK_FAILED

对一个或多个主机的基本 Cephadm 主机检查(验证 that:name: 值)失败。

  • 主机可以访问,您可以执行 Cephadm。
  • 主机满足基本先决条件,如作为 Podman 的工作容器运行时和工作时间同步。如果测试失败,Cephadm 将无法管理该主机上的服务。

您可以使用 ceph cephadm check-host HOST_NAME 命令手动运行此检查。您可以使用 ceph orch host rm HOST_NAME 命令从管理中删除损坏的主机。您可以通过设置 ceph config set mgr mgr/cephadm/warn_on_failed_host_check false 来禁用此健康警告。

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.