故障排除指南

Red Hat Ceph Storage 5

Red Hat Ceph Storage 故障排除

Red Hat Ceph Storage Documentation Team

摘要

本文档论述了如何解决 Red Hat Ceph Storage 中的常见问题。

红帽承诺替换我们的代码、文档和网页属性中存在问题的语言。我们从这四个术语开始： master、slave、blacklist 和 whitelist。这些更改将在即将发行的几个发行本中逐渐实施。详情请查看 CTO Chris Wright 信息。

第 1 章初始故障排除
复制链接

作为存储管理员，您可以在联系红帽支持前对 Red Hat Ceph Storage 集群进行初始故障排除。本章包括以下信息：

识别问题。
了解 Ceph 健康.
静默 Ceph 集群的健康警报。
了解 Ceph 日志.
生成 'sos report'。

1.2. 识别问题
复制链接

要确定 Red Hat Ceph Storage 集群的错误可能的原因，请回答流程部分中的问题。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。

流程

使用不支持的配置时可能会出现某些问题。确保您的配置被支持。
您知道哪个 Ceph 组件导致了此问题吗？
1. No. 参照 Red Hat Ceph Storage Troubleshooting Guide 中的 Diagnosing the health of a Ceph storage cluster 过程。
2. Ceph 监控器。参阅 Red Hat Ceph Storage Troubleshooting Guide 中的 Troubleshooting Ceph Monitors 部分。
3. Ceph OSD。请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的 Troubleshooting Ceph OSDs 部分。
4. Ceph 放置组。请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的 Troubleshooting Ceph placement groups 部分。
5. 多站点 Ceph 对象网关.请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的 Troubleshooting a multi-site Ceph Object Gateway 部分。

其它资源

详情请参阅 Red Hat Ceph Storage: 支持的配置文章。

1.3. 诊断存储集群的健康状况
复制链接

此流程列出了诊断 Red Hat Ceph Storage 集群健康状况的基本步骤。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。

流程

登录到 Cephadm shell：
示例
```
cephadm shell
```
```
[root@host01 ~]# cephadm shell
```
Copy to Clipboard Toggle word wrap
检查存储集群的整体状态：
示例
```
[ceph: root@host01 /]# ceph health detail
```
```
[ceph: root@host01 /]# ceph health detail
```
Copy to Clipboard Toggle word wrap
如果命令返回 HEALTH_WARN 或 HEALTH_ERR，请参见 了解 Ceph 健康状况 以了解详细信息。
监控存储集群的日志：
示例
```
[ceph: root@host01 /]# ceph -W cephadm
```
```
[ceph: root@host01 /]# ceph -W cephadm
```
Copy to Clipboard Toggle word wrap

要将集群日志捕获到文件中，请运行以下命令：

示例

[ceph: root@host01 /]# ceph config set global log_to_file true
[ceph: root@host01 /]# ceph config set global mon_cluster_log_to_file true

[ceph: root@host01 /]# ceph config set global log_to_file true
[ceph: root@host01 /]# ceph config set global mon_cluster_log_to_file true

Copy to Clipboard

Toggle word wrap

日志默认位于 /var/log/ceph/CLUSTER_FSID/ 目录中。检查 Ceph 日志，以了解 了解 Ceph 日志 中列出的任何错误消息。

如果日志没有包括足够数量的信息，请提高调试级别，并尝试重现失败的操作。详情请参阅 配置日志。

1.4. 了解 Ceph 的健康状态
复制链接

ceph health 命令返回有关 Red Hat Ceph Storage 集群状态的信息：

HEALTH_OK 表示集群处于健康状态。
HEALTH_WARN 表示警告。在某些情况下，Ceph 状态会自动返回到 HEALTH_OK。例如，当红帽 Ceph 存储集群完成重新平衡过程时。但是，如果集群处于 HEALTH_WARN 状态，请考虑进一步故障排除。
HEALTH_ERR 表示需要您立即关注的更严重的问题。

使用 ceph 运行状况详细信息 和 ceph -s 命令获取更详细的输出。

注意

如果没有 mgr 守护进程正在运行，则会显示运行状况警告。如果 Red Hat Ceph Storage 集群的最后 mgr 守护进程已被删除，您可以在 Red Hat Storage 集群的随机主机上手动部署 mgr 守护进程。请参阅 Red Hat Ceph Storage 5 Administration Guide 中的 手动部署 mgr 守护进程。

1.6. 了解 Ceph 日志
复制链接

在启用了日志记录到文件后，Ceph 将其日志存储在 /var/log/ceph/CLUSTER_FSID/ 目录中。要启用日志记录 Ceph Monitor、Ceph Manager、Ceph 对象网关和其他守护进程，请将 log_to_file 设置为 true，如 Diagnosing 存储集群的健康部分所述

The CLUSTER_NAME.log 是包含全局事件的主存储集群日志文件。默认情况下，日志文件名称为 ceph.log。只有 Ceph Monitor 节点会包含主要的存储集群日志。

每个 Ceph OSD 和 monitor 都有自己的日志文件，名为 CLUSTER_NAME-osd.NUMBER.log 和 CLUSTER_NAME-mon.HOSTNAME.log。

当您提高 Ceph 子系统的调试级别时，Ceph 也为这些子系统生成新的日志文件。

1.7. 生成 sos 报告
复制链接

您可以运行 sos report 命令，从 Red Hat Enterprise Linux 收集 Red Hat Ceph Storage 集群的配置详情、系统信息和诊断信息。红帽支持团队使用此信息进一步排除存储集群的问题。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
对节点的根级别访问权限。

流程

安装 sos 软件包：
示例
```
dnf install sos
```
```
[root@host01 ~]# dnf install sos
```
Copy to Clipboard Toggle word wrap
注意
安装 sos-4.0.11.el8 软件包或更新的版本，以正确捕获 Ceph 命令输出。
运行 sos 报告 以获取存储集群的系统信息：
示例
```
sosreport -a --all-logs
```
```
[root@host01 ~]# sosreport -a --all-logs
```
Copy to Clipboard Toggle word wrap
报告保存在 /var/tmp 文件中。
对于 sos 版本 4.3 及更新的版本，您需要运行以下命令获取特定的 Ceph 信息：
示例
```
sos report -a --all-logs -e ceph_mon
```
```
[root@host01 ~]# sos report -a --all-logs -e ceph_mon
```
Copy to Clipboard Toggle word wrap

表 2.1. Ceph 子系统和日志记录默认值
子系统	日志级别	内存级别	描述
`asok`	1	5	管理套接字
`auth`	1	5	身份验证
`client`	0	5	使用 `librados` 连接到集群的任何应用程序或库
`BlueStore`	1	5	BlueStore OSD 后端
`journal`	1	5	OSD 日志
`MDS`	1	5	元数据服务器
`monc`	0	5	monitor 客户端处理大部分 Ceph 守护进程和 monitor 之间的通信
`周一`	1	5	monitor
`ms`	0	5	Ceph 组件之间的消息传递系统
`osd`	0	5	OSD 守护进程
`Paxos`	0	5	监控用于建立共识的算法
`rados`	0	5	可靠的自主分布式对象存储，Ceph 的核心组件
`rbd`	0	5	Ceph 块设备
`rgw`	1	5	Ceph 对象网关

第 4 章 Ceph 监控器故障排除
复制链接

本章包含关于如何修复与 Ceph 监控器相关的最常见错误的信息。

4.2. 大多数常见 Ceph 监控错误
复制链接

下表列出了 ceph 运行状况详细信息 命令返回或包含在 Ceph 日志中的最常见错误消息：这些表中提供了相应部分的链接，这些部分解释了错误并指向修复问题的特定程序。

4.2.2. Ceph 监控错误消息
复制链接

常见 Ceph monitor 错误消息和可能的修复表。

Expand

错误消息	查看
`HEALTH_WARN`
`mon.X 停机（超出仲裁数）`	Ceph monitor 超出仲裁数
`clock skew`	Clock skew
`存储太大了！`	Ceph 监控器存储太大

4.2.3. Ceph 日志中的通用 Ceph monitor 错误消息
复制链接

Ceph 日志中找到的常见 Ceph monitor 错误消息表，以及指向潜在修复的链接。

Expand

错误消息	日志文件	查看
`clock skew`	主集群日志	Clock skew
`clocks not synchronized`	主集群日志	Clock skew
`损坏：记录中存在错误`	监控日志	Ceph monitor 超出仲裁数恢复 Ceph 监控存储
`损坏：1 缺少文件`	监控日志	Ceph monitor 超出仲裁数恢复 Ceph 监控存储
`Caught signal (Bus error)`	监控日志	Ceph monitor 超出仲裁数

4.2.4. Ceph monitor 超出仲裁数
复制链接

个或多个 Ceph 监控器已标记为 down，但其他 Ceph 监控器仍然能够形成仲裁。此外，ceph health detail 命令返回类似如下的错误消息：

HEALTH_WARN 1 mons down, quorum 1,2 mon.b,mon.c
mon.a (rank 0) addr 127.0.0.1:6789/0 is down (out of quorum)

HEALTH_WARN 1 mons down, quorum 1,2 mon.b,mon.c
mon.a (rank 0) addr 127.0.0.1:6789/0 is down (out of quorum)

Copy to Clipboard

Toggle word wrap

此 Means 是什么

Ceph 将 Ceph monitor 标记为 down，原因有多种。

如果 ceph-mon 守护进程未在运行，它可能具有损坏的存储或者其他一些错误阻止守护进程启动。另外，/var/ 分区可能已满。因此，ceph -mon 无法对位于 /var/lib/ceph/mon-SHORT_HOST_NAME/store.db 的存储执行任何操作，并终止。

如果 ceph-mon 守护进程正在运行，但 Ceph monitor 没有仲裁并标记为 down，问题的原因取决于 Ceph monitor 状态：

如果 Ceph 监控器处于 probing 状态的时间超过预期，则代表它无法找到其他 Ceph 监控器。此问题可能是由网络问题造成的，或者 Ceph monitor 可能有过时的 Ceph monitor map(monmap)，并尝试访问错误的 IP 地址上的其他 Ceph 监控器。另外，如果 monmap 是最新的，Ceph monitor 的时钟可能无法同步。
如果 Ceph monitor 处于 electing 状态的时间超过预期，Ceph 监控器的时钟可能没有同步。
如果 Ceph monitor 将自己的状态从同步更改为开机和返回，集群状态将会发展。这意味着，它生成的新 map 的速度要快于同步进程可以处理的速度。
如果 Ceph 监控器将自身标记为 leader 或 peon，那么它认为自己处于仲裁状态，而剩余的集群则确定它没有处于这个状态。此问题可能是时钟同步失败造成的。

要排除这个问题，请执行以下操作

验证 ceph-mon 守护进程正在运行。如果没有，启动它：

语法

systemctl status ceph-FSID@DAEMON_NAME
systemctl start ceph-FSID@DAEMON_NAME

systemctl status ceph-FSID@DAEMON_NAME
systemctl start ceph-FSID@DAEMON_NAME

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service
systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service

[root@mon ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service
[root@mon ~]# systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service

Copy to Clipboard

Toggle word wrap

如果无法启动 ceph-mon 守护进程，请按照 The ceph-mon daemon cannot start 步骤进行操作。
如果您可以启动 ceph-mon 守护进程但标记为 down，请按照 ceph-mon 守护进程中的步骤运行，但标记为"down"。

ceph-mon Daemon 无法启动

检查 /var/log/ceph/CLUSTER_FSID/ceph-mon.HOST_NAME.log 中对应的 Ceph Monitor 日志。
注意
默认情况下，日志文件夹中不存在 monitor 日志。您需要启用日志记录到文件，以便日志出现在文件夹中。请参阅 Ceph 守护进程日志，以启用记录到文件。
如果日志中包含类似于下列错误消息的错误消息，Ceph monitor 可能具有损坏的存储：
```
Corruption: error in middle of record
Corruption: 1 missing files; example: /var/lib/ceph/mon/mon.0/store.db/1234567.ldb
```
```
Corruption: error in middle of record
Corruption: 1 missing files; example: /var/lib/ceph/mon/mon.0/store.db/1234567.ldb
```
Copy to Clipboard Toggle word wrap
若要修复此问题，可替换 Ceph Monitor。请参阅替换失败的 monitor。
如果日志包含类似如下的错误消息，/var/ 分区可能已满。从 /var/ 删除任何不必要的数据。
```
Caught signal (Bus error)
```
```
Caught signal (Bus error)
```
Copy to Clipboard Toggle word wrap
重要
不要手动从 monitor 目录中删除任何数据。而应使用 ceph-monstore-tool 将它压缩。详情请参阅 紧凑 Ceph monitor 存储。
如果您看到任何其他错误消息，请打开支持票据。有关 详细信息，请参阅联系红帽支持团队。

ceph-mon Daemon 运行，但 Still Marked 为 down

在超出仲裁的 Ceph Monitor 主机中，使用 mon_status 命令检查其状态：
```
ceph daemon ID mon_status
```
```
[root@mon ~]# ceph daemon ID mon_status
```
Copy to Clipboard Toggle word wrap
使用 Ceph monitor 的 ID 替换 ID，例如：
```
[ceph: root@host01 /]# ceph daemon mon.host01 mon_status
```
```
[ceph: root@host01 /]# ceph daemon mon.host01 mon_status
```
Copy to Clipboard Toggle word wrap
如果状态为 probing ，请验证 mon_status 输出中其他 Ceph monitor 的位置。
1. 如果地址不正确，Ceph monitor 具有不正确的 Ceph monitor map(monmap)。若要修复此问题，请参阅注入 Ceph monitor map。
2. 如果地址正确，请验证 Ceph 监控时钟是否已同步。详情请查看 Clock skew。另外，对任何网络问题进行故障排除，请参阅 对网络进行故障排除以了解详细信息。
如果状态为选中状态，请验证 Ceph 监控时钟是否已同步。详情请查看 Clock skew。
如果状态从选择同步变为同步，请打开支持票据。有关 详细信息，请参阅联系红帽支持团队。
如果 Ceph monitor 是领导机或工作机，请验证 Ceph 监控时钟是否已同步。详情请查看 Clock skew。如果同步时钟无法解决问题，请创建一个支持问题单。有关 详细信息，请参阅联系红帽支持团队。

4.2.5. Clock skew
复制链接

Ceph monitor 超出仲裁数，ceph 运行状况详情 命令输出包含类似于如下的错误消息：

mon.a (rank 0) addr 127.0.0.1:6789/0 is down (out of quorum)
mon.a addr 127.0.0.1:6789/0 clock skew 0.08235s > max 0.05s (latency 0.0045s)

mon.a (rank 0) addr 127.0.0.1:6789/0 is down (out of quorum)
mon.a addr 127.0.0.1:6789/0 clock skew 0.08235s > max 0.05s (latency 0.0045s)

Copy to Clipboard

Toggle word wrap

此外，Ceph 日志包含类似如下的错误消息：

2022-05-04 07:28:32.035795 7f806062e700 0 log [WRN] : mon.a 127.0.0.1:6789/0 clock skew 0.14s > max 0.05s
2022-05-04 04:31:25.773235 7f4997663700 0 log [WRN] : message from mon.1 was stamped 0.186257s in the future, clocks not synchronized

2022-05-04 07:28:32.035795 7f806062e700 0 log [WRN] : mon.a 127.0.0.1:6789/0 clock skew 0.14s > max 0.05s
2022-05-04 04:31:25.773235 7f4997663700 0 log [WRN] : message from mon.1 was stamped 0.186257s in the future, clocks not synchronized

Copy to Clipboard

Toggle word wrap

此 Means 是什么

时钟偏移 错误消息表示 Ceph 监控器的时钟没有同步。时钟同步很重要，因为 Ceph monitor 依赖于时间精度，如果时钟不同步，其行为不可预知。

mon_clock_drift_allowed 参数决定时钟之间的差别是 tolerated。默认情况下，此参数设置为 0.05 秒。

重要

在未进行之前测试的情况下，请勿更改 mon_clock_drift_allowed 的默认值。更改此值可能会影响 Ceph 监控器和 Ceph 存储群集的稳定性。

时钟偏移 错误的原因包括：如果配置了 chrony 网络时间协议(NTP)同步中的网络问题或问题。此外，时间同步无法在虚拟机上部署的 Ceph 监控器上正常工作。

要排除这个问题，请执行以下操作

验证您的网络是否正常工作。详情请参阅对 网络问题进行故障排除。如果您使用 chrony 作为 NTP，请参阅 基本 chrony NTP 故障排除部分。
如果您使用远程 NTP 服务器，请考虑在网络上部署自己的 chrony NTP 服务器。详情请参阅为 Red Hat Enterprise Linux 8 配置基本系统设置 中的使用 Chrony 套件配置 NTP 章节。

注意

Ceph 仅评估每五分钟的时间同步，因此修复问题与清除 时钟偏移 消息之间会有一个延迟。

其它资源

4.2.6. Ceph 监控器存储太大
复制链接

ceph health 命令返回类似如下的错误消息：

mon.ceph1 store is getting too big! 48031 MB >= 15360 MB -- 62% avail

mon.ceph1 store is getting too big! 48031 MB >= 15360 MB -- 62% avail

Copy to Clipboard

Toggle word wrap

此 Means 是什么

Ceph Monitor 存储实际上是 RocksDB 数据库，它将条目存储为键值对。数据库包含一个 cluster map，默认位于 /var/lib/ceph/CLUSTER_FSID/mon.HOST_NAME/store.db。

查询大型 monitor 存储可能需要时间。因此，Ceph monitor 在响应客户端查询时可能会延迟。

此外，如果 /var/ 分区已满，Ceph monitor 无法对存储执行任何写入操作并终止。如需了解对此问题进行故障排除的详细信息 ，请参阅 Ceph monitor 仲裁。

要排除这个问题，请执行以下操作

检查数据库的大小：

语法

du -sch /var/lib/ceph/CLUSTER_FSID/mon.HOST_NAME/store.db/

du -sch /var/lib/ceph/CLUSTER_FSID/mon.HOST_NAME/store.db/

Copy to Clipboard

Toggle word wrap

指定集群的名称，以及运行 ceph-mon 的主机的短主机名。

示例

du -sh  /var/lib/ceph/b341e254-b165-11ed-a564-ac1f6bb26e8c/mon.host01/
109M	/var/lib/ceph/b341e254-b165-11ed-a564-ac1f6bb26e8c/mon.host01/
47G     /var/lib/ceph/mon/ceph-ceph1/store.db/
47G     total

[root@mon ~]# du -sh  /var/lib/ceph/b341e254-b165-11ed-a564-ac1f6bb26e8c/mon.host01/
109M	/var/lib/ceph/b341e254-b165-11ed-a564-ac1f6bb26e8c/mon.host01/
47G     /var/lib/ceph/mon/ceph-ceph1/store.db/
47G     total

Copy to Clipboard

Toggle word wrap

紧凑 Ceph 监控存储.详情请参阅 紧凑 Ceph monitor 存储。

其它资源

Ceph monitor 超出仲裁数

4.2.7. 了解 Ceph 监控状态
复制链接

mon_status 命令返回 Ceph monitor 的信息，例如：

状态
等级
选举时期
monitor map(monmap)

如果 Ceph monitor 能够形成仲裁，请使用 mon_status 和 ceph 命令行实用程序。

如果 Ceph monitor 无法形成仲裁，但 ceph-mon 守护进程正在运行，请使用管理 socket 来执行 mon_status。

mon_status 输出示例

{
    "name": "mon.3",
    "rank": 2,
    "state": "peon",
    "election_epoch": 96,
    "quorum": [
        1,
        2
    ],
    "outside_quorum": [],
    "extra_probe_peers": [],
    "sync_provider": [],
    "monmap": {
        "epoch": 1,
        "fsid": "d5552d32-9d1d-436c-8db1-ab5fc2c63cd0",
        "modified": "0.000000",
        "created": "0.000000",
        "mons": [
            {
                "rank": 0,
                "name": "mon.1",
                "addr": "172.25.1.10:6789\/0"
            },
            {
                "rank": 1,
                "name": "mon.2",
                "addr": "172.25.1.12:6789\/0"
            },
            {
                "rank": 2,
                "name": "mon.3",
                "addr": "172.25.1.13:6789\/0"
            }
        ]
    }
}

{
    "name": "mon.3",
    "rank": 2,
    "state": "peon",
    "election_epoch": 96,
    "quorum": [
        1,
        2
    ],
    "outside_quorum": [],
    "extra_probe_peers": [],
    "sync_provider": [],
    "monmap": {
        "epoch": 1,
        "fsid": "d5552d32-9d1d-436c-8db1-ab5fc2c63cd0",
        "modified": "0.000000",
        "created": "0.000000",
        "mons": [
            {
                "rank": 0,
                "name": "mon.1",
                "addr": "172.25.1.10:6789\/0"
            },
            {
                "rank": 1,
                "name": "mon.2",
                "addr": "172.25.1.12:6789\/0"
            },
            {
                "rank": 2,
                "name": "mon.3",
                "addr": "172.25.1.13:6789\/0"
            }
        ]
    }
}

Copy to Clipboard

Toggle word wrap

Ceph monitor 状态

leader: 在选择阶段，Ceph 监控器正在选举领导机。领导机是具有最高等级的 Ceph monitor，即值最低的排名。在上例中，领导机是 mon.1。
Ppeon: Ppeons 是仲裁中的 Ceph monitor，而不是领导。如果领导失败，则排名最高的 peon 将成为新的领导。
Probing: 如果 Ceph 监控器正在寻找其他 Ceph 监控器，则 Ceph 监控器处于探测状态。例如，在启动 Ceph monitor 后，它们会进行探测，直到找到在 Ceph Monitor map（monmap）中指定的足够的 Ceph monitor 来形成仲裁。
选择: 如果 Ceph 监控器正在选择领导机，则 Ceph 监控器处于选择状态。通常，此状态会快速变化。
同步: 如果 Ceph monitor 正在与其他 Ceph 监控器同步以加入仲裁，则 Ceph monitor 处于同步状态。Ceph 监控器存储容量越小，同步过程越快。因此，如果您有一个大型存储，同步会需要更长的时间。

其它资源

详情请参阅 Red Hat Ceph Storage 5 管理指南中的使用 Ceph 管理套接字一节。

4.2.8. 其它资源
复制链接

请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的第 4.2.2 节 “Ceph 监控错误消息”。
请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的第 4.2.3 节 “Ceph 日志中的通用 Ceph monitor 错误消息”。

4.4. 替换失败的 monitor
复制链接

当 Ceph 监控器有损坏的存储时，您可以替换存储集群中的 monitor。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
能够形成仲裁。
Ceph 监控节点的根级别访问权限.

流程

从 Monitor 主机，删除 Monitor 存储（默认位于 /var/lib/ceph/mon/CLUSTER_NAME-SHORT_HOST_NAME）：
```
rm -rf /var/lib/ceph/mon/CLUSTER_NAME-SHORT_HOST_NAME
```
```
rm -rf /var/lib/ceph/mon/CLUSTER_NAME-SHORT_HOST_NAME
```
Copy to Clipboard Toggle word wrap
指定 monitor 主机的简短主机名和集群名称。例如，要从名为 remote 的集群中删除在 host1 上运行的 monitor 存储：
```
rm -rf /var/lib/ceph/mon/remote-host1
```
```
[root@mon ~]# rm -rf /var/lib/ceph/mon/remote-host1
```
Copy to Clipboard Toggle word wrap
从 monitor map 中删除 monitor(monmap)：
```
ceph mon remove SHORT_HOST_NAME --cluster CLUSTER_NAME
```
```
ceph mon remove SHORT_HOST_NAME --cluster CLUSTER_NAME
```
Copy to Clipboard Toggle word wrap
指定 monitor 主机的简短主机名和集群名称。例如，要从名为 remote 的集群中移除 host1 上运行的 monitor：
```
[ceph: root@host01 /]# ceph mon remove host01 --cluster remote
```
```
[ceph: root@host01 /]# ceph mon remove host01 --cluster remote
```
Copy to Clipboard Toggle word wrap
排除故障并修复与 monitor 主机底层文件系统或硬件相关的问题。

4.6. 为 Ceph Manager 打开端口
复制链接

ceph-mgr 守护进程从与 ceph-osd 守护进程相同的端口范围的 OSD 接收 PG 信息。如果没有打开这些端口，集群将从 HEALTH_OK 状态变为 HEALTH_WARN，并且指出 PG 为 unknown 并显示为 unknown 状态的 PG 数量。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
对 Ceph Manager 的 root 级别访问权限。

流程

要解决这种情况，对于运行 ceph-mgr 守护进程的每个主机，打开端口 6800-7300。

示例

[root@ceph-mgr] # firewall-cmd --add-port 6800-7300/tcp
[root@ceph-mgr] # firewall-cmd --add-port 6800-7300/tcp --permanent

[root@ceph-mgr] # firewall-cmd --add-port 6800-7300/tcp
[root@ceph-mgr] # firewall-cmd --add-port 6800-7300/tcp --permanent

Copy to Clipboard

Toggle word wrap

重新启动 ceph-mgr 守护进程。

4.7. 恢复 Ceph 监控存储
复制链接

Ceph Monitor 将 cluster map 存储在键值存储中，如 RocksDB。如果存储在 monitor 上损坏，monitor 会意外终止，无法再次启动。Ceph 日志可能包括以下错误：

Corruption: error in middle of record
Corruption: 1 missing files; e.g.: /var/lib/ceph/mon/mon.0/store.db/1234567.ldb

Corruption: error in middle of record
Corruption: 1 missing files; e.g.: /var/lib/ceph/mon/mon.0/store.db/1234567.ldb

Copy to Clipboard

Toggle word wrap

Red Hat Ceph Storage 集群至少使用三个 Ceph 监控器，以便在出现故障时将其替换为另一个 Ceph。然而，在某些情况下，所有 Ceph 监控器可能会损坏存储。例如，当 Ceph 监控节点配置错误的磁盘或文件系统设置时，断电可能会破坏底层文件系统。

如果所有 Ceph 监控上都存在损坏，则可以使用名为 ceph-monstore-tool 和 ceph-objectstore-tool 的实用程序，通过 OSD 节点上存储的信息来恢复它。

重要

这些步骤无法恢复以下信息：

元数据守护进程服务器(MDS)密钥环和映射
放置组设置：
- 使用 ceph pg set_full_ratio 命令设置 完整比率
- 使用 ceph pg set_nearfull_ratio 命令设置的 nearfull 比率

重要

切勿从旧备份恢复 Ceph 监控存储。使用下列步骤从当前集群状态重建 Ceph monitor 存储，并从中恢复。

4.7.1. 使用 BlueStore 时恢复 Ceph monitor 存储
复制链接

如果 Ceph monitor 存储在所有 Ceph 监控上损坏并且您使用 BlueStore 后端，请按照以下步骤操作。

在容器化环境中，此方法需要附加 Ceph 存储库并首先恢复到非容器化 Ceph monitor。

警告

这个过程可能会导致数据丢失。如果您不确定这个过程中的任何步骤，请联系红帽技术支持以获取恢复过程的帮助。

先决条件

所有 OSD 容器都已停止。
根据 Ceph 节点上的角色，启用 Ceph 存储库。
ceph-test 和 rsync 软件包安装在 OSD 和 monitor 节点上。
ceph-mon 软件包安装在 monitor 节点上。
ceph-osd 软件包安装在 OSD 节点上。

流程

使用 Ceph 数据挂载所有磁盘到临时位置。对所有 OSD 节点重复此步骤。
1. 使用 ceph-volume 命令列出数据分区：
  示例
  [ceph: root@host01 /]# ceph-volume lvm list
  
  Copy to Clipboard Toggle word wrap
2. 将数据分区挂载到临时位置：
  语法
  mount -t tmpfs tmpfs /var/lib/ceph/osd/ceph-$i
  
  Copy to Clipboard Toggle word wrap
3. 恢复 SELinux 上下文：
  语法
  for i in {OSD_ID}; do restorecon /var/lib/ceph/osd/ceph-$i; done
  
  Copy to Clipboard Toggle word wrap
  使用 OSD 节点上以空格分隔的 Ceph OSD ID 列表替换 OSD_ID。
4. 将所有者和组更改为 ceph:ceph ：
  语法
  for i in {OSD_ID}; do chown -R ceph:ceph /var/lib/ceph/osd/ceph-$i; done
  
  Copy to Clipboard Toggle word wrap
  使用 OSD 节点上以空格分隔的 Ceph OSD ID 列表替换 OSD_ID。
  重要
  由于一个程序错误会导致 update-mon-db 命令为 monitor 数据库使用额外的 db 和 db.slow 目录，因此您还必须复制这些目录。要做到这一点：
  准备容器外部的临时位置，以挂载和访问 OSD 数据库，并提取恢复 Ceph 监控所需的 OSD map：
  语法
  
  ceph-bluestore-tool --cluster=ceph prime-osd-dir --dev OSD-DATA --path /var/lib/ceph/osd/ceph-OSD-ID
  
  Copy to Clipboard Toggle word wrap
  
  将 OSD-DATA 替换为卷组(VG)或逻辑卷(LV)路径，并将 OSD-ID 替换为 OSD 的 ID。
  在 BlueStore 数据库和 block.db 之间创建一个符号链接：
  语法
  
  ln -snf BLUESTORE DATABASE /var/lib/ceph/osd/ceph-OSD-ID/block.db
  
  Copy to Clipboard Toggle word wrap
  
  将 BLUESTORE-DATABASE 替换为 BlueStore 数据库和 OSD-ID 的卷组(VG)或逻辑卷(LV)路径。

从具有损坏存储的 Ceph 监控节点使用以下命令：为所有节点上的所有 OSD 重复它们。

从所有 OSD 节点收集 cluster map：

示例

cd /root/
ms=/tmp/monstore/
db=/root/db/
db_slow=/root/db.slow/

mkdir $ms
for host in $osd_nodes; do
                echo "$host"
                rsync -avz $ms $host:$ms
                rsync -avz $db $host:$db
                rsync -avz $db_slow $host:$db_slow

                rm -rf $ms
                rm -rf $db
                rm -rf $db_slow

                sh -t $host <<EOF
                  for osd in /var/lib/ceph/osd/ceph-*; do
                    ceph-objectstore-tool --type bluestore --data-path \$osd --op update-mon-db --mon-store-path $ms

                   done
                EOF

                      rsync -avz $host:$ms $ms
                      rsync -avz $host:$db $db
                      rsync -avz $host:$db_slow $db_slow
                done

[root@host01 ~]# cd /root/
[root@host01 ~]# ms=/tmp/monstore/
[root@host01 ~]# db=/root/db/
[root@host01 ~]# db_slow=/root/db.slow/

[root@host01 ~]# mkdir $ms
[root@host01 ~]# for host in $osd_nodes; do
                echo "$host"
                rsync -avz $ms $host:$ms
                rsync -avz $db $host:$db
                rsync -avz $db_slow $host:$db_slow

                rm -rf $ms
                rm -rf $db
                rm -rf $db_slow

                sh -t $host <<EOF
                  for osd in /var/lib/ceph/osd/ceph-*; do
                    ceph-objectstore-tool --type bluestore --data-path \$osd --op update-mon-db --mon-store-path $ms

                   done
                EOF

                      rsync -avz $host:$ms $ms
                      rsync -avz $host:$db $db
                      rsync -avz $host:$db_slow $db_slow
                done

Copy to Clipboard

Toggle word wrap

设置适当的功能：

示例

[ceph: root@host01 /]# ceph-authtool /etc/ceph/ceph.client.admin.keyring -n mon. --cap mon 'allow *' --gen-key
[ceph: root@host01 /]# cat /etc/ceph/ceph.client.admin.keyring
  [mon.]
    key = AQCleqldWqm5IhAAgZQbEzoShkZV42RiQVffnA==
    caps mon = "allow *"
  [client.admin]
    key = AQCmAKld8J05KxAArOWeRAw63gAwwZO5o75ZNQ==
    auid = 0
    caps mds = "allow *"
    caps mgr = "allow *"
    caps mon = "allow *"
    caps osd = "allow *"

[ceph: root@host01 /]# ceph-authtool /etc/ceph/ceph.client.admin.keyring -n mon. --cap mon 'allow *' --gen-key
[ceph: root@host01 /]# cat /etc/ceph/ceph.client.admin.keyring
  [mon.]
    key = AQCleqldWqm5IhAAgZQbEzoShkZV42RiQVffnA==
    caps mon = "allow *"
  [client.admin]
    key = AQCmAKld8J05KxAArOWeRAw63gAwwZO5o75ZNQ==
    auid = 0
    caps mds = "allow *"
    caps mgr = "allow *"
    caps mon = "allow *"
    caps osd = "allow *"

Copy to Clipboard

Toggle word wrap

将所有 sst 文件从 db 和 db.slow 目录移动到临时位置：

示例

[ceph: root@host01 /]# mv /root/db/*.sst /root/db.slow/*.sst /tmp/monstore/store.db

[ceph: root@host01 /]# mv /root/db/*.sst /root/db.slow/*.sst /tmp/monstore/store.db

Copy to Clipboard

Toggle word wrap

从收集的 map 重建 monitor 存储：
示例
```
[ceph: root@host01 /]# ceph-monstore-tool /tmp/monstore rebuild -- --keyring /etc/ceph/ceph.client.admin
```
```
[ceph: root@host01 /]# ceph-monstore-tool /tmp/monstore rebuild -- --keyring /etc/ceph/ceph.client.admin
```
Copy to Clipboard Toggle word wrap
注意
使用此命令后，Ceph 身份验证数据库中仅存在从 OSD 提取的密钥环和 ceph-monstore-tool 命令行中指定的密钥环。您必须重新创建或导入所有其他密钥环，如客户端、Ceph 管理器和 Ceph 对象网关等，以便这些客户端可以访问集群。

备份损坏的存储。对所有 Ceph 监控节点重复此步骤：

语法

mv /var/lib/ceph/mon/ceph-HOSTNAME/store.db /var/lib/ceph/mon/ceph-HOSTNAME/store.db.corrupted

mv /var/lib/ceph/mon/ceph-HOSTNAME/store.db /var/lib/ceph/mon/ceph-HOSTNAME/store.db.corrupted

Copy to Clipboard

Toggle word wrap

使用 Ceph 监控节点的主机名替换 HOSTNAME。

替换损坏的存储。对所有 Ceph 监控节点重复此步骤：
语法
```
scp -r /tmp/monstore/store.db HOSTNAME:/var/lib/ceph/mon/ceph-HOSTNAME/
```
```
scp -r /tmp/monstore/store.db HOSTNAME:/var/lib/ceph/mon/ceph-HOSTNAME/
```
Copy to Clipboard Toggle word wrap
使用 monitor 节点的主机名替换 HOSTNAME。
更改新存储的所有者。对所有 Ceph 监控节点重复此步骤：
语法
```
chown -R ceph:ceph /var/lib/ceph/mon/ceph-HOSTNAME/store.db
```
```
chown -R ceph:ceph /var/lib/ceph/mon/ceph-HOSTNAME/store.db
```
Copy to Clipboard Toggle word wrap
使用 Ceph 监控节点的主机名替换 HOSTNAME。

卸载所有节点上所有临时挂载的 OSD：
示例
```
umount /var/lib/ceph/osd/ceph-*
```
```
[root@host01 ~]# umount /var/lib/ceph/osd/ceph-*
```
Copy to Clipboard Toggle word wrap

启动所有 Ceph 监控守护进程：

语法

systemctl start ceph-FSID@DAEMON_NAME

systemctl start ceph-FSID@DAEMON_NAME

Copy to Clipboard

Toggle word wrap

示例

systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service

[root@mon ~]# systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@mon.host01.service

Copy to Clipboard

Toggle word wrap

确保 monitor 能够形成仲裁：
语法
```
ceph -s
```
```
ceph -s
```
Copy to Clipboard Toggle word wrap
使用 Ceph 监控节点的主机名替换 HOSTNAME。

导入 Ceph Manager 密钥环并启动所有 Ceph Manager 进程：

语法

ceph auth import -i /etc/ceph/ceph.mgr.HOSTNAME.keyring
systemctl start ceph-FSID@DAEMON_NAME

ceph auth import -i /etc/ceph/ceph.mgr.HOSTNAME.keyring
systemctl start ceph-FSID@DAEMON_NAME

Copy to Clipboard

Toggle word wrap

示例

systemctl start ceph-b341e254-b165-11ed-a564-ac1f6bb26e8c@mgr.extensa003.exrqql.service

[root@host01 ~]# systemctl start ceph-b341e254-b165-11ed-a564-ac1f6bb26e8c@mgr.extensa003.exrqql.service

Copy to Clipboard

Toggle word wrap

使用 Ceph 管理器节点的主机名替换 HOSTNAME。

启动所有 OSD 节点的所有 OSD 进程。对集群中的所有 OSD 重复：

语法

systemctl start ceph-FSID@osd.OSD_ID

systemctl start ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl start ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

确保 OSD 返回到服务：
示例
```
[ceph: root@host01 /]# ceph -s
```
```
[ceph: root@host01 /]# ceph -s
```
Copy to Clipboard Toggle word wrap

4.8. 其它资源
复制链接

有关网络相关问题，请参阅红帽 Ceph 存储故障排除指南 中的第 3 章 网络问题故障排除。

错误消息	查看
`HEALTH_ERR`
`full osds`	完整 OSD
`HEALTH_WARN`
`backfillfull osds`	backfillfull OSDS
`nearfull osds`	nearfull OSD
`OSD 已停机`	降级 OSD flapping OSD
`requests are blocked`	请求或请求速度较慢
`slow requests`	请求或请求速度较慢

错误消息	日志文件	查看
`heartbeat_check：没有来自 osd.X 的回复`	主集群日志	flapping OSD
`错误地标记我被关闭`	主集群日志	flapping OSD
`OSD 的请求速度较慢`	主集群日志	请求或请求速度较慢
`FAILED assert(0 == "hit suicide timeout")`	OSD 日志	降级 OSD

参数	描述	默认值
`osd_heartbeat_grace_time`	OSD 等待 heartbeat 数据包返回多长时间，然后将 OSD 报告为 `down 到` Ceph 监控器。	20 秒
`mon_osd_min_down_reporters`	在 Ceph 监控将该 OSD 标记为 `down` 之前，需要多少 OSD 报告了另一个 OSD 为 `down`	2

请求类型慢	描述
`等待 rw 锁定`	OSD 正在等待在 PG 上获取操作的锁定。
`waiting for subops`	OSD 正在等待副本 OSD 将操作应用到日志。
`no flag points reached`	OSD 未达到任何主要操作里程碑。
`等待降级对象`	OSD 尚未复制指定次数的对象。

第 6 章多站点 Ceph 对象网关故障排除
复制链接

本章介绍了如何修复与多站点 Ceph 对象网关配置和操作条件相关的最常见的错误。

注意

当 bucket sync status 命令报告 bucket is behind on shards错误（即使在跨不同站点中的数据已保持一致）时，对存储桶执行额外的写入，同步 sync status 报告并显示信息 bucket is caught up with source。

6.1. 先决条件
复制链接

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph 对象网关.

6.2. Ceph 对象网关的代码定义错误
复制链接

Ceph 对象网关日志包含错误和警告消息，以协助对环境中条件进行故障排除。下面列出了一些常见的解决方案，并给出了建议的解决方案。

常见错误消息

data_sync: ERROR：同步操作返回错误: 这是提示较低级别 bucket 同步进程返回错误的高级别数据同步过程。此消息冗余；存储桶同步错误出现在日志中。
数据同步：ERROR: 无法同步对象： BUCKET_NAME: _OBJECT_NAME_: 进程无法通过 HTTP 从远程网关获取所需的对象，或者进程无法将该对象写入 RADOS，还会重试。
数据同步：ERROR：同步失败，退出(sync_status=2): 低级别消息反映上述条件之一，特别是数据已被删除，然后才能进行同步，从而显示 -2 ENOENT 状态。
data sync: ERROR: failure in sync, backing out (sync_status=-5): 反映了上述条件之一的低级别消息，特别是我们未能将该对象写入 RADOS，因此显示 -5 EIO。
ERROR：获取远程数据日志信息失败：ret=11: 这是来自 libcurl 的 EAGAIN 通用错误代码，反映来自另一个网关的错误条件。默认情况下，它将重试。
meta sync: ERROR: 无法读取带有(2)No such file or directory 的 mdlog info: mdlog 的分片从未创建，因此无法同步。

同步错误消息

同步对象失败: 进程无法通过 HTTP 从远程网关获取此对象，或者未能将该对象写入 RADOS，还会重试。
同步存储桶实例失败：(11)资源暂时不可用: 主要和次要区域之间的连接问题。
同步存储桶实例失败：(125)操作取消: 对同一 RADOS 对象的写入之间存在一个跟踪条件。

其它资源

如需其他帮助，请联系红帽支持团队。

6.3. 同步多站点 Ceph 对象网关
复制链接

多站点同步从其它区域读取更改日志。要从元数据和数据日志中获取同步进度的高级视图，您可以使用以下命令：

示例

[ceph: root@host01 /]# radosgw-admin sync status

[ceph: root@host01 /]# radosgw-admin sync status

Copy to Clipboard

Toggle word wrap

此命令列出源区域后面的日志分片（若有）。

注意

有时，您可能会在运行 radosgw-admin sync status 命令时观察恢复分片。对于数据同步，每个复制日志都有 128 个分片。如果这些复制日志事件触发的任何操作导致网络、存储或其他位置出现任何错误，则这些错误会被跟踪，以便操作可以稍后重试。虽然给定分片有需要重试的错误，radosgw-admin sync status 命令将该分片报告为 recovering。此恢复会自动发生，因此 Operator 不需要干预来解决它们。

如果以上运行的同步状态的结果返回日志分片，运行以下命令，将 X 替换为实际的 shard-id。

语法

radosgw-admin data sync status --shard-id=X --source-zone=ZONE_NAME

radosgw-admin data sync status --shard-id=X --source-zone=ZONE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# radosgw-admin data sync status --shard-id=27 --source-zone=us-east
{
  "shard_id": 27,
  "marker": {
         "status": "incremental-sync",
         "marker": "1_1534494893.816775_131867195.1",
         "next_step_marker": "",
         "total_entries": 1,
         "pos": 0,
         "timestamp": "0.000000"
   },
   "pending_buckets": [],
   "recovering_buckets": [
         "pro-registry:4ed07bb2-a80b-4c69-aa15-fdc17ae6f5f2.314303.1:26"
   ]
}

[ceph: root@host01 /]# radosgw-admin data sync status --shard-id=27 --source-zone=us-east
{
  "shard_id": 27,
  "marker": {
         "status": "incremental-sync",
         "marker": "1_1534494893.816775_131867195.1",
         "next_step_marker": "",
         "total_entries": 1,
         "pos": 0,
         "timestamp": "0.000000"
   },
   "pending_buckets": [],
   "recovering_buckets": [
         "pro-registry:4ed07bb2-a80b-4c69-aa15-fdc17ae6f5f2.314303.1:26"
   ]
}

Copy to Clipboard

Toggle word wrap

输出列出了同步旁边的存储桶，以及会因为前面的错误而重试哪些存储桶（若有）。

通过以下命令检查各个 bucket 的状态，使用 bucket ID 替换 X。

语法

radosgw-admin bucket sync status --bucket=X.

radosgw-admin bucket sync status --bucket=X.

Copy to Clipboard

Toggle word wrap

将 X 替换为存储桶的 ID 号。

结果显示哪些存储桶索引日志分片位于其源区后面。

同步中的一个常见错误是 EBUSY，这意味着同步已在进行中，通常在另一个网关上。读取写入到同步错误日志的错误，可以使用以下命令进行读取：

radosgw-admin sync error list

radosgw-admin sync error list

Copy to Clipboard

Toggle word wrap

同步过程将重试，直到成功为止。错误仍可能发生，可能需要干预。

6.3.1. 执行多站点 Ceph 对象网关的数据同步的计数器
复制链接

以下性能计数器可用于 Ceph 对象网关的多站点配置来测量数据同步：

poll_latency 测量远程复制日志的请求延迟。
poll_errors 测量来自轮询请求的错误数量。
avgtime 是轮询请求的平均延迟。
fetch_bytes 测量数据同步获取的对象数和字节数。
fetch_errors 测量获取请求的错误数量。
fetch_not_modified 测量同步尝试获取对象的次数，但发现它已有最新的副本。

使用 ceph --admin-daemon 命令查看性能计数器的当前指标数据：

语法

ceph --admin-daemon /var/run/ceph/ceph-client.rgw.RGW_ID.asok perf dump data-sync-from-ZONE_NAME

ceph --admin-daemon /var/run/ceph/ceph-client.rgw.RGW_ID.asok perf dump data-sync-from-ZONE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph --admin-daemon /var/run/ceph/ceph-client.rgw.host02-rgw0.103.94309060818504.asok perf dump data-sync-from-us-west

{
    "data-sync-from-us-west": {
        "fetch bytes": {
            "avgcount": 54,
            "sum": 54526039885
        },
        "fetch not modified": 7,
        "fetch errors": 0,
        "poll latency": {
            "avgcount": 41,
            "sum": 2.533653367,
            "avgtime": 0.061796423
        },
        "poll errors": 0
    }
}

[ceph: root@host01 /]# ceph --admin-daemon /var/run/ceph/ceph-client.rgw.host02-rgw0.103.94309060818504.asok perf dump data-sync-from-us-west

{
    "data-sync-from-us-west": {
        "fetch bytes": {
            "avgcount": 54,
            "sum": 54526039885
        },
        "fetch not modified": 7,
        "fetch errors": 0,
        "poll latency": {
            "avgcount": 41,
            "sum": 2.533653367,
            "avgtime": 0.061796423
        },
        "poll errors": 0
    }
}

Copy to Clipboard

Toggle word wrap

注意

您必须从运行守护进程的节点中运行 ceph --admin-daemon 命令。

其它资源

有关 性能计数器 的更多信息，请参见《 红帽 Ceph 存储管理指南》 中的 Ceph 性能计数器一章。

6.4. 在多站点 Ceph 对象网关配置中同步数据
复制链接

在存储集群的多站点 Ceph 对象网关配置中，故障转移和故障恢复会导致数据同步停止。radosgw-admin sync status 命令报告数据同步在延长时间内已结束。

您可以运行 radosgw-admin data sync init 命令，来同步站点之间的数据，然后重新启动 Ceph 对象网关。此命令不涉及任何实际的对象数据，并启动指定源区的数据同步。它将使区域从源区重启完整同步。

重要

在运行 data sync init 命令前，请联系红帽支持。 https://access.redhat.com/support/contact/technicalSupport

如果您要完全重启同步，并且如果源区域中需要同步了大量数据，那么带宽消耗较高，则必须相应地规划。

注意

如果用户意外删除二级站点上的存储桶，您可以使用站点上的 metadata sync init 命令同步数据。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
Ceph 对象网关至少配置两个站点。

流程

检查站点之间的同步状态：

示例

[ceph: host04 /]# radosgw-admin sync status
          realm d713eec8-6ec4-4f71-9eaf-379be18e551b (india)
      zonegroup ccf9e0b2-df95-4e0a-8933-3b17b64c52b7 (shared)
           zone 04daab24-5bbd-4c17-9cf5-b1981fd7ff79 (primary)
   current time 2022-09-15T06:53:52Z
zonegroup features enabled: resharding
  metadata sync no sync (zone is master)
      data sync source: 596319d2-4ffe-4977-ace1-8dd1790db9fb (secondary)
                        syncing
                        full sync: 0/128 shards
                        incremental sync: 128/128 shards
                        data is caught up with source

[ceph: host04 /]# radosgw-admin sync status
          realm d713eec8-6ec4-4f71-9eaf-379be18e551b (india)
      zonegroup ccf9e0b2-df95-4e0a-8933-3b17b64c52b7 (shared)
           zone 04daab24-5bbd-4c17-9cf5-b1981fd7ff79 (primary)
   current time 2022-09-15T06:53:52Z
zonegroup features enabled: resharding
  metadata sync no sync (zone is master)
      data sync source: 596319d2-4ffe-4977-ace1-8dd1790db9fb (secondary)
                        syncing
                        full sync: 0/128 shards
                        incremental sync: 128/128 shards
                        data is caught up with source

Copy to Clipboard

Toggle word wrap

从 second zone 同步数据：

示例

[ceph: root@host04 /]# radosgw-admin data sync init --source-zone primary

[ceph: root@host04 /]# radosgw-admin data sync init --source-zone primary

Copy to Clipboard

Toggle word wrap

在站点重启所有 Ceph 对象网关守护进程：
示例
```
[ceph: root@host04 /]# ceph orch restart rgw.myrgw
```
```
[ceph: root@host04 /]# ceph orch restart rgw.myrgw
```
Copy to Clipboard Toggle word wrap

第 7 章对 Ceph iSCSI 网关（有限的可用性）进行故障排除
复制链接

作为存储管理员，您可以对使用 Ceph iSCSI 网关时可能出现的大多数常见错误进行故障排除。以下是您可能遇到的一些常见错误：

iSCSI 登录问题.
VMware ESXi 报告各种连接失败。
超时错误。

注意

该技术是有限可用性。如需更多信息，请参阅 已弃用的功能 章节。

7.1. 先决条件
复制链接

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph iSCSI 网关。
验证网络连接。

7.2. 为丢失的连接收集信息会导致 VMware ESXi 上的存储失败
复制链接

收集系统和磁盘信息有助于确定哪些 iSCSI 目标丢失连接，并可能导致存储失败。如果需要，还可以向红帽全球支持服务提供收集这些信息，以帮助您对任何 Ceph iSCSI 网关问题进行故障排除。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph iSCSI 网关，即 iSCSI 目标。
正在运行的 VMware ESXi 环境，即 iSCSI 启动器。
对 VMware ESXi 节点的根级别访问权限.

流程

在 VWware ESXi 节点上打开内核日志：
```
[root@esx:~]# more /var/log/vmkernel.log
```
```
[root@esx:~]# more /var/log/vmkernel.log
```
Copy to Clipboard Toggle word wrap

从 VMware ESXi 内核日志中的以下错误消息收集信息：

示例

2022-05-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
iscsivmk_ConnRxNotifyFailure: Sess [ISID: 00023d000005 TARGET:
iqn.2017-12.com.redhat.iscsi-gw:ceph-igw TPGT: 3 TSIH: 0]

2022-05-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
iscsivmk_ConnRxNotifyFailure: Sess [ISID: 00023d000005 TARGET:
iqn.2017-12.com.redhat.iscsi-gw:ceph-igw TPGT: 3 TSIH: 0]

Copy to Clipboard

Toggle word wrap

在此消息中，记录 ISID 号、TARGET 名称和 Target Portal Group Tag(TPGT)号。在本例中，有以下内容：

ISID: 00023d000005
TARGET: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
TPGT: 3

ISID: 00023d000005
TARGET: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
TPGT: 3

Copy to Clipboard

Toggle word wrap

示例

2022-05-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
iscsivmk_ConnRxNotifyFailure: vmhba64:CH:4 T:0 CN:0: Connection rx
notifying failure: Failed to Receive. State=Bound

2022-05-30T11:07:07.570Z cpu32:66506)iscsi_vmk:
iscsivmk_ConnRxNotifyFailure: vmhba64:CH:4 T:0 CN:0: Connection rx
notifying failure: Failed to Receive. State=Bound

Copy to Clipboard

Toggle word wrap

在此信息中记录适配器频道(CH)号。在本例中，有以下内容：

vmhba64:CH:4 T:0

vmhba64:CH:4 T:0

Copy to Clipboard

Toggle word wrap

查找 Ceph iSCSI 网关节点的远程地址：

[root@esx:~]# esxcli iscsi session connection list

[root@esx:~]# esxcli iscsi session connection list

Copy to Clipboard

Toggle word wrap

示例

...
vmhba64,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,00023d000003,0
   Adapter: vmhba64
   Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw 
   ISID: 00023d000003 
   CID: 0
   DataDigest: NONE
   HeaderDigest: NONE
   IFMarker: false
   IFMarkerInterval: 0
   MaxRecvDataSegmentLength: 131072
   MaxTransmitDataSegmentLength: 262144
   OFMarker: false
   OFMarkerInterval: 0
   ConnectionAddress: 10.2.132.2
   RemoteAddress: 10.2.132.2 
   LocalAddress: 10.2.128.77
   SessionCreateTime: 03/28/18 21:45:19
   ConnectionCreateTime: 03/28/18 21:45:19
   ConnectionStartTime: 03/28/18 21:45:19
   State: xpt_wait
...

...
vmhba64,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,00023d000003,0
   Adapter: vmhba64
   Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw


   ISID: 00023d000003


   CID: 0
   DataDigest: NONE
   HeaderDigest: NONE
   IFMarker: false
   IFMarkerInterval: 0
   MaxRecvDataSegmentLength: 131072
   MaxTransmitDataSegmentLength: 262144
   OFMarker: false
   OFMarkerInterval: 0
   ConnectionAddress: 10.2.132.2
   RemoteAddress: 10.2.132.2


   LocalAddress: 10.2.128.77
   SessionCreateTime: 03/28/18 21:45:19
   ConnectionCreateTime: 03/28/18 21:45:19
   ConnectionStartTime: 03/28/18 21:45:19
   State: xpt_wait
...

Copy to Clipboard

Toggle word wrap

从命令输出中，匹配 ISID 值和前面收集的 TARGET 名称值，然后记下 RemoteAddress 值。在这个示例中，有以下内容：

Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
ISID: 00023d000003
RemoteAddress: 10.2.132.2

Target: iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
ISID: 00023d000003
RemoteAddress: 10.2.132.2

Copy to Clipboard

Toggle word wrap

现在，您可以从 Ceph iSCSI 网关节点收集更多信息，以进一步排除此问题。

在 RemoteAddress 值提及的 Ceph iSCSI 网关节点上，运行 sosreport 来收集系统信息：
```
sosreport
```
```
[root@igw ~]# sosreport
```
Copy to Clipboard Toggle word wrap

查找进入死状态的磁盘：

[root@esx:~]# esxcli storage nmp device list

[root@esx:~]# esxcli storage nmp device list

Copy to Clipboard

Toggle word wrap

示例

...
iqn.1998-01.com.vmware:d04-nmgjd-pa-zyc-sv039-rh2288h-xnh-732d78fd-00023d000004,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,t,3-naa.60014054a5d46697f85498e9a257567c
   Runtime Name: vmhba64:C4:T0:L4 
   Device: naa.60014054a5d46697f85498e9a257567c 
   Device Display Name: LIO-ORG iSCSI Disk
(naa.60014054a5d46697f85498e9a257567c)
   Group State: dead 
   Array Priority: 0
   Storage Array Type Path Config:
{TPG_id=3,TPG_state=ANO,RTP_id=3,RTP_health=DOWN} 
   Path Selection Policy Path Config: {non-current path; rank: 0}
...

...
iqn.1998-01.com.vmware:d04-nmgjd-pa-zyc-sv039-rh2288h-xnh-732d78fd-00023d000004,iqn.2017-12.com.redhat.iscsi-gw:ceph-igw,t,3-naa.60014054a5d46697f85498e9a257567c
   Runtime Name: vmhba64:C4:T0:L4


   Device: naa.60014054a5d46697f85498e9a257567c


   Device Display Name: LIO-ORG iSCSI Disk
(naa.60014054a5d46697f85498e9a257567c)
   Group State: dead


   Array Priority: 0
   Storage Array Type Path Config:
{TPG_id=3,TPG_state=ANO,RTP_id=3,RTP_health=DOWN}


   Path Selection Policy Path Config: {non-current path; rank: 0}
...

Copy to Clipboard

Toggle word wrap

从命令输出中，与 CH 号和前面收集的 TPGT 编号匹配，然后记下 Device 值。在本例中，有以下内容：

vmhba64:C4:T0
Device: naa.60014054a5d46697f85498e9a257567c
TPG_id=3

vmhba64:C4:T0
Device: naa.60014054a5d46697f85498e9a257567c
TPG_id=3

Copy to Clipboard

Toggle word wrap

使用设备名称时，您可以收集处于 死 状态的每个 iSCSI 磁盘的一些附加信息。

收集 iSCSI 磁盘的更多信息：

语法

esxcli storage nmp path list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_nmp_path_list.txt
esxcli storage core device list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_core_device_list.txt

esxcli storage nmp path list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_nmp_path_list.txt
esxcli storage core device list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_core_device_list.txt

Copy to Clipboard

Toggle word wrap

示例

[root@esx:~]# esxcli storage nmp path list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_nmp_path_list.txt
[root@esx:~]# esxcli storage core device list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_core_device_list.txt

[root@esx:~]# esxcli storage nmp path list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_nmp_path_list.txt
[root@esx:~]# esxcli storage core device list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_core_device_list.txt

Copy to Clipboard

Toggle word wrap

收集 VMware ESXi 环境的其他信息：

[root@esx:~]# esxcli storage vmfs extent list > /tmp/esxcli_storage_vmfs_extent_list.txt
[root@esx:~]# esxcli storage filesystem list > /tmp/esxcli_storage_filesystem_list.txt
[root@esx:~]# esxcli iscsi session list > /tmp/esxcli_iscsi_session_list.txt
[root@esx:~]# esxcli iscsi session connection list > /tmp/esxcli_iscsi_session_connection_list.txt

[root@esx:~]# esxcli storage vmfs extent list > /tmp/esxcli_storage_vmfs_extent_list.txt
[root@esx:~]# esxcli storage filesystem list > /tmp/esxcli_storage_filesystem_list.txt
[root@esx:~]# esxcli iscsi session list > /tmp/esxcli_iscsi_session_list.txt
[root@esx:~]# esxcli iscsi session connection list > /tmp/esxcli_iscsi_session_connection_list.txt

Copy to Clipboard

Toggle word wrap

检查潜在的 iSCSI 登录问题：
- iSCSI 登录数据是否未发送？
- iSCSI 登录超时还是找不到门户组？

其它资源

请参阅红帽的知识库解决方案，了解如何为 Red Hat 全球支持服务创建 sosreport。
有关上传红帽全球支持服务的文件，请参阅红帽知识库解决方案。
如何在客户门户上创建红帽支持问题单？

在 iSCSI 网关节点上，您可能会在系统日志中看到通用的登录协商失败消息，默认为 /var/log/messages。

示例

Apr  2 23:17:05 osd1 kernel: rx_data returned 0, expecting 48.
Apr  2 23:17:05 osd1 kernel: iSCSI Login negotiation failed.

Apr  2 23:17:05 osd1 kernel: rx_data returned 0, expecting 48.
Apr  2 23:17:05 osd1 kernel: iSCSI Login negotiation failed.

Copy to Clipboard

Toggle word wrap

虽然系统处于此状态，但请按照此流程中的建议开始收集系统信息。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph iSCSI 网关，即 iSCSI 目标。
正在运行的 VMware ESXi 环境，即 iSCSI 启动器。
对 Ceph iSCSI 网关节点的 root 级别访问权限。
对 VMware ESXi 节点的根级别访问权限.

流程

启用附加日志记录：

echo "iscsi_target_mod +p" > /sys/kernel/debug/dynamic_debug/control
echo "target_core_mod +p" > /sys/kernel/debug/dynamic_debug/control

[root@igw ~]# echo "iscsi_target_mod +p" > /sys/kernel/debug/dynamic_debug/control
[root@igw ~]# echo "target_core_mod +p" > /sys/kernel/debug/dynamic_debug/control

Copy to Clipboard

Toggle word wrap

等待几分钟，以便额外的调试信息填充系统日志。

禁用附加日志：

echo "iscsi_target_mod -p" > /sys/kernel/debug/dynamic_debug/control
echo "target_core_mod -p" > /sys/kernel/debug/dynamic_debug/control

[root@igw ~]# echo "iscsi_target_mod -p" > /sys/kernel/debug/dynamic_debug/control
[root@igw ~]# echo "target_core_mod -p" > /sys/kernel/debug/dynamic_debug/control

Copy to Clipboard

Toggle word wrap

运行 sosreport 来收集系统信息：
```
sosreport
```
```
[root@igw ~]# sosreport
```
Copy to Clipboard Toggle word wrap
同时捕获 Ceph iSCSI 网关和 VMware ESXi 节点的网络流量：
语法
```
tcpdump -s0 -i NETWORK_INTERFACE -w OUTPUT_FILE_PATH
```
```
tcpdump -s0 -i NETWORK_INTERFACE -w OUTPUT_FILE_PATH
```
Copy to Clipboard Toggle word wrap
示例
```
tcpdump -s 0 -i eth0 -w /tmp/igw-eth0-tcpdump.pcap
```
```
[root@igw ~]# tcpdump -s 0 -i eth0 -w /tmp/igw-eth0-tcpdump.pcap
```
Copy to Clipboard Toggle word wrap
注意
查找端口 3260 上的流量。
1. 网络数据包捕获文件可能较大，因此在将任何文件上传到 Red Hat 全球支持服务前，压缩来自 iSCSI 目标和启动器的 tcpdump 输出：
  语法
  gzip OUTPUT_FILE_PATH
  
  Copy to Clipboard Toggle word wrap
  示例
  [root@igw ~]# gzip /tmp/igw-eth0-tcpdump.pcap
  
  Copy to Clipboard Toggle word wrap

收集 VMware ESXi 环境的其他信息：

[root@esx:~]# esxcli iscsi session list > /tmp/esxcli_iscsi_session_list.txt
[root@esx:~]# esxcli iscsi session connection list > /tmp/esxcli_iscsi_session_connection_list.txt

[root@esx:~]# esxcli iscsi session list > /tmp/esxcli_iscsi_session_list.txt
[root@esx:~]# esxcli iscsi session connection list > /tmp/esxcli_iscsi_session_connection_list.txt

Copy to Clipboard

Toggle word wrap

列出并收集每个 iSCSI 磁盘的更多信息：

语法

esxcli storage nmp path list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_nmp_path_list.txt

esxcli storage nmp path list -d ISCSI_DISK_DEVICE > /tmp/esxcli_storage_nmp_path_list.txt

Copy to Clipboard

Toggle word wrap

示例

[root@esx:~]# esxcli storage nmp device list
[root@esx:~]# esxcli storage nmp path list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_nmp_path_list.txt
[root@esx:~]# esxcli storage core device list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_core_device_list.txt

[root@esx:~]# esxcli storage nmp device list
[root@esx:~]# esxcli storage nmp path list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_nmp_path_list.txt
[root@esx:~]# esxcli storage core device list -d naa.60014054a5d46697f85498e9a257567c > /tmp/esxcli_storage_core_device_list.txt

Copy to Clipboard

Toggle word wrap

其它资源

请参阅红帽的知识库解决方案，了解如何为 Red Hat 全球支持服务创建 sosreport。
有关上传红帽全球支持服务的文件，请参阅红帽知识库解决方案。
如需更多信息，请参阅有关如何使用 tcpdump 捕获网络数据包的红帽知识库解决方案。
如何在客户门户上创建红帽支持问题单？

在 iSCSI 网关节点上，您可能会看到超时，或者无法在系统日志中找到目标门户组消息，默认为 /var/log/messages。

示例

Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260

Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260

Copy to Clipboard

Toggle word wrap

或

示例

Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw

Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw

Copy to Clipboard

Toggle word wrap

虽然系统处于此状态，但请按照此流程中的建议开始收集系统信息。

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph iSCSI 网关。
对 Ceph iSCSI 网关节点的 root 级别访问权限。

流程

启用等待任务转储，并将其写入文件中：

dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt

[root@igw ~]# dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt

Copy to Clipboard

Toggle word wrap

查看等待以下消息的任务列表：
- iscsit_tpg_disable_portal_group
- core_tmr_abort_task
- transport_generic_free_cmd
如果这些消息显示在等待的任务列表中，则表示 tcmu-runner 服务出现了某种错误。或许 tcmu-runner 服务没有正确重启，或者 tcmu-runner 服务已崩溃。
验证 tcmu-runner 服务是否正在运行：
```
systemctl status tcmu-runner
```
```
[root@igw ~]# systemctl status tcmu-runner
```
Copy to Clipboard Toggle word wrap
1. 如果 tcmu-runner 服务没有运行，在重启 tcmu-runner 服务前停止 rbd-target-gw 服务：
  [root@igw ~]# systemctl stop rbd-target-gw [root@igw ~]# systemctl stop tcmu-runner [root@igw ~]# systemctl start tcmu-runner [root@igw ~]# systemctl start rbd-target-gw
  Copy to Clipboard Toggle word wrap
  重要
  首先停止 Ceph iSCSI 网关可防止 IO 在 tcmu-runner 服务停机时卡住。
2. 如果 tcmu-runner 服务正在运行，这可能是一个新程序错误。创建一个新的红帽支持问题单。

其它资源

请参阅红帽的知识库解决方案，了解如何为 Red Hat 全球支持服务创建 sosreport。
有关上传红帽全球支持服务的文件，请参阅红帽知识库解决方案。
如何在客户门户上创建红帽支持问题单？

7.5. timeout 命令错误
复制链接

当 SCSI 命令在系统日志中失败时，Ceph iSCSI 网关可能会报告命令超时错误。

示例

Mar 23 20:03:14 igw tcmu-runner: 2018-03-23 20:03:14.052 2513 [ERROR] tcmu_rbd_handle_timedout_cmd:669 rbd/rbd.gw1lun011: Timing out cmd.

Mar 23 20:03:14 igw tcmu-runner: 2018-03-23 20:03:14.052 2513 [ERROR] tcmu_rbd_handle_timedout_cmd:669 rbd/rbd.gw1lun011: Timing out cmd.

Copy to Clipboard

Toggle word wrap

或

示例

Mar 23 20:03:14 igw tcmu-runner: tcmu_notify_conn_lost:176 rbd/rbd.gw1lun011: Handler connection lost (lock state 1)

Mar 23 20:03:14 igw tcmu-runner: tcmu_notify_conn_lost:176 rbd/rbd.gw1lun011: Handler connection lost (lock state 1)

Copy to Clipboard

Toggle word wrap

此 Means 是什么

其他阻塞的任务可能要等待处理，从而导致 SCSI 命令超时，因为未及时收到响应。这些错误消息的另一个原因可能与不健康的 Red Hat Ceph Storage 集群相关。

要排除这个问题，请执行以下操作

检查是否有可能在等待的任务中可能要处理一些事情。
检查 Red Hat Ceph Storage 集群的运行状况。
从路径中的每个设备从 Ceph iSCSI 网关节点到 iSCSI 启动器节点收集系统信息。

其它资源

如需关于如何查看等待任务的更多详细信息，请参阅 Red Hat Ceph Storage Troubleshooting Guide 中的 Checking iSCSI login failures because of a timeout or not able to find a portal group 部分。
有关检查 存储集群运行状况 的更多详细信息，请参阅红帽 Ceph 存储故障排除指南中 的诊断存储集群运行状况部分。
有关收集必要信息的更多详细信息，请参阅 Red Hat Ceph Storage Troubleshooting Guide 的 Gathering information for lost connections causing storage failures on VMware ESXi 一节。

7.6. Abort 任务错误
复制链接

Ceph iSCSI 网关可能会在系统日志中报告中止的任务错误。

示例

Apr  1 14:23:58 igw kernel: ABORT_TASK: Found referenced iSCSI task_tag: 1085531

Apr  1 14:23:58 igw kernel: ABORT_TASK: Found referenced iSCSI task_tag: 1085531

Copy to Clipboard

Toggle word wrap

此 Means 是什么

些其他网络中断（如交换机失败或端口错误）可能会导致这种类型的错误消息。另一个可能是不健康的 Red Hat Ceph Storage 集群。

要排除这个问题，请执行以下操作

检查环境中是否存在网络中断。
检查 Red Hat Ceph Storage 集群的运行状况。
从路径中的每个设备从 Ceph iSCSI 网关节点到 iSCSI 启动器节点收集系统信息。

其它资源

有关检查 存储集群运行状况 的更多详细信息，请参阅红帽 Ceph 存储故障排除指南中 的诊断存储集群运行状况部分。
有关收集必要信息的更多详细信息，请参阅 Red Hat Ceph Storage Troubleshooting Guide 的 Gathering information for lost connections causing storage failures on VMware ESXi 一节。

7.7. 其它资源
复制链接

有关 Ceph iSCSI 网关的详情，请参阅红帽 Ceph 存储块设备指南。
详情请查看第 3 章 网络问题故障排除。

第 8 章 Ceph 放置组故障排除
复制链接

本节介绍修复与 Ceph 放置组(PG)相关的最常见错误。

8.1. 先决条件
复制链接

验证您的网络连接。
确保 monitor 能够形成仲裁。
确保所有健康的 OSD 为 up 和 in，回填和恢复过程已完成。

8.2. 大多数常见的 Ceph 放置组错误
复制链接

下表列出了 ceph 健康详情 命令返回的最常见错误消息。这些表中提供了相应部分的链接，这些部分解释了错误并指向修复问题的特定程序。

另外，您可以列出处于非最佳状态的放置组。详情请查看第 8.3 节 “列出 PG 停留在 stale、inactive 或 unclean 状态”。

8.2.1. 先决条件
复制链接

一个正在运行的 Red Hat Ceph Storage 集群。
正在运行的 Ceph 对象网关.

8.2.2. 放置组错误消息
复制链接

常见放置组错误消息和可能的修复表。

Expand

错误消息	查看
`HEALTH_ERR`
`PGs down`	放置组 `停机`
`pgs inconsistent`	Inconsistent placement groups
`scrub errors`	Inconsistent placement groups
`HEALTH_WARN`
`pgs stale`	Stale placement groups
`unfound`	Unfound objects

8.2.3. Stale 放置组
复制链接

ceph health 命令将一些放置组(PG)列为 过时的 ：

HEALTH_WARN 24 pgs stale; 3/300 in osds are down

HEALTH_WARN 24 pgs stale; 3/300 in osds are down

Copy to Clipboard

Toggle word wrap

此 Means 是什么

当 PG 的 Primary OSD 未收到 PG 执行集的 Primary OSD 或其他 OSD 报告Primary OSD 已 停机 时，monitor 会将其标记为 stale。

通常，PG 在启动存储集群后，并在 peering 进程完成前进入 过时的 状态。但是，如果 PG 处于 stale 状态的时间超过预期，这可能表示这些 PG 的 Primary OSD 为 down 或未向 monitor 报告 PG 统计信息。当存储 过时 PG 的 Primary OSD 备份 后，Ceph 会开始恢复 PG。

mon_osd_report_timeout 设置确定 OSD 将 PG 统计数据报告到 monitor 的频率。默认情况下，此参数设置为 0.5，这表示 OSD 每隔半一次报告统计信息。

要排除这个问题，请执行以下操作

确定哪些 PG 是 过时的，以及它们存储在哪些 OSD 上。错误消息包括类似以下示例的信息：

示例

[ceph: root@host01 /]# ceph health detail
HEALTH_WARN 24 pgs stale; 3/300 in osds are down
...
pg 2.5 is stuck stale+active+remapped, last acting [2,0]
...
osd.10 is down since epoch 23, last address 192.168.106.220:6800/11080
osd.11 is down since epoch 13, last address 192.168.106.220:6803/11539
osd.12 is down since epoch 24, last address 192.168.106.220:6806/11861

[ceph: root@host01 /]# ceph health detail
HEALTH_WARN 24 pgs stale; 3/300 in osds are down
...
pg 2.5 is stuck stale+active+remapped, last acting [2,0]
...
osd.10 is down since epoch 23, last address 192.168.106.220:6800/11080
osd.11 is down since epoch 13, last address 192.168.106.220:6803/11539
osd.12 is down since epoch 24, last address 192.168.106.220:6806/11861

Copy to Clipboard

Toggle word wrap

对标记为 down 的 OSD 的任何问题进行故障排除。详情请参阅 关闭 OSD。

8.2.4. Inconsistent placement groups
复制链接

有些放置组被标记为 active + clean + 不一致，ceph 健康详情 会返回类似以下的错误消息：

HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

Copy to Clipboard

Toggle word wrap

此 Means 是什么

当 Ceph 检测到 PG 中一个或多个对象副本中的不一致时，它会将该 PG 标记为 inconsistent。最常见的不一致是：

对象的大小不正确。
恢复完成后，一个副本中的对象会丢失。

在大多数情况下，清理过程中的错误会导致 PG 中不一致。

要排除这个问题，请执行以下操作

确定哪个 PG 处于 不一致 状态：

[ceph: root@host01 /]# ceph health detail
HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

[ceph: root@host01 /]# ceph health detail
HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

Copy to Clipboard

Toggle word wrap

确定 PG 不一致 的原因。

在 PG 中启动深度清理过程：

语法

ceph pg deep-scrub ID

ceph pg deep-scrub ID

Copy to Clipboard

Toggle word wrap

使用 inconsistent 的 PG 的 ID 替换 ID，例如：

[ceph: root@host01 /]# ceph pg deep-scrub 0.6
instructing pg 0.6 on osd.0 to deep-scrub

[ceph: root@host01 /]# ceph pg deep-scrub 0.6
instructing pg 0.6 on osd.0 to deep-scrub

Copy to Clipboard

Toggle word wrap

搜索 ceph -w 的输出，以查找与该放置组相关的任何消息：

语法

ceph -w | grep ID

ceph -w | grep ID

Copy to Clipboard

Toggle word wrap

使用 inconsistent 的 PG 的 ID 替换 ID，例如：

[ceph: root@host01 /]# ceph -w | grep 0.6
2022-05-26 01:35:36.778215 osd.106 [ERR] 0.6 deep-scrub stat mismatch, got 636/635 objects, 0/0 clones, 0/0 dirty, 0/0 omap, 0/0 hit_set_archive, 0/0 whiteouts, 1855455/1854371 bytes.
2022-05-26 01:35:36.788334 osd.106 [ERR] 0.6 deep-scrub 1 errors

[ceph: root@host01 /]# ceph -w | grep 0.6
2022-05-26 01:35:36.778215 osd.106 [ERR] 0.6 deep-scrub stat mismatch, got 636/635 objects, 0/0 clones, 0/0 dirty, 0/0 omap, 0/0 hit_set_archive, 0/0 whiteouts, 1855455/1854371 bytes.
2022-05-26 01:35:36.788334 osd.106 [ERR] 0.6 deep-scrub 1 errors

Copy to Clipboard

Toggle word wrap

如果输出包含与以下类似的错误消息，您可以修复 不一致的 PG。详情请参阅 修复不一致的 PG。

语法

PG.ID shard OSD: soid OBJECT missing attr , missing attr _ATTRIBUTE_TYPE
PG.ID shard OSD: soid OBJECT digest 0 != known digest DIGEST, size 0 != known size SIZE
PG.ID shard OSD: soid OBJECT size 0 != known size SIZE
PG.ID deep-scrub stat mismatch, got MISMATCH
PG.ID shard OSD: soid OBJECT candidate had a read error, digest 0 != known digest DIGEST

PG.ID shard OSD: soid OBJECT missing attr , missing attr _ATTRIBUTE_TYPE
PG.ID shard OSD: soid OBJECT digest 0 != known digest DIGEST, size 0 != known size SIZE
PG.ID shard OSD: soid OBJECT size 0 != known size SIZE
PG.ID deep-scrub stat mismatch, got MISMATCH
PG.ID shard OSD: soid OBJECT candidate had a read error, digest 0 != known digest DIGEST

Copy to Clipboard

Toggle word wrap

如果输出包含与以下类似的错误消息，则无法安全地修复不一致的 PG，因为您可以丢失数据。在这种情况下创建一个支持问题单。有关详细信息，请参阅 联系红帽支持。

PG.ID shard OSD: soid OBJECT digest DIGEST != known digest DIGEST
PG.ID shard OSD: soid OBJECT omap_digest DIGEST != known omap_digest DIGEST

PG.ID shard OSD: soid OBJECT digest DIGEST != known digest DIGEST
PG.ID shard OSD: soid OBJECT omap_digest DIGEST != known omap_digest DIGEST

Copy to Clipboard

Toggle word wrap

8.2.5. unclean PG
复制链接

ceph health 命令返回类似如下的错误消息：

HEALTH_WARN 197 pgs stuck unclean

HEALTH_WARN 197 pgs stuck unclean

Copy to Clipboard

Toggle word wrap

此 Means 是什么

如果 PG 未在 Ceph 配置文件中的 mon_pg_stuck_threshold 参数中指定的秒数达到 active+clean 状态，则 Ceph 会将其标记为 unclean。mon_pg_stuck_threshold 的默认值为 300 秒。

如果 PG 不清除，它将包含没有复制 osd_pool_default_size 参数中指定的次数的对象。osd_pool_default_size 的默认值为 3，这意味着 Ceph 创建三个副本。

通常，unclean 放置组代表某些 OSD 可能处于 down。

要排除这个问题，请执行以下操作

确定哪些 OSD 已 停机 ：
```
[ceph: root@host01 /]# ceph osd tree
```
```
[ceph: root@host01 /]# ceph osd tree
```
Copy to Clipboard Toggle word wrap
对 OSD 进行故障排除和修复任何问题。详情请参阅关闭 OSD。

8.2.6. 不活跃的放置组
复制链接

ceph health 命令返回类似如下的错误消息：

HEALTH_WARN 197 pgs stuck inactive

HEALTH_WARN 197 pgs stuck inactive

Copy to Clipboard

Toggle word wrap

此 Means 是什么

如果 PG 在 Ceph 配置文件中的 mon_pg_stuck_threshold 参数中指定的秒数中未激活，Ceph 会将它标记为不活动。mon_pg_stuck_threshold 的默认值为 300 秒。

通常，inactive 放置组代表某些 OSD 可能处于 down。

要排除这个问题，请执行以下操作

确定哪些 OSD 已 停机 ：
```
ceph osd tree
```
```
# ceph osd tree
```
Copy to Clipboard Toggle word wrap
对 OSD 进行故障排除和修复任何问题。

其它资源

列出 PG 处于 stale inactive 或 unclean 状态
详情请参阅关闭 OSD。

8.2.7. 放置组停机
复制链接

ceph 运行状况详细信息 命令报告某些 PG 已 停机 ：

HEALTH_ERR 7 pgs degraded; 12 pgs down; 12 pgs peering; 1 pgs recovering; 6 pgs stuck unclean; 114/3300 degraded (3.455%); 1/3 in osds are down
...
pg 0.5 is down+peering
pg 1.4 is down+peering
...
osd.1 is down since epoch 69, last address 192.168.106.220:6801/8651

HEALTH_ERR 7 pgs degraded; 12 pgs down; 12 pgs peering; 1 pgs recovering; 6 pgs stuck unclean; 114/3300 degraded (3.455%); 1/3 in osds are down
...
pg 0.5 is down+peering
pg 1.4 is down+peering
...
osd.1 is down since epoch 69, last address 192.168.106.220:6801/8651

Copy to Clipboard

Toggle word wrap

此 Means 是什么

在某些情况下，peering 进程会被阻止，这会阻止放置组变得活跃且可用。通常，OSD 故障会导致对等故障。

要排除这个问题，请执行以下操作

确定什么阻塞了对等进程：

语法

ceph pg ID query

ceph pg ID query

Copy to Clipboard

Toggle word wrap

使用 缩减 的 PG 的 ID 替换 ID：

示例

[ceph: root@host01 /]#  ceph pg 0.5 query

{ "state": "down+peering",
  ...
  "recovery_state": [
       { "name": "Started\/Primary\/Peering\/GetInfo",
         "enter_time": "2021-08-06 14:40:16.169679",
         "requested_info_from": []},
       { "name": "Started\/Primary\/Peering",
         "enter_time": "2021-08-06 14:40:16.169659",
         "probing_osds": [
               0,
               1],
         "blocked": "peering is blocked due to down osds",
         "down_osds_we_would_probe": [
               1],
         "peering_blocked_by": [
               { "osd": 1,
                 "current_lost_at": 0,
                 "comment": "starting or marking this osd lost may let us proceed"}]},
       { "name": "Started",
         "enter_time": "2021-08-06 14:40:16.169513"}
   ]
}

[ceph: root@host01 /]#  ceph pg 0.5 query

{ "state": "down+peering",
  ...
  "recovery_state": [
       { "name": "Started\/Primary\/Peering\/GetInfo",
         "enter_time": "2021-08-06 14:40:16.169679",
         "requested_info_from": []},
       { "name": "Started\/Primary\/Peering",
         "enter_time": "2021-08-06 14:40:16.169659",
         "probing_osds": [
               0,
               1],
         "blocked": "peering is blocked due to down osds",
         "down_osds_we_would_probe": [
               1],
         "peering_blocked_by": [
               { "osd": 1,
                 "current_lost_at": 0,
                 "comment": "starting or marking this osd lost may let us proceed"}]},
       { "name": "Started",
         "enter_time": "2021-08-06 14:40:16.169513"}
   ]
}

Copy to Clipboard

Toggle word wrap

recovery_state 部分包括了为什么对等进程被阻断的信息。

如果输出中包含 peering，因为 down osds 错误消息而被阻断，请参见 Down OSD。
如果您看到任何其他错误消息，请打开支持票据。有关详细信息，请参阅 联系红帽支持服务。

8.2.8. Unfound objects
复制链接

ceph health 命令返回类似如下的错误消息，其中包含 unfound 关键字：

HEALTH_WARN 1 pgs degraded; 78/3778 unfound (2.065%)

HEALTH_WARN 1 pgs degraded; 78/3778 unfound (2.065%)

Copy to Clipboard

Toggle word wrap

此 Means 是什么

当知道这些对象或它们的较新副本存在但无法找到它们时，Ceph 会将其标记为 unfound。因此，Ceph 无法恢复这样的对象，并继续恢复过程。

Situation 示例

PG 将数据存储在 osd.1 和 osd.2 上。

OSD.1 停机.
OSD.2 处理一些写入操作。
OSD.1 启动。
osd.1 和 osd .2 启动之间的对等进程启动，并且 osd.1 上缺少的对象排队以进行恢复。
在 Ceph 复制新对象之前，osd.2 中断。

因此，osd.1 知道这些对象存在，但没有 OSD 具有对象的副本。

在这种情景中，Ceph 正在等待故障节点再次访问，而 未找到的对象 则阻止恢复过程。

要排除这个问题，请执行以下操作

确定哪个放置组包含 unfound 对象：

[ceph: root@host01 /]# ceph health detail
HEALTH_WARN 1 pgs recovering; 1 pgs stuck unclean; recovery 5/937611 objects degraded (0.001%); 1/312537 unfound (0.000%)
pg 3.8a5 is stuck unclean for 803946.712780, current state active+recovering, last acting [320,248,0]
pg 3.8a5 is active+recovering, acting [320,248,0], 1 unfound
recovery 5/937611 objects degraded (0.001%); **1/312537 unfound (0.000%)**

[ceph: root@host01 /]# ceph health detail
HEALTH_WARN 1 pgs recovering; 1 pgs stuck unclean; recovery 5/937611 objects degraded (0.001%); 1/312537 unfound (0.000%)
pg 3.8a5 is stuck unclean for 803946.712780, current state active+recovering, last acting [320,248,0]
pg 3.8a5 is active+recovering, acting [320,248,0], 1 unfound
recovery 5/937611 objects degraded (0.001%); **1/312537 unfound (0.000%)**

Copy to Clipboard

Toggle word wrap

列出有关 PG 的更多信息：

语法

ceph pg ID query

ceph pg ID query

Copy to Clipboard

Toggle word wrap

使用包含 unfound 对象的 PG 的 ID 替换 ID：

示例

[ceph: root@host01 /]# ceph pg 3.8a5 query
{ "state": "active+recovering",
  "epoch": 10741,
  "up": [
        320,
        248,
        0],
  "acting": [
        320,
        248,
        0],
<snip>
  "recovery_state": [
        { "name": "Started\/Primary\/Active",
          "enter_time": "2021-08-28 19:30:12.058136",
          "might_have_unfound": [
                { "osd": "0",
                  "status": "already probed"},
                { "osd": "248",
                  "status": "already probed"},
                { "osd": "301",
                  "status": "already probed"},
                { "osd": "362",
                  "status": "already probed"},
                { "osd": "395",
                  "status": "already probed"},
                { "osd": "429",
                  "status": "osd is down"}],
          "recovery_progress": { "backfill_targets": [],
              "waiting_on_backfill": [],
              "last_backfill_started": "0\/\/0\/\/-1",
              "backfill_info": { "begin": "0\/\/0\/\/-1",
                  "end": "0\/\/0\/\/-1",
                  "objects": []},
              "peer_backfill_info": [],
              "backfills_in_flight": [],
              "recovering": [],
              "pg_backend": { "pull_from_peer": [],
                  "pushing": []}},
          "scrub": { "scrubber.epoch_start": "0",
              "scrubber.active": 0,
              "scrubber.block_writes": 0,
              "scrubber.finalizing": 0,
              "scrubber.waiting_on": 0,
              "scrubber.waiting_on_whom": []}},
        { "name": "Started",
          "enter_time": "2021-08-28 19:30:11.044020"}],

[ceph: root@host01 /]# ceph pg 3.8a5 query
{ "state": "active+recovering",
  "epoch": 10741,
  "up": [
        320,
        248,
        0],
  "acting": [
        320,
        248,
        0],
<snip>
  "recovery_state": [
        { "name": "Started\/Primary\/Active",
          "enter_time": "2021-08-28 19:30:12.058136",
          "might_have_unfound": [
                { "osd": "0",
                  "status": "already probed"},
                { "osd": "248",
                  "status": "already probed"},
                { "osd": "301",
                  "status": "already probed"},
                { "osd": "362",
                  "status": "already probed"},
                { "osd": "395",
                  "status": "already probed"},
                { "osd": "429",
                  "status": "osd is down"}],
          "recovery_progress": { "backfill_targets": [],
              "waiting_on_backfill": [],
              "last_backfill_started": "0\/\/0\/\/-1",
              "backfill_info": { "begin": "0\/\/0\/\/-1",
                  "end": "0\/\/0\/\/-1",
                  "objects": []},
              "peer_backfill_info": [],
              "backfills_in_flight": [],
              "recovering": [],
              "pg_backend": { "pull_from_peer": [],
                  "pushing": []}},
          "scrub": { "scrubber.epoch_start": "0",
              "scrubber.active": 0,
              "scrubber.block_writes": 0,
              "scrubber.finalizing": 0,
              "scrubber.waiting_on": 0,
              "scrubber.waiting_on_whom": []}},
        { "name": "Started",
          "enter_time": "2021-08-28 19:30:11.044020"}],

Copy to Clipboard

Toggle word wrap

may _have_unfound 部分包括 Ceph 尝试定位 未找到对象的 OSD：

已探测到 的状态表示 Ceph 无法找到 该 OSD 中的未找到对象。
osd is down 状态表示 Ceph 无法联系该 OSD。

对标记为 down 的 OSD 进行故障排除。详情请参阅关闭 OSD。
如果您无法修复导致 OSD 停机 的问题，请打开支持票据。有关 详细信息，请参阅联系红帽支持团队。

8.3. 列出 PG 停留在 stale、inactive 或 unclean 状态
复制链接

失败后，PG 会进入 降级 或 peering 等状态。这个状态表示故障恢复过程的正常进度。

但是，如果 PG 处于这些状态之一的时间比预期长，则可能代表更大的问题。监控器报告当放置组处于不最佳状态。

Ceph 配置文件中的 mon_pg_stuck_threshold 选项决定了 PG 在多少秒之后被视为 不活动、未 清理 或 过时。

下表列出了这些状态及简短的说明：

Expand

状态	它的含义	大多数常见原因	查看
`Inactive`	PG 尚未能够服务读/写请求。	对等问题	不活跃的放置组
`unclean`	PG 包含的对象不会复制所需的次数。些情况阻止 PG 恢复。	`unfound` 对象 OSD 已 `停机` 配置不正确	unclean PG
`stale`	`ceph-osd` 守护进程尚未更新 PG 的状态。	OSD 已 `停机`	Stale 放置组

先决条件

一个正在运行的 Red Hat Ceph Storage 集群。
节点的根级别访问权限。

流程

登录到 Cephadm shell：
示例
```
cephadm shell
```
```
[root@host01 ~]# cephadm shell
```
Copy to Clipboard Toggle word wrap

列出卡住 PG：

示例

[ceph: root@host01 /]# ceph pg dump_stuck inactive
[ceph: root@host01 /]# ceph pg dump_stuck unclean
[ceph: root@host01 /]# ceph pg dump_stuck stale

[ceph: root@host01 /]# ceph pg dump_stuck inactive
[ceph: root@host01 /]# ceph pg dump_stuck unclean
[ceph: root@host01 /]# ceph pg dump_stuck stale

Copy to Clipboard

Toggle word wrap

8.4. 列出放置组不一致
复制链接

使用 rados 实用程序列出对象副本中的不一致。使用 --format=json-pretty 选项列出更详细的输出。

本节涵盖以下列表：

池中 PG 不一致
放置组中的对象不一致
PG 中的快照设置不一致

先决条件

正在运行的红帽 Ceph 存储集群处于健康状态。
节点的根级别访问权限。

流程

列出池中所有不一致的放置组：

语法

rados list-inconsistent-pg POOL --format=json-pretty

rados list-inconsistent-pg POOL --format=json-pretty

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# rados list-inconsistent-pg data --format=json-pretty
[0.6]

[ceph: root@host01 /]# rados list-inconsistent-pg data --format=json-pretty
[0.6]

Copy to Clipboard

Toggle word wrap

使用 ID 列出 PG 中不一致的对象：

语法

rados list-inconsistent-obj PLACEMENT_GROUP_ID

rados list-inconsistent-obj PLACEMENT_GROUP_ID

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# rados list-inconsistent-obj 0.6
{
    "epoch": 14,
    "inconsistents": [
        {
            "object": {
                "name": "image1",
                "nspace": "",
                "locator": "",
                "snap": "head",
                "version": 1
            },
            "errors": [
                "data_digest_mismatch",
                "size_mismatch"
            ],
            "union_shard_errors": [
                "data_digest_mismatch_oi",
                "size_mismatch_oi"
            ],
            "selected_object_info": "0:602f83fe:::foo:head(16'1 client.4110.0:1 dirty|data_digest|omap_digest s 968 uv 1 dd e978e67f od ffffffff alloc_hint [0 0 0])",
            "shards": [
                {
                    "osd": 0,
                    "errors": [],
                    "size": 968,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xe978e67f"
                },
                {
                    "osd": 1,
                    "errors": [],
                    "size": 968,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xe978e67f"
                },
                {
                    "osd": 2,
                    "errors": [
                        "data_digest_mismatch_oi",
                        "size_mismatch_oi"
                    ],
                    "size": 0,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xffffffff"
                }
            ]
        }
    ]
}

[ceph: root@host01 /]# rados list-inconsistent-obj 0.6
{
    "epoch": 14,
    "inconsistents": [
        {
            "object": {
                "name": "image1",
                "nspace": "",
                "locator": "",
                "snap": "head",
                "version": 1
            },
            "errors": [
                "data_digest_mismatch",
                "size_mismatch"
            ],
            "union_shard_errors": [
                "data_digest_mismatch_oi",
                "size_mismatch_oi"
            ],
            "selected_object_info": "0:602f83fe:::foo:head(16'1 client.4110.0:1 dirty|data_digest|omap_digest s 968 uv 1 dd e978e67f od ffffffff alloc_hint [0 0 0])",
            "shards": [
                {
                    "osd": 0,
                    "errors": [],
                    "size": 968,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xe978e67f"
                },
                {
                    "osd": 1,
                    "errors": [],
                    "size": 968,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xe978e67f"
                },
                {
                    "osd": 2,
                    "errors": [
                        "data_digest_mismatch_oi",
                        "size_mismatch_oi"
                    ],
                    "size": 0,
                    "omap_digest": "0xffffffff",
                    "data_digest": "0xffffffff"
                }
            ]
        }
    ]
}

Copy to Clipboard

Toggle word wrap

以下字段对于决定造成不一致的原因非常重要：

name：副本不一致的对象名称。
nspace：池逻辑分割的命名空间。默认情况下是空的。
locator ：这个键用于放置的替代对象名称。
snap ：对象的快照 ID。对象的唯一可写版本被称为 head。如果对象是克隆，则此字段包含其顺序 ID。
Version ：副本不一致的对象的版本 ID。每个对象写入操作都会递增它。
错误 ：显示分片之间不一致的错误列表，但不决定哪个分片或分片不正确。请参阅 shard 数组以进一步调查错误。
- data_digest_mismatch ：从一个 OSD 读取的副本摘要与其他 OSD 不同。
- size_mismatch ：克隆的大小或 头 对象与预期不匹配。
- read_error ：此错误表示磁盘错误很有可能导致不一致。
union_shard_error ：所有特定于分片的错误的并集。这些错误连接到有故障的分片。以 oi 结尾的错误表示您必须将故障对象中的信息与选定对象的信息进行比较。请参阅 shard 数组以进一步调查错误。
在上例中，存储在 osd.2 上的对象副本的摘要与 osd.0 和 osd.1 上存储的副本不同。具体来说，副本摘要不是从 osd.2 读取的分片中计算的 0xffffffff，而是 0xe978e67f。此外，从 osd.2 读取的副本大小为 0，由 osd.0 和 osd.1 报告的大小为 968。

列出快照集不一致：

语法

rados list-inconsistent-snapset PLACEMENT_GROUP_ID

rados list-inconsistent-snapset PLACEMENT_GROUP_ID

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# rados list-inconsistent-snapset 0.23 --format=json-pretty
{
    "epoch": 64,
    "inconsistents": [
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "0x00000001",
            "headless": true
        },
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "0x00000002",
            "headless": true
        },
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "head",
            "ss_attr_missing": true,
            "extra_clones": true,
            "extra clones": [
                2,
                1
            ]
        }
    ]

[ceph: root@host01 /]# rados list-inconsistent-snapset 0.23 --format=json-pretty
{
    "epoch": 64,
    "inconsistents": [
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "0x00000001",
            "headless": true
        },
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "0x00000002",
            "headless": true
        },
        {
            "name": "obj5",
            "nspace": "",
            "locator": "",
            "snap": "head",
            "ss_attr_missing": true,
            "extra_clones": true,
            "extra clones": [
                2,
                1
            ]
        }
    ]

Copy to Clipboard

Toggle word wrap

该命令返回以下错误：

ss_attr_missing ：缺少一个或多个属性。属性是关于作为键值对列表编码到快照集的快照的信息。
ss_attr_corrupted ：一个或多个属性无法解码。
clone_missing ：缺少克隆。
snapset_mismatch ：快照集本身不一致。
head_mismatch ：快照集表示 head 存在或不存在，但清理结果报告其他。
无 标头：缺少快照集 的头部。
size_mismatch ：克隆的大小或 头 对象与预期不匹配。

8.5. 修复不一致的放置组
复制链接

由于深度清理过程中出现错误，一些 PG 可以包含不一致的情况。Ceph 将这样的放置组报告为 不一致 ：

HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

HEALTH_ERR 1 pgs inconsistent; 2 scrub errors
pg 0.6 is active+clean+inconsistent, acting [0,1,2]
2 scrub errors

Copy to Clipboard

Toggle word wrap

警告

您只能修复某些不一致的问题。

如果 Ceph 日志包括以下错误，则不要修复 PG：

_PG_._ID_ shard _OSD_: soid _OBJECT_ digest _DIGEST_ != known digest _DIGEST_
_PG_._ID_ shard _OSD_: soid _OBJECT_ omap_digest _DIGEST_ != known omap_digest _DIGEST_

_PG_._ID_ shard _OSD_: soid _OBJECT_ digest _DIGEST_ != known digest _DIGEST_
_PG_._ID_ shard _OSD_: soid _OBJECT_ omap_digest _DIGEST_ != known omap_digest _DIGEST_

Copy to Clipboard

Toggle word wrap

相反，打开支持问题单。有关 详细信息，请参阅联系红帽支持团队。

先决条件

Ceph 监控节点的根级别访问权限.

流程

修复 不一致的 PG：
语法
```
ceph pg repair ID
```
```
ceph pg repair ID
```
Copy to Clipboard Toggle word wrap
使用 不一致的 PG 的 ID 替换 ID。

8.6. 增加放置组
复制链接

放置组(PG)计数不足，会影响 Ceph 集群和数据分布的性能。它是 nearfull osds 错误消息的主要原因之一。

建议比率为每个 OSD 100 到 300 个 PG。当您向集群添加更多 OSD 时，这个比率可能会降低。

The pg_num 和 pgp_num 参数决定了 PG 数。这些参数为每个池配置，因此您必须单独调整每个池的 PG 数较低。

重要

增加 PG 数量是您可以在 Ceph 集群上执行的一个最密集型进程。如果没有以缓慢和方法方式执行，这个过程可能会对性能有严重影响。旦您提高 pgp_num，您将无法停止或颠倒此进程，您必须完成该过程。考虑在业务关键处理时间分配之外增加 PG 数量，并提醒所有客户端可能会对性能造成影响。如果集群处于 HEALTH_ERR 状态，则不要更改 PG 计数。

先决条件

正在运行的红帽 Ceph 存储集群处于健康状态。
节点的根级别访问权限。

流程

减少数据重新发布和恢复对单个 OSD 和 OSD 主机的影响：

降低 osd max backfills、osd_recovery_max_active 和 osd_recovery_op_priority 参数的值：

[ceph: root@host01 /]# ceph tell osd.* injectargs '--osd_max_backfills 1 --osd_recovery_max_active 1 --osd_recovery_op_priority 1'

[ceph: root@host01 /]# ceph tell osd.* injectargs '--osd_max_backfills 1 --osd_recovery_max_active 1 --osd_recovery_op_priority 1'

Copy to Clipboard

Toggle word wrap

禁用浅刮除和深度刮除：

[ceph: root@host01 /]# ceph osd set noscrub
[ceph: root@host01 /]# ceph osd set nodeep-scrub

[ceph: root@host01 /]# ceph osd set noscrub
[ceph: root@host01 /]# ceph osd set nodeep-scrub

Copy to Clipboard

Toggle word wrap

使用 Ceph Placement Groups (PGs) per Pool Calculator 来计算 pg_num 和 pgp_num 参数的最佳值。
以较小增量增加 pg_num 值，直到您达到所需的值。
1. 确定启动递增值。使用一个非常低的值（2 的指数），并在您确定对集群的影响时增加这个值。最佳的值取决于池大小、OSD 数和客户端 I/O 负载。
2. 递增 pg_num 值：
  语法
  ceph osd pool set POOL pg_num VALUE
  
  Copy to Clipboard Toggle word wrap
  指定池名称和新值，例如：
  示例
  [ceph: root@host01 /]# ceph osd pool set data pg_num 4
  
  Copy to Clipboard Toggle word wrap
3. 监控集群的状态：
  示例
  [ceph: root@host01 /]# ceph -s
  
  Copy to Clipboard Toggle word wrap
  PGs 状态将从 creating 更改为 active+clean。等待所有 PG 都处于 active+clean 状态。
以小增量增加 pgp_num 值，直到您达到所需的值：
1. 确定启动递增值。使用一个非常低的值（2 的指数），并在您确定对集群的影响时增加这个值。最佳的值取决于池大小、OSD 数和客户端 I/O 负载。
2. 递增 pgp_num 值：
  语法
  ceph osd pool set POOL pgp_num VALUE
  
  Copy to Clipboard Toggle word wrap
  指定池名称和新值，例如：
  [ceph: root@host01 /]# ceph osd pool set data pgp_num 4
  Copy to Clipboard Toggle word wrap
3. 监控集群的状态：
  [ceph: root@host01 /]# ceph -s
  Copy to Clipboard Toggle word wrap
  PGs 状态将通过 peering、wait_backfill、回填、恢复 等来改变。等待所有 PG 都处于 active+clean 状态。
对 PG 数量不足的所有池重复上述步骤。

将 osd max backfills、osd_recovery_max_active 和 osd_recovery_op_priority 设置为默认值：

[ceph: root@host01 /]# ceph tell osd.* injectargs '--osd_max_backfills 1 --osd_recovery_max_active 3 --osd_recovery_op_priority 3'

[ceph: root@host01 /]# ceph tell osd.* injectargs '--osd_max_backfills 1 --osd_recovery_max_active 3 --osd_recovery_op_priority 3'

Copy to Clipboard

Toggle word wrap

启用浅刮除和深度刮除：

[ceph: root@host01 /]# ceph osd unset noscrub
[ceph: root@host01 /]# ceph osd unset nodeep-scrub

[ceph: root@host01 /]# ceph osd unset noscrub
[ceph: root@host01 /]# ceph osd unset nodeep-scrub

Copy to Clipboard

Toggle word wrap

8.7. 其它资源
复制链接

详情请查看第 3 章 网络问题故障排除。
有关对 Ceph 监控器最常见的错误进行故障排除的详细信息，请参阅第 4 章 Ceph 监控器故障排除。
如需有关对 Ceph OSD 相关的最常见错误进行故障排除的详细信息，请参阅第 5 章 Ceph OSD 故障排除。
如需有关 PG 自动扩展器的更多信息，请参阅 Red Hat Ceph Storage 策略指南中的 自动扩展放置组 部分。

第 9 章 Ceph 对象故障排除
复制链接

作为存储管理员，您可以使用 ceph-objectstore-tool 实用程序执行高级别或低级对象操作。ceph-objectstore-tool 实用程序可帮助您对特定 OSD 或 PG 中对象相关的问题进行故障排除。

重要

操作对象可能会导致无法恢复的数据丢失。在使用 ceph-objectstore-tool 实用程序前，请联络红帽支持。

9.1. 先决条件
复制链接

验证没有与网络相关的问题。

9.2. 高级对象操作故障排除
复制链接

作为存储管理员，您可以使用 ceph-objectstore-tool 实用程序来执行高级别对象操作。ceph-objectstore-tool 实用程序支持以下高级对象操作：

列出对象
列出丢失的对象
修复丢失的对象

重要

操作对象可能会导致无法恢复的数据丢失。在使用 ceph-objectstore-tool 实用程序前，请联络红帽支持。

9.2.1. 先决条件
复制链接

对 Ceph OSD 节点的根级别访问权限.

9.2.2. 列出对象
复制链接

OSD 可以包含零个到多个 PG 的 PG，对放置组(PG)中的多个对象包含零。ceph-objectstore-tool 实用程序允许您列出 OSD 中存储的对象。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-FSID@osd.OSD_ID

systemctl status ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

识别 OSD 内的所有对象，而不考虑 PG:

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --op list

ceph-objectstore-tool --data-path PATH_TO_OSD --op list

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op list

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op list

Copy to Clipboard

Toggle word wrap

识别 PG 中的所有对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID --op list

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID --op list

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c --op list

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c --op list

Copy to Clipboard

Toggle word wrap

识别对象所属的 PG：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --op list OBJECT_ID

ceph-objectstore-tool --data-path PATH_TO_OSD --op list OBJECT_ID

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op list default.region

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op list default.region

Copy to Clipboard

Toggle word wrap

9.2.3. 修复丢失的对象
复制链接

您可以使用 ceph-objectstore-tool 实用程序列出和修复 Ceph OSD 中存储的、未找到 的对象。这个过程只适用于旧对象。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-FSID@osd.OSD_ID

systemctl status ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

列出所有丢失的旧对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost --dry-run

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost --dry-run

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost --dry-run

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost --dry-run

Copy to Clipboard

Toggle word wrap

使用 ceph-objectstore-tool 实用程序修复 丢失和未找到 的对象。选择适当的情况：

修复所有丢失的对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost

Copy to Clipboard

Toggle word wrap

修复 PG 中丢失的所有对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID --op fix-lost

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID --op fix-lost

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c --op fix-lost

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c --op fix-lost

Copy to Clipboard

Toggle word wrap

使用标识符修复丢失的对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost OBJECT_ID

ceph-objectstore-tool --data-path PATH_TO_OSD --op fix-lost OBJECT_ID

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost default.region

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --op fix-lost default.region

Copy to Clipboard

Toggle word wrap

9.3. 低级对象操作故障排除
复制链接

作为存储管理员，您可以使用 ceph-objectstore-tool 实用程序来执行低级对象操作。ceph-objectstore-tool 实用程序支持以下低级别对象操作：

操作对象的内容
删除对象
列出对象映射(OMAP)
处理 OMAP 标头
操作 OMAP 密钥
列出对象的属性
操作对象的属性键

重要

操作对象可能会导致无法恢复的数据丢失。在使用 ceph-objectstore-tool 实用程序前，请联络红帽支持。

9.3.1. 先决条件
复制链接

对 Ceph OSD 节点的根级别访问权限.

9.3.2. 操作对象的内容
复制链接

使用 ceph-objectstore-tool 实用程序时，您可以在对象上获取或设置字节。

重要

在对象上设置字节可能会导致无法恢复的数据丢失。要防止数据丢失，请为对象制作备份副本。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-osd@OSD_ID

systemctl status ceph-osd@OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

通过列出 OSD 或 PG(PG)的对象来查找对象。
登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

在对象中设置字节前，请进行备份和对象的工作副本：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
get-bytes > OBJECT_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
get-bytes > OBJECT_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-bytes > zone_info.default.backup

[ceph: root@host01 /]#  ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-bytes > zone_info.default.working-copy

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-bytes > zone_info.default.backup

[ceph: root@host01 /]#  ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-bytes > zone_info.default.working-copy

Copy to Clipboard

Toggle word wrap

编辑工作复制对象文件，并相应地修改对象内容。

设置对象的字节：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
set-bytes < OBJECT_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
set-bytes < OBJECT_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
set-bytes < zone_info.default.working-copy

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
set-bytes < zone_info.default.working-copy

Copy to Clipboard

Toggle word wrap

9.3.3. 删除对象
复制链接

使用 ceph-objectstore-tool 实用程序删除对象。通过移除对象，其内容和引用将从放置组(PG)中删除。

重要

对象被删除后，您就无法重新创建对象。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

删除对象：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
remove

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
remove

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
remove

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
remove

Copy to Clipboard

Toggle word wrap

9.3.4. 列出对象映射
复制链接

使用 ceph-objectstore-tool 实用程序列出对象映射(OMAP)的内容。输出为您提供了键列表。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

systemctl status ceph-osd@OSD_ID

systemctl status ceph-osd@OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

列出对象映射：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
list-omap

ceph-objectstore-tool --data-path PATH_TO_OSD --pgid PG_ID \
OBJECT \
list-omap

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
list-omap

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 --pgid 0.1c \
'{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
list-omap

Copy to Clipboard

Toggle word wrap

9.3.5. 操作对象映射标头
复制链接

ceph-objectstore-tool 实用程序输出对象映射(OMAP)标头与对象的密钥关联的值。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-FSID@osd.OSD_ID

systemctl status ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

获取对象映射标头：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omaphdr > OBJECT_MAP_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omaphdr > OBJECT_MAP_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-omaphdr > zone_info.default.omaphdr.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-omaphdr > zone_info.default.omaphdr.txt

Copy to Clipboard

Toggle word wrap

设置对象映射标头：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omaphdr < OBJECT_MAP_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omaphdr < OBJECT_MAP_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
set-omaphdr < zone_info.default.omaphdr.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
set-omaphdr < zone_info.default.omaphdr.txt

Copy to Clipboard

Toggle word wrap

9.3.6. 操作对象映射密钥
复制链接

使用 ceph-objectstore-tool 实用程序更改对象映射(OMAP)密钥。您需要提供数据路径、放置组标识符(PG ID)、对象和 OMAP 中的密钥。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

获取对象映射键：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omap KEY > OBJECT_MAP_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-omap KEY > OBJECT_MAP_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-omap "" > zone_info.default.omap.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
get-omap "" > zone_info.default.omap.txt

Copy to Clipboard

Toggle word wrap

设置对象映射键：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
set-omap KEY < OBJECT_MAP_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
set-omap KEY < OBJECT_MAP_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
set-omap "" < zone_info.default.omap.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
set-omap "" < zone_info.default.omap.txt

Copy to Clipboard

Toggle word wrap

删除对象映射键：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
rm-omap KEY

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
rm-omap KEY

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
rm-omap ""

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}'  \
rm-omap ""

Copy to Clipboard

Toggle word wrap

9.3.7. 列出对象的属性
复制链接

使用 ceph-objectstore-tool 实用程序列出对象的属性。输出为您提供对象的键和值。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程.

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-FSID@osd.OSD_ID

systemctl status ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

列出对象的属性：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
list-attrs

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
list-attrs

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
list-attrs

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
list-attrs

Copy to Clipboard

Toggle word wrap

9.3.8. 操作对象属性键
复制链接

使用 ceph-objectstore-tool 实用程序更改对象的属性。要操作对象的属性，您需要数据路径、放置组标识符(PG ID)、对象和对象属性中的键。

先决条件

Ceph OSD 节点的根级别访问权限.
停止 ceph-osd 守护进程。

流程

验证适当的 OSD 是否停机：

语法

systemctl status ceph-FSID@osd.OSD_ID

systemctl status ceph-FSID@osd.OSD_ID

Copy to Clipboard

Toggle word wrap

示例

systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

[root@host01 ~]# systemctl status ceph-b404c440-9e4c-11ec-a28a-001a4a0001df@osd.0.service

Copy to Clipboard

Toggle word wrap

登录到 OSD 容器：
语法
```
cephadm shell --name osd.OSD_ID
```
```
cephadm shell --name osd.OSD_ID
```
Copy to Clipboard Toggle word wrap
示例
```
cephadm shell --name osd.0
```
```
[root@host01 ~]# cephadm shell --name osd.0
```
Copy to Clipboard Toggle word wrap

获取对象的属性：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-attr KEY > OBJECT_ATTRS_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
get-attr KEY > OBJECT_ATTRS_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
get-attr "oid" > zone_info.default.attr.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
get-attr "oid" > zone_info.default.attr.txt

Copy to Clipboard

Toggle word wrap

设置对象的属性：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
set-attr KEY < OBJECT_ATTRS_FILE_NAME

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT \
set-attr KEY < OBJECT_ATTRS_FILE_NAME

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
set-attr "oid" < zone_info.default.attr.txt

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
set-attr "oid" < zone_info.default.attr.txt

Copy to Clipboard

Toggle word wrap

删除对象的属性：

语法

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT  \
rm-attr KEY

ceph-objectstore-tool --data-path PATH_TO_OSD \
--pgid PG_ID OBJECT  \
rm-attr KEY

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
rm-attr "oid"

[ceph: root@host01 /]# ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-0 \
--pgid 0.1c '{"oid":"zone_info.default","key":"","snapid":-2,"hash":235010478,"max":0,"pool":11,"namespace":""}' \
rm-attr "oid"

Copy to Clipboard

Toggle word wrap

9.4. 其它资源
复制链接

有关 Red Hat Ceph Storage 支持，请参阅红帽客户门户网站。

第 10 章对处于扩展模式的集群进行故障排除
复制链接

您可以替换并删除失败的 tiebreaker 监视器。如果需要，您还可以将集群强制到恢复或健康模式。

10.1. 将 tiebreaker 替换为仲裁中的 monitor
复制链接

如果您的 tiebreaker 监控器失败，您可以将其替换为仲裁中的现有监控器，并将其从集群中移除。

先决条件

正在运行的 Red Hat Ceph Storage 集群
在集群中启用了扩展模式

流程

禁用自动监控器部署：

示例

[ceph: root@host01 /]# ceph orch apply mon --unmanaged

Scheduled mon update…

[ceph: root@host01 /]# ceph orch apply mon --unmanaged

Scheduled mon update…

Copy to Clipboard

Toggle word wrap

查看仲裁中的监控器：

示例

[ceph: root@host01 /]# ceph -s

mon: 5 daemons, quorum host01, host02, host04, host05 (age 30s), out of quorum: host07

[ceph: root@host01 /]# ceph -s

mon: 5 daemons, quorum host01, host02, host04, host05 (age 30s), out of quorum: host07

Copy to Clipboard

Toggle word wrap

将仲裁中的监控器设置为一个新的 tiebreaker：

语法

ceph mon set_new_tiebreaker NEW_HOST

ceph mon set_new_tiebreaker NEW_HOST

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02

Copy to Clipboard

Toggle word wrap

重要

如果监控器与现有非tiebreaker 监控器位于同一个位置，您会收到错误消息：

示例

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02

Error EINVAL: mon.host02 has location DC1, which matches mons host02 on the datacenter dividing bucket for stretch mode.

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host02

Error EINVAL: mon.host02 has location DC1, which matches mons host02 on the datacenter dividing bucket for stretch mode.

Copy to Clipboard

Toggle word wrap

如果发生这种情况，请更改监控器的位置：

语法

ceph mon set_location HOST datacenter=DATACENTER

ceph mon set_location HOST datacenter=DATACENTER

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph mon set_location host02 datacenter=DC3

[ceph: root@host01 /]# ceph mon set_location host02 datacenter=DC3

Copy to Clipboard

Toggle word wrap

删除失败的 tiebreaker 监控器：

语法

ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force

ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force

Removed mon.host07 from host 'host07'

[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force

Removed mon.host07 from host 'host07'

Copy to Clipboard

Toggle word wrap

从主机移除 monitor 后，重新部署监控器：

语法

ceph mon add HOST IP_ADDRESS datacenter=DATACENTER
ceph orch daemon add mon HOST

ceph mon add HOST IP_ADDRESS datacenter=DATACENTER
ceph orch daemon add mon HOST

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph mon add host07 213.222.226.50 datacenter=DC1
[ceph: root@host01 /]# ceph orch daemon add mon host07

[ceph: root@host01 /]# ceph mon add host07 213.222.226.50 datacenter=DC1
[ceph: root@host01 /]# ceph orch daemon add mon host07

Copy to Clipboard

Toggle word wrap

确保仲裁中存在五个监控器：

示例

[ceph: root@host01 /]# ceph -s

mon: 5 daemons, quorum host01, host02, host04, host05, host07 (age 15s)

[ceph: root@host01 /]# ceph -s

mon: 5 daemons, quorum host01, host02, host04, host05, host07 (age 15s)

Copy to Clipboard

Toggle word wrap

验证一切是否已正确配置：

示例

[ceph: root@host01 /]# ceph mon dump

epoch 19
fsid 1234ab78-1234-11ed-b1b1-de456ef0a89d
last_changed 2023-01-17T04:12:05.709475+0000
created 2023-01-16T05:47:25.631684+0000
min_mon_release 16 (pacific)
election_strategy: 3
stretch_mode_enabled 1
tiebreaker_mon host02
disallowed_leaders host02
0: [v2:132.224.169.63:3300/0,v1:132.224.169.63:6789/0] mon.host02; crush_location {datacenter=DC3}
1: [v2:220.141.179.34:3300/0,v1:220.141.179.34:6789/0] mon.host04; crush_location {datacenter=DC2}
2: [v2:40.90.220.224:3300/0,v1:40.90.220.224:6789/0] mon.host01; crush_location {datacenter=DC1}
3: [v2:60.140.141.144:3300/0,v1:60.140.141.144:6789/0] mon.host07; crush_location {datacenter=DC1}
4: [v2:186.184.61.92:3300/0,v1:186.184.61.92:6789/0] mon.host03; crush_location {datacenter=DC2}
dumped monmap epoch 19

[ceph: root@host01 /]# ceph mon dump

epoch 19
fsid 1234ab78-1234-11ed-b1b1-de456ef0a89d
last_changed 2023-01-17T04:12:05.709475+0000
created 2023-01-16T05:47:25.631684+0000
min_mon_release 16 (pacific)
election_strategy: 3
stretch_mode_enabled 1
tiebreaker_mon host02
disallowed_leaders host02
0: [v2:132.224.169.63:3300/0,v1:132.224.169.63:6789/0] mon.host02; crush_location {datacenter=DC3}
1: [v2:220.141.179.34:3300/0,v1:220.141.179.34:6789/0] mon.host04; crush_location {datacenter=DC2}
2: [v2:40.90.220.224:3300/0,v1:40.90.220.224:6789/0] mon.host01; crush_location {datacenter=DC1}
3: [v2:60.140.141.144:3300/0,v1:60.140.141.144:6789/0] mon.host07; crush_location {datacenter=DC1}
4: [v2:186.184.61.92:3300/0,v1:186.184.61.92:6789/0] mon.host03; crush_location {datacenter=DC2}
dumped monmap epoch 19

Copy to Clipboard

Toggle word wrap

重新部署 monitor：

语法

ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”

ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host07"

Scheduled mon update...

[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host07"

Scheduled mon update...

Copy to Clipboard

Toggle word wrap

10.2. 使用新监控器替换 tiebreaker
复制链接

如果您的 tiebreaker 监控器失败，您可以将其替换为新监控器并将其从集群中移除。

先决条件

正在运行的 Red Hat Ceph Storage 集群
在集群中启用的扩展模式

流程

在集群中添加新监控器：

手动将 crush_location 添加到新监控器中：

语法

ceph mon add NEW_HOST IP_ADDRESS datacenter=DATACENTER

ceph mon add NEW_HOST IP_ADDRESS datacenter=DATACENTER

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph mon add host06 213.222.226.50 datacenter=DC3

adding mon.host06 at [v2:213.222.226.50:3300/0,v1:213.222.226.50:6789/0]

[ceph: root@host01 /]# ceph mon add host06 213.222.226.50 datacenter=DC3

adding mon.host06 at [v2:213.222.226.50:3300/0,v1:213.222.226.50:6789/0]

Copy to Clipboard

Toggle word wrap

注意

新监控器必须位于与现有非tiebreaker 监视器不同的位置。

禁用自动监控器部署：

示例

[ceph: root@host01 /]# ceph orch apply mon --unmanaged

Scheduled mon update…

[ceph: root@host01 /]# ceph orch apply mon --unmanaged

Scheduled mon update…

Copy to Clipboard

Toggle word wrap

部署新监控器：

语法

ceph orch daemon add mon NEW_HOST

ceph orch daemon add mon NEW_HOST

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch daemon add mon host06

[ceph: root@host01 /]# ceph orch daemon add mon host06

Copy to Clipboard

Toggle word wrap

确保有 6 个监控器，其中 5 个处于仲裁状态：

示例

[ceph: root@host01 /]# ceph -s

mon: 6 daemons, quorum host01, host02, host04, host05, host06 (age 30s), out of quorum: host07

[ceph: root@host01 /]# ceph -s

mon: 6 daemons, quorum host01, host02, host04, host05, host06 (age 30s), out of quorum: host07

Copy to Clipboard

Toggle word wrap

将新监控器设置为一个新的 tiebreaker：

语法

ceph mon set_new_tiebreaker NEW_HOST

ceph mon set_new_tiebreaker NEW_HOST

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host06

[ceph: root@host01 /]# ceph mon set_new_tiebreaker host06

Copy to Clipboard

Toggle word wrap

删除失败的 tiebreaker 监控器：

语法

ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force

ceph orch daemon rm FAILED_TIEBREAKER_MONITOR --force

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force

Removed mon.host07 from host 'host07'

[ceph: root@host01 /]# ceph orch daemon rm mon.host07 --force

Removed mon.host07 from host 'host07'

Copy to Clipboard

Toggle word wrap

验证一切是否已正确配置：

示例

[ceph: root@host01 /]# ceph mon dump

epoch 19
fsid 1234ab78-1234-11ed-b1b1-de456ef0a89d
last_changed 2023-01-17T04:12:05.709475+0000
created 2023-01-16T05:47:25.631684+0000
min_mon_release 16 (pacific)
election_strategy: 3
stretch_mode_enabled 1
tiebreaker_mon host06
disallowed_leaders host06
0: [v2:213.222.226.50:3300/0,v1:213.222.226.50:6789/0] mon.host06; crush_location {datacenter=DC3}
1: [v2:220.141.179.34:3300/0,v1:220.141.179.34:6789/0] mon.host04; crush_location {datacenter=DC2}
2: [v2:40.90.220.224:3300/0,v1:40.90.220.224:6789/0] mon.host01; crush_location {datacenter=DC1}
3: [v2:60.140.141.144:3300/0,v1:60.140.141.144:6789/0] mon.host02; crush_location {datacenter=DC1}
4: [v2:186.184.61.92:3300/0,v1:186.184.61.92:6789/0] mon.host05; crush_location {datacenter=DC2}
dumped monmap epoch 19

[ceph: root@host01 /]# ceph mon dump

epoch 19
fsid 1234ab78-1234-11ed-b1b1-de456ef0a89d
last_changed 2023-01-17T04:12:05.709475+0000
created 2023-01-16T05:47:25.631684+0000
min_mon_release 16 (pacific)
election_strategy: 3
stretch_mode_enabled 1
tiebreaker_mon host06
disallowed_leaders host06
0: [v2:213.222.226.50:3300/0,v1:213.222.226.50:6789/0] mon.host06; crush_location {datacenter=DC3}
1: [v2:220.141.179.34:3300/0,v1:220.141.179.34:6789/0] mon.host04; crush_location {datacenter=DC2}
2: [v2:40.90.220.224:3300/0,v1:40.90.220.224:6789/0] mon.host01; crush_location {datacenter=DC1}
3: [v2:60.140.141.144:3300/0,v1:60.140.141.144:6789/0] mon.host02; crush_location {datacenter=DC1}
4: [v2:186.184.61.92:3300/0,v1:186.184.61.92:6789/0] mon.host05; crush_location {datacenter=DC2}
dumped monmap epoch 19

Copy to Clipboard

Toggle word wrap

重新部署 monitor：

语法

ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”

ceph orch apply mon --placement="HOST_1, HOST_2, HOST_3, HOST_4, HOST_5”

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host06"

Scheduled mon update…

[ceph: root@host01 /]# ceph orch apply mon --placement="host01, host02, host04, host05, host06"

Scheduled mon update…

Copy to Clipboard

Toggle word wrap

10.3. 强制扩展集群到恢复或健康模式
复制链接

在扩展降级模式中，集群会在断开连接的数据中心返回后自动进入恢复模式。如果没有发生这种情况，或者您想要提前启用恢复模式，您可以将扩展集群强制到恢复模式。

先决条件

正在运行的 Red Hat Ceph Storage 集群
在集群中启用的扩展模式

流程

将扩展集群强制到恢复模式：

示例

[ceph: root@host01 /]#  ceph osd force_recovery_stretch_mode --yes-i-really-mean-it

[ceph: root@host01 /]#  ceph osd force_recovery_stretch_mode --yes-i-really-mean-it

Copy to Clipboard

Toggle word wrap

注意

恢复状态会使集群处于 HEALTH_WARN 状态。

在恢复模式中，在放置组健康后，集群应该恢复到正常扩展模式。如果没有发生这种情况，您可以将扩展集群强制进入健康模式：
示例
```
[ceph: root@host01 /]#  ceph osd force_healthy_stretch_mode --yes-i-really-mean-it
```
```
[ceph: root@host01 /]#  ceph osd force_healthy_stretch_mode --yes-i-really-mean-it
```
Copy to Clipboard Toggle word wrap
注意
如果您要在早期强制跨数据中心对等，且您要风险数据停机时间，或者您单独验证所有放置组都可以对等点，您也可以运行这个命令，即使它们没有被完全恢复。
您可能还想调用健康状态模式来删除 HEALTH_WARN 状态，该状态由恢复状态生成。
注意
不应要求 force_recovery_stretch_mode 和 force_recovery_healthy_mode 命令，因为它们包含在管理未预期的情况的过程中。

第 11 章联系红帽支持服务
复制链接

如果本指南中的信息没有帮助您解决问题，本章将向您阐述如何联系 Red Hat 支持服务。

11.1. 先决条件
复制链接

红帽支持帐户.

11.2. 为红帽支持工程师提供信息
复制链接

如果您无法修复与 Red Hat Ceph Storage 相关的问题，请联络红帽支持服务并提供足够数量的信息，以帮助支持工程师更快地解决遇到的问题。

先决条件

节点的根级别访问权限。
红帽支持帐户.

流程

在红帽客户门户网站中创建一个支持问题单。
理想情况下，请将 sosreport 附加到 ticket。有关详细信息，请参阅什么是 sosreport 以及如何在 Red Hat Enterprise Linux? 解决方案中创建 sosreport。
如果 Ceph 守护进程失败并显示分段错误，请考虑生成人类可读的核心转储文件。详情请参阅 生成可读的内核转储文件。

11.3. 生成可读的核心转储文件
复制链接

当 Ceph 守护进程意外终止分段错误时，请收集关于其故障的信息，并将其提供给红帽支持工程师。

此类信息可加快初步调查的速度。此外，支持工程师还可以将核心转储文件中的信息与红帽 Ceph 存储集群已知问题进行比较。

11.3.1. 先决条件
复制链接

安装 debuginfo 软件包（如果尚未安装）。

启用以下软件仓库来安装所需的 debuginfo 软件包。

示例

subscription-manager repos --enable=rhceph-5-tools-for-rhel-8-x86_64-rpms
yum --disablerepo='*' --enable=rhceph-5-tools-for-rhel-8-x86_64-debug-rpms

[root@host01 ~]# subscription-manager repos --enable=rhceph-5-tools-for-rhel-8-x86_64-rpms
[root@host01 ~]# yum --disablerepo='*' --enable=rhceph-5-tools-for-rhel-8-x86_64-debug-rpms

Copy to Clipboard

Toggle word wrap

启用软件仓库后，您可以从这个支持的软件包列表中安装您需要的 debug info 软件包：

ceph-base-debuginfo
ceph-common-debuginfo
ceph-debugsource
ceph-fuse-debuginfo
ceph-immutable-object-cache-debuginfo
ceph-mds-debuginfo
ceph-mgr-debuginfo
ceph-mon-debuginfo
ceph-osd-debuginfo
ceph-radosgw-debuginfo
cephfs-mirror-debuginfo

ceph-base-debuginfo
ceph-common-debuginfo
ceph-debugsource
ceph-fuse-debuginfo
ceph-immutable-object-cache-debuginfo
ceph-mds-debuginfo
ceph-mgr-debuginfo
ceph-mon-debuginfo
ceph-osd-debuginfo
ceph-radosgw-debuginfo
cephfs-mirror-debuginfo

Copy to Clipboard

Toggle word wrap

确定安装了 gdb 软件包，如果未安装，请安装它：
示例
```
dnf install gdb
```
```
[root@host01 ~]# dnf install gdb
```
Copy to Clipboard Toggle word wrap
- 第 11.3.2 节 “在容器化部署中生成可读的核心转储文件”

11.3.2. 在容器化部署中生成可读的核心转储文件
复制链接

您可以为 {storage-product| 5 生成核心转储文件，它涉及捕获核心转储文件的两种情况：

当 Ceph 进程因为 SIGILL、SIGTRAP、SIGABRT 或 SIGSEGV 错误而意外终止时。

或

例如，用于调试 Ceph 进程等问题的手动消耗 CPU 周期较高，或者没有响应。

先决条件

对运行 Ceph 容器的容器节点的根级别访问权限。
安装适当的调试软件包。
安装 GNU Project Debugger(gdb)软件包。
确保主机具有至少 8 GB RAM。如果主机上有多个守护进程，红帽建议更多 RAM。

流程

如果 Ceph 进程因为 SIGILL、SIGTRAP、SIGABRT 或 SIGSEGV 错误意外终止：

将核心模式设置为运行有故障 Ceph 进程的容器的 systemd-coredump 服务：

示例

echo "| /usr/lib/systemd/systemd-coredump %P %u %g %s %t %c %h %e" > /proc/sys/kernel/core_pattern

[root@mon]# echo "| /usr/lib/systemd/systemd-coredump %P %u %g %s %t %c %h %e" > /proc/sys/kernel/core_pattern

Copy to Clipboard

Toggle word wrap

观察因为 Ceph 进程导致下一个容器失败，并在 /var/lib/systemd/coredump/ 目录中搜索核心转储文件：

示例

ls -ltr /var/lib/systemd/coredump
total 8232
-rw-r-----. 1 root root 8427548 Jan 22 19:24 core.ceph-osd.167.5ede29340b6c4fe4845147f847514c12.15622.1584573794000000.xz

[root@mon]# ls -ltr /var/lib/systemd/coredump
total 8232
-rw-r-----. 1 root root 8427548 Jan 22 19:24 core.ceph-osd.167.5ede29340b6c4fe4845147f847514c12.15622.1584573794000000.xz

Copy to Clipboard

Toggle word wrap

为 Ceph Monitors 和 Ceph OSDs 手动捕获内核转储文件：

获取 MONITOR_ID 或 OSD_ID 并输入容器：

语法

podman ps
podman exec -it MONITOR_ID_OR_OSD_ID bash

podman ps
podman exec -it MONITOR_ID_OR_OSD_ID bash

Copy to Clipboard

Toggle word wrap

示例

podman ps
podman exec -it ceph-1ca9f6a8-d036-11ec-8263-fa163ee967ad-osd-2 bash

[root@host01 ~]# podman ps
[root@host01 ~]# podman exec -it ceph-1ca9f6a8-d036-11ec-8263-fa163ee967ad-osd-2 bash

Copy to Clipboard

Toggle word wrap

在容器中安装 procps-ng 和 gdb 软件包：
示例
```
dnf install procps-ng gdb
```
```
[root@host01 ~]# dnf install procps-ng gdb
```
Copy to Clipboard Toggle word wrap

查找进程 ID：

语法

ps -aef | grep PROCESS | grep -v run

ps -aef | grep PROCESS | grep -v run

Copy to Clipboard

Toggle word wrap

将 PROCESS 替换为正在运行的进程的名称，如 ceph-mon 或 ceph-osd。

示例

ps -aef | grep ceph-mon | grep -v run
ceph       15390   15266  0 18:54 ?        00:00:29 /usr/bin/ceph-mon --cluster ceph --setroot ceph --setgroup ceph -d -i 5
ceph       18110   17985  1 19:40 ?        00:00:08 /usr/bin/ceph-mon --cluster ceph --setroot ceph --setgroup ceph -d -i 2

[root@host01 ~]# ps -aef | grep ceph-mon | grep -v run
ceph       15390   15266  0 18:54 ?        00:00:29 /usr/bin/ceph-mon --cluster ceph --setroot ceph --setgroup ceph -d -i 5
ceph       18110   17985  1 19:40 ?        00:00:08 /usr/bin/ceph-mon --cluster ceph --setroot ceph --setgroup ceph -d -i 2

Copy to Clipboard

Toggle word wrap

生成内核转储文件：

语法

gcore ID

gcore ID

Copy to Clipboard

Toggle word wrap

将 ID 替换为您在上一步中获得的进程的 ID，如 18110 ：

示例

gcore 18110
warning: target file /proc/18110/cmdline contained unexpected null characters
Saved corefile core.18110

[root@host01 ~]# gcore 18110
warning: target file /proc/18110/cmdline contained unexpected null characters
Saved corefile core.18110

Copy to Clipboard

Toggle word wrap

验证核心转储文件是否已正确生成。

示例

ls -ltr
total 709772
-rw-r--r--. 1 root root 726799544 Mar 18 19:46 core.18110

[root@host01 ~]# ls -ltr
total 709772
-rw-r--r--. 1 root root 726799544 Mar 18 19:46 core.18110

Copy to Clipboard

Toggle word wrap

在 Ceph 监控容器外部复制内核转储文件：
语法
```
podman cp ceph-mon-MONITOR_ID:/tmp/mon.core.MONITOR_PID /tmp
```
```
podman cp ceph-mon-MONITOR_ID:/tmp/mon.core.MONITOR_PID /tmp
```
Copy to Clipboard Toggle word wrap
将 MONITOR_ID 替换为 Ceph monitor 的 ID 号，并将 MONITOR_PID 替换为进程 ID 号。

为其他 Ceph 守护进程手动捕获核心转储文件：

登录到 cephadm shell ：
示例
```
cephadm shell
```
```
[root@host03 ~]# cephadm shell
```
Copy to Clipboard Toggle word wrap

为守护进程启用 ptrace ：

示例

[ceph: root@host01 /]# ceph config set mgr mgr/cephadm/allow_ptrace true

[ceph: root@host01 /]# ceph config set mgr mgr/cephadm/allow_ptrace true

Copy to Clipboard

Toggle word wrap

重新部署守护进程服务：

语法

ceph orch redeploy SERVICE_ID

ceph orch redeploy SERVICE_ID

Copy to Clipboard

Toggle word wrap

示例

[ceph: root@host01 /]# ceph orch redeploy mgr
[ceph: root@host01 /]# ceph orch redeploy rgw.rgw.1

[ceph: root@host01 /]# ceph orch redeploy mgr
[ceph: root@host01 /]# ceph orch redeploy rgw.rgw.1

Copy to Clipboard

Toggle word wrap

退出 cephadm shell 并登录到部署守护进程的主机：
示例
```
[ceph: root@host01 /]# exit
ssh root@10.0.0.11
```
```
[ceph: root@host01 /]# exit
[root@host01 ~]# ssh root@10.0.0.11
```
Copy to Clipboard Toggle word wrap

获取 DAEMON_ID 并输入容器：

示例

podman ps
podman exec -it ceph-1ca9f6a8-d036-11ec-8263-fa163ee967ad-rgw-rgw-1-host04 bash

[root@host04 ~]# podman ps
[root@host04 ~]# podman exec -it ceph-1ca9f6a8-d036-11ec-8263-fa163ee967ad-rgw-rgw-1-host04 bash

Copy to Clipboard

Toggle word wrap

安装 procps-ng 和 gdb 软件包：
示例
```
dnf install procps-ng gdb
```
```
[root@host04 /]# dnf install procps-ng gdb
```
Copy to Clipboard Toggle word wrap

获取进程的 PID：

示例

ps aux | grep rados
ceph           6  0.3  2.8 5334140 109052 ?      Sl   May10   5:25 /usr/bin/radosgw -n client.rgw.rgw.1.host04 -f --setuser ceph --setgroup ceph --default-log-to-file=false --default-log-to-stderr=true --default-log-stderr-prefix=debug

[root@host04 /]# ps aux | grep rados
ceph           6  0.3  2.8 5334140 109052 ?      Sl   May10   5:25 /usr/bin/radosgw -n client.rgw.rgw.1.host04 -f --setuser ceph --setgroup ceph --default-log-to-file=false --default-log-to-stderr=true --default-log-stderr-prefix=debug

Copy to Clipboard

Toggle word wrap

收集内核转储：
语法
```
gcore PID
```
```
gcore PID
```
Copy to Clipboard Toggle word wrap
示例
```
gcore 6
```
```
[root@host04 /]# gcore 6
```
Copy to Clipboard Toggle word wrap

验证核心转储文件是否已正确生成。

示例

ls -ltr
total 108798
-rw-r--r--. 1 root root 726799544 Mar 18 19:46 core.6

[root@host04 /]# ls -ltr
total 108798
-rw-r--r--. 1 root root 726799544 Mar 18 19:46 core.6

Copy to Clipboard

Toggle word wrap

在容器外复制内核转储文件：
语法
```
podman cp ceph-mon-DAEMON_ID:/tmp/mon.core.PID /tmp
```
```
podman cp ceph-mon-DAEMON_ID:/tmp/mon.core.PID /tmp
```
Copy to Clipboard Toggle word wrap
将 DAEMON_ID 替换为 Ceph 守护进程的 ID 号，并将 PID 替换为进程 ID 号。

将核心转储文件上传至红帽支持问题单中。详情请参阅向红帽支持工程师提供信息。

11.3.3. 其它资源
复制链接

如何在红帽客户门户网站上使用 gdb 从应用程序核心解决方案生成可读的回溯信息
红帽客户门户网站中的应用程序崩溃或分段故障解决方案时如何启用核心文件转储

附录 A. Ceph 子系统默认日志记录级别值
复制链接

各种 Ceph 子系统的默认日志记录级别值表。

Expand

子系统	日志级别	内存级别
`asok`	1	5
`auth`	1	5
`buffer`	0	0
`client`	0	5
`context`	0	5
`crush`	1	5
`default`	0	5
`filer`	0	5
`BlueStore`	1	5
`finisher`	1	5
`heartbeatmap`	1	5
`javaclient`	1	5
`Journaler`	0	5
`journal`	1	5
`lockdep`	0	5
`mds balancer`	1	5
`mds locker`	1	5
`mds log expire`	1	5
`mds log`	1	5
`mds migrator`	1	5
`MDS`	1	5
`monc`	0	5
`周一`	1	5
`ms`	0	5
`objclass`	0	5
`objectcacher`	0	5
`objecter`	0	0
`optracker`	0	5
`osd`	0	5
`Paxos`	0	5
`perfcounter`	1	5
`rados`	0	5
`rbd`	0	5
`rgw`	1	5
`throttle`	1	5
`timer`	0	5
`TP`	0	5

附录 B. Ceph 集群的运行状况消息
复制链接

Red Hat Ceph Storage 集群可以引发的健康信息是有限的。它们定义为具有唯一标识符的健康检查。标识符是一个制表伪可读字符串，旨在使工具能够理解健康检查，并以反应其含义的方式呈现它们。

Expand

表 B.1. Monitor
健康代码	描述
`DAEMON_OLD_VERSION`	如果旧版本的 Ceph 正在任何守护进程上运行，将发出 Warn。如果检测到多个版本，它将生成一个健康错误。
`MON_DOWN`	一个或多个 Ceph 监控守护进程当前为 down。
`MON_CLOCK_SKEW`	运行 `ceph-mon` 守护进程的节点上的时钟没有足够良好的同步。使用 `ntpd` 或 `chrony 同步时钟来解决这个问题`。
`MON_MSGR2_NOT_ENABLED`	`ms_bind_msgr2` 选项已启用，但一个或多个 Ceph monitor 没有配置为绑定到集群的 monmap 中的 v2 端口。通过运行 `ceph mon enable-msgr2` 命令来解决这个问题。
`MON_DISK_LOW`	一个或多个 Ceph 监控器在磁盘空间上较低。
`MON_DISK_CRIT`	一个或多个 Ceph 监控器在磁盘空间上非常低。
`MON_DISK_BIG`	一个或多个 Ceph 监控器的数据库大小非常大。
`AUTH_INSECURE_GLOBAL_ID_RECLAIM`	一个或多个客户端或守护进程连接到存储集群，在重新连接到 Ceph monitor 时，这些集群不会安全地回收其 `global_id`。
`AUTH_INSECURE_GLOBAL_ID_RECLAIM_ALLOWED`	Ceph 目前配置为允许客户端使用不安全的进程重新连接到监控器，以回收其之前的 `global_id`，因为设置 `auth_allow_insecure_global_id_reclaim` 已设置为 `true`。

Expand

表 B.2. Manager（管理者）
健康代码	描述
`MGR_DOWN`	所有 Ceph 管理器守护进程目前都为 down。
`MGR_MODULE_DEPENDENCY`	启用的 Ceph Manager 模块无法进行依赖项检查。
`MGR_MODULE_ERROR`	Ceph 管理器模块遇到了意外错误。通常，这意味着从模块的服务功能中引发了未处理异常。

Expand

表 B.3. OSD
健康代码	描述
`OSD_DOWN`	一个或多个 OSD 已标记为 down。
`OSD_CRUSH_TYPE_DOWN`	特定 CRUSH 子树中的所有 OSD 都标记为 down，例如主机上的所有 OSD。例如，OSD_HOST_DOWN 和 OSD_ROOT_DOWN
`OSD_ORPHAN`	OSD 在 CRUSH map 层次结构中引用，但不存在。运行 `ceph osd crush rm osd._OSD_ID` 命令来移除 OSD。
`OSD_OUT_OF_ORDER_FULL`	nearfull, backfillfull, full, 或, failsafefull 的利用阈值不是升序。通过运行 `ceph osd set-nearfull-ratio RATIO`, `ceph osd set-backfillfull-ratio RATIO`, 和 `ceph osd set-full-ratio RATIO` 来调整阈值
`OSD_FULL`	一个或多个 OSD 已超过完整阈值，导致存储集群无法提供写入服务。通过一个小的 `ceph osd set-full-ratio RATIO` 来增加完全阈值以恢复写入可用性。
`OSD_BACKFILLFULL`	一个或多个 OSD 已超过 backfillfull 阈值，这将阻止数据重新平衡到这个设备。
`OSD_NEARFULL`	一个或多个 OSD 已超过 nearfull 阈值。
`OSDMAP_FLAGS`	设置了一个或多个感兴趣的存储集群标志。这些标志包括 full、pauserd、pausewr、noup、nodown、noin 、 nobackfill、no recover、no rebalance、no scrub、nodeep_scrub 和 notieragent。除了 full，标记可以通过 `ceph osd set FLAG` 和 `ceph osd unset FLAG` 命令进行清除。
`OSD_FLAGS`	一个或多个 OSD 或 CRUSH 设置了感兴趣的标志。这些标志包括 noup、nodown、noin 和 noout。
`OLD_CRUSH_TUNABLES`	CRUSH map 使用非常旧的设置，应当更新。
`OLD_CRUSH_STRAW_CALC_VERSION`	CRUSH map 使用一种较旧的非优化方法来计算 `straw` bucket 的中间权重值。
`CACHE_POOL_NO_HIT_SET`	一个或多个缓存池没有配置为跟踪利用率，这会阻止分层代理识别冷对象以清空并从缓存中驱除。使用 `ceph osd pool set_POOL_NAME_ hit_set_type TYPE`, `ceph osd pool set POOL_NAME hit_set_period PERIOD_IN_SECONDS`, `ceph osd pool set POOL_NAME hit_set_count NUMBER_OF_HIT_SETS`, 和 `ceph osd pool set POOL_NAME hit_set_fpp TARGET_FALSE_POSITIVE_RATE` 命令配置缓存池中的击中集。
`OSD_NO_SORTBITWISE`	未设置 `sortbit` ther 标志。使用 `ceph osd set sortbitther 命令设置` 标志。
`POOL_FULL`	一个或多个池已达到其配额，不再允许写入。使用 `ceph osd pool set-quota POOL_NAME max_ objects NUMBER_OF_OBJECTS` 和 `ceph osd pool set-quota POOL_NAME max_ bytes BYTES` 增加池配额，或删除一些现有数据，以降低利用率。
`BLUEFS_SPILLOVER`	使用 BlueStore 后端的一个或多个 OSD 被分配 db 分区，但空间已填满，因此元数据已"中断"到正常较慢的设备。使用 `ceph config set osd bluestore_warn_on_bluefs_spillover false` 命令来禁用此功能。
`BLUEFS_AVAILABLE_SPACE`	此输出给出了三个值，即 BDEV_DB 可用值：BDE V_SLOW free 和 available_from_bluestore。
`BLUEFS_LOW_SPACE`	如果 BlueStore 文件系统(BlueFS)在可用空间上运行较低，且可用 `_from_bluestore 很少可用`，则可考虑降低蓝FS 分配单元大小。
`BLUESTORE_FRAGMENTATION`	因为 BlueStore 在底层存储上正常工作的空间会变得碎片化。这是正常现象，但过度的碎片将导致减慢。
`BLUESTORE_LEGACY_STATFS`	BlueStore 以每个池粒度为基础跟踪其内部使用量统计数据，一个或多个 OSD 具有 BlueStore 卷。使用 `ceph config set global bluestore_warn_on_legacy_statfs false` 命令禁用警告。
`BLUESTORE_NO_PER_POOL_OMAP`	BlueStore 按照池跟踪 omap 空间利用率。使用 `ceph config set global bluestore_warn_on_no_per_pool_omap false` 命令禁用警告。
`BLUESTORE_NO_PER_PG_OMAP`	BlueStore 按照 PG 跟踪 omap 空间利用率。使用 `ceph config set global bluestore_warn_on_no_per_pg_omap false` 命令禁用警告。
`BLUESTORE_DISK_SIZE_MISMATCH`	使用 BlueStore 的一个或多个 OSD 在物理设备的大小和元数据跟踪其大小之间存在内部不一致。
`BLUESTORE_NO_COMPRESSION` `	一个或多个 OSD 无法加载 BlueStore 压缩插件。这可能是由安装中断造成的，其中 `ceph-osd` 二进制文件与压缩插件不匹配，或者是最近没有包括 `ceph-osd` 守护进程重启的升级。
`BLUESTORE_SPURIOUS_READ_ERRORS`	使用 BlueStore 的一个或多个 OSD 检测主设备上的虚假读取错误。BlueStore 通过重试磁盘读取从这些错误中恢复。

Expand

表 B.4. 设备健康状况
健康代码	描述
`DEVICE_HEALTH`	一个或多个设备应该很快失败，其中警告阈值由 `mgr/devicehealth/warn_threshold` 配置选项控制。将设备标记为 out，以迁移数据并替换硬件。
`DEVICE_HEALTH_IN_USE`	个或多个设备应该很快失败，并根据 `mgr/devicehealth/mark_out_threshold` 标记为存储集群的"出站"，但它仍会参与另一个 PG。
`DEVICE_HEALTH_TOOMANY`	应该会很快出现太多设备失败，并且 `mgr/devicehealth/self_heal` 的行为被启用，因此所有孤岛设备标记会超过集群 `mon_osd_min_in_ratio` 比率，从而防止过多 OSD 自动标记为 `out`。

Expand

表 B.5. 池和放置组
健康代码	描述
`PG_AVAILABILITY`	数据可用性会降低，这意味着存储集群无法为集群中的某些数据提供潜在的读写请求。
`PG_DEGRADED`	一些数据的数据冗余会降低，这意味着存储集群没有复制池或纠删代码片段所需的副本数。
`PG_RECOVERY_FULL`	由于存储集群中缺少可用空间，数据冗余可能会减少或面临风险，特别是一个或多个 PG 设置了 `recovery_toofull` 标志，这意味着集群无法迁移或恢复数据，因为一个或多个 OSD 超过 `full` 阈值。
`PG_BACKFILL_FULL`	由于存储集群中缺少可用空间，数据冗余可能会减少或面临风险，特别是一个或多个 PG 设置了 `backfill_toofull` 标志，这意味着集群无法迁移或恢复数据，因为一个或多个 OSD 超过 `full` 阈值。
`PG_DAMAGED`	数据清理在存储集群中发现了一些数据一致性问题，特别是一个或多个 PG 设置了不一致或 `snaptrim_error` 标志，表明之前的清理操作发现问题，或者设置了 `repair` 标志，这意味着当前正在进行此类不一致的修复。
`OSD_SCRUB_ERRORS`	最近的 OSD 清理已揭示了不一致的情况。
`OSD_TOO_MANY_REPAIRS`	当出现读取错误并存在另一个副本时，可使用它立即修复错误，以便客户端可以获取对象数据。
`LARGE_OMAP_OBJECTS`	一个或多个池包括大量 omap 对象，由 `osd_deep_scrub_large_omap_object_key_threshold` 或 `osd_deep_scrub_large_omap_object_value_sum_threshold` 决定，或由这两者同时决定。使用 `ceph config set osd_deep_scrub_large_omap_object_key_threshold KEYS` 和 `ceph config set osd osd_deep_scrub_large_omap_object_value_sum_threshold BYTES` 命令调整阈值。
`CACHE_POOL_NEAR_FULL`	缓存层池已接近满。使用 `ceph osd pool set CACHE_POOL_NAME target_max_ bytes BYTES` 和 `ceph osd pool set CACHE_POOL_NAME target_max_ bytes BYTES` 命令调整缓存池目标大小。
`TOO_FEW_PGS`	存储集群中使用的 PG 数量低于每个 OSD 的 `mon_pg_warn_min_per_osd` PG 的可配置阈值。
`POOL_PG_NUM_NOT_POWER_OF_TWO`	一个或多个池带有值不是二的指数的 `pg_num` 值。使用 `ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false` 命令禁用警告。
`POOL_TOO_FEW_PGS`	一个或多个池可能具有更多 PG，具体取决于池中当前存储的数据量。您可以使用 `ceph osd pool set POOL_NAME pg_autoscale_mode off` 命令禁用 PG 的自动扩展，使用 `ceph osd pool set POOL_NAME pg_autoscale_mode on` 命令自动调整 PG 数量，或使用 `ceph osd pool set POOL_NAME pg_num _NEW_PG_NUMBER` 命令手动设置 PG 数量。
`TOO_MANY_PGS`	存储集群中使用的 PG 数量高于每个 OSD 的可配置阈值 `mon_max_pg_per_osd` PG。通过添加更多硬件增加集群中的 OSD 数量。
`POOL_TOO_MANY_PGS`	一个或多个池可能具有更多 PG，具体取决于池中当前存储的数据量。您可以使用 `ceph osd pool set POOL_NAME pg_autoscale_mode off` 命令禁用 PG 的自动扩展，使用 `ceph osd pool set POOL_NAME pg_autoscale_mode on` 命令自动调整 PG 数量，或使用 `ceph osd pool set POOL_NAME pg_num _NEW_PG_NUMBER` 命令手动设置 PG 数量。
`POOL_TARGET_SIZE_BYTES_OVERCOMMITTED`	个或多个池设置了 `target_size_bytes` 属性来估算池的预期大小，但值超过了可用存储总数。通过 `ceph osd pool set POOL_NAME target_size_ bytes 0` 命令，将池的值设置为零。
`POOL_HAS_TARGET_SIZE_BYTES_AND_RATIO`	一个或多个池同时设置了 `target_size_bytes` 和 `target_size_ratio`，以估算池的预期大小。通过 `ceph osd pool set POOL_NAME target_size_ bytes 0` 命令，将池的值设置为零。
`TOO_FEW_OSDS`	存储集群中的 OSD 数量低于 `o'sd_pool_default_size` 的可配置阈值。
`SMALLER_PGP_NUM`	一个或多个池带有值小于 `pg_num` 的`pgp_num` 值。这通常表示 PG 计数已增加，且不会增加放置行为。通过设置 `pgp_num` 匹配 `pg_num` with `ceph osd pool set POOL_NAME pgp_num PG_NUM_VALUE` 来解决这个问题。
`MANY_OBJECTS_PER_PG`	个或多个池每个 PG 的平均对象数量明显高于存储集群总体平均值。特定阈值由 `mon_pg_warn_max_object_skew` 配置值控制。
`POOL_APP_NOT_ENABLED`	存在一个池，其中包含一个或多个对象，但尚未标记供特定应用使用。使用 `rbd pool init POOL_NAME` 命令标记供应用使用的池，从而解决这一警告。
`POOL_FULL`	个或多个池已达到其配额。触发此错误条件的阈值由 `mon_pool_quota_crit_threshold` 配置选项控制。
`POOL_NEAR_FULL`	一个或多个池正在接近配置的全度阈值。使用 `ceph osd pool set-quota POOL_NAME max_ objects NUMBER_OF_OBJECTS` 和 `ceph osd pool set-quota POOL_NAME max_ bytes BYTES` 命令调整池配额。
`OBJECT_MISPLACED`	存储群集中的一个或多个对象不存储在存储器集群希望它存储的节点上。这表明，由于最近一些存储集群更改，数据迁移尚未完成。
`OBJECT_UNFOUND`	存储集群中无法找到一个或多个对象，特别是 OSD 知道对象应存在新的或更新的副本，但当前在线的 OSD 上尚未找到该对象版本的副本。
`SLOW_OPS`	一个或多个 OSD 或 monitor 的请求需要很长时间进行处理。这可能代表了极端负载、存储设备缓慢或软件漏洞。
`PG_NOT_SCRUBBED`	最近没有清理一个或多个 PG。PG 通常在由 `osd_scrub_max_interval` 全局指定的每一配置间隔内清理。使用 `ceph pg scrub PG_ID` 命令启动刮除。
`PG_NOT_DEEP_SCRUBBED`	最近没有对一个或多个 PG 进行深度清理。使用 `ceph pg deep-scrub PG_ID` 命令启动清理。PG 通常会清理每个 `osd_deep_scrub_interval` 秒，当 `mon_warn_pg_not_deep_scrubbed_ratio` 间隔百分比已过期时，这个警告会触发。
`PG_SLOW_SNAP_TRIMMING`	一个或多个 PG 的快照修剪队列已超过配置的警告阈值。这表明最近删除了大量的快照，或者 OSD 无法足够快速地修剪快照，以跟上新快照删除的速度。

Expand

表 B.6. 其它
健康代码	描述
`RECENT_CRASH`	一个或多个 Ceph 守护进程最近已崩溃，并且该崩溃尚未被管理员确认。
`TELEMETRY_CHANGED`	遥测已经启用，但遥测报告的内容从那时起发生了变化，因此将不会发送遥测报告。
`AUTH_BAD_CAPS`	一个或多个 auth 用户具有无法被 monitor 解析的功能。使用 `ceph auth ENTITY_NAME DAEMON_TYPE CAPS` 命令更新用户的能力。
`OSD_NO_DOWN_OUT_INTERVAL`	`mon_osd_down_out_interval` 选项设为零，这意味着系统不会在 OSD 出现故障后自动执行任何修复或修复操作。用 `ceph config global mon_warn_on_osd_down_out_interval_zero false` 命令静默间隔。
`DASHBOARD_DEBUG`	启用了 Dashboard 调试模式。这意味着，如果在处理 REST API 请求时出现错误，则 HTTP 错误响应包含 Python 回溯。使用 `ceph dashboard debug disable` 命令禁用调试模式。

法律通告
复制链接

The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.

Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.

Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.

Linux® is the registered trademark of Linus Torvalds in the United States and other countries.

Java® is a registered trademark of Oracle and/or its affiliates.

XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.

MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.

Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.

The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.

All other trademarks are the property of their respective owners.

故障排除指南

Red Hat Ceph Storage 故障排除

第 1 章 初始故障排除复制链接链接已复制到粘贴板!

1.1. 先决条件复制链接链接已复制到粘贴板!

1.2. 识别问题复制链接链接已复制到粘贴板!

1.3. 诊断存储集群的健康状况复制链接链接已复制到粘贴板!

1.4. 了解 Ceph 的健康状态复制链接链接已复制到粘贴板!

1.5. 变异 Ceph 集群的健康警报复制链接链接已复制到粘贴板!

1.6. 了解 Ceph 日志复制链接链接已复制到粘贴板!

1.7. 生成 sos 报告复制链接链接已复制到粘贴板!

第 2 章 配置日志记录复制链接链接已复制到粘贴板!

2.1. 先决条件复制链接链接已复制到粘贴板!

2.2. Ceph 子系统复制链接链接已复制到粘贴板!

2.3. 在运行时配置日志记录复制链接链接已复制到粘贴板!

2.4. 配置登录配置文件复制链接链接已复制到粘贴板!

2.5. 加快日志轮转复制链接链接已复制到粘贴板!

2.6. 为 Ceph 对象网关创建和收集操作日志复制链接链接已复制到粘贴板!

第 3 章 网络问题故障排除复制链接链接已复制到粘贴板!

3.1. 先决条件复制链接链接已复制到粘贴板!

3.2. 基本网络故障排除复制链接链接已复制到粘贴板!

3.3. 基本 chrony NTP 故障排除复制链接链接已复制到粘贴板!

第 4 章 Ceph 监控器故障排除复制链接链接已复制到粘贴板!

4.1. 先决条件复制链接链接已复制到粘贴板!

4.2. 大多数常见 Ceph 监控错误复制链接链接已复制到粘贴板!

4.2.1. 先决条件复制链接链接已复制到粘贴板!

4.2.2. Ceph 监控错误消息复制链接链接已复制到粘贴板!

4.2.3. Ceph 日志中的通用 Ceph monitor 错误消息复制链接链接已复制到粘贴板!

4.2.4. Ceph monitor 超出仲裁数复制链接链接已复制到粘贴板!

4.2.5. Clock skew复制链接链接已复制到粘贴板!

4.2.6. Ceph 监控器存储太大复制链接链接已复制到粘贴板!

4.2.7. 了解 Ceph 监控状态复制链接链接已复制到粘贴板!

4.2.8. 其它资源复制链接链接已复制到粘贴板!

4.3. 注入 monmap复制链接链接已复制到粘贴板!

4.4. 替换失败的 monitor复制链接链接已复制到粘贴板!

4.5. 压缩 monitor 存储复制链接链接已复制到粘贴板!

4.6. 为 Ceph Manager 打开端口复制链接链接已复制到粘贴板!

4.7. 恢复 Ceph 监控存储复制链接链接已复制到粘贴板!

4.7.1. 使用 BlueStore 时恢复 Ceph monitor 存储复制链接链接已复制到粘贴板!

4.8. 其它资源复制链接链接已复制到粘贴板!

第 5 章 Ceph OSD 故障排除复制链接链接已复制到粘贴板!

5.1. 先决条件复制链接链接已复制到粘贴板!

5.2. 大多数常见 Ceph OSD 错误复制链接链接已复制到粘贴板!

5.2.1. 先决条件复制链接链接已复制到粘贴板!

5.2.2. Ceph OSD 错误消息复制链接链接已复制到粘贴板!

5.2.3. Ceph 日志中的常见 Ceph OSD 错误消息复制链接链接已复制到粘贴板!

5.2.4. OSD 已满复制链接链接已复制到粘贴板!

5.2.5. backfillfull OSD复制链接链接已复制到粘贴板!

5.2.6. nearfull OSD复制链接链接已复制到粘贴板!

5.2.7. OSD 下线复制链接链接已复制到粘贴板!

5.2.8. Flapping OSD复制链接链接已复制到粘贴板!

5.2.9. 请求慢或请求被阻塞复制链接链接已复制到粘贴板!

5.3. 停止并启动重新平衡复制链接链接已复制到粘贴板!

5.4. 替换 OSD 驱动器复制链接链接已复制到粘贴板!

5.5. 增加 PID 数量复制链接链接已复制到粘贴板!

5.6. 从完整存储集群中删除数据复制链接链接已复制到粘贴板!

第 6 章 多站点 Ceph 对象网关故障排除复制链接链接已复制到粘贴板!

6.1. 先决条件复制链接链接已复制到粘贴板!

6.2. Ceph 对象网关的代码定义错误复制链接链接已复制到粘贴板!

6.3. 同步多站点 Ceph 对象网关复制链接链接已复制到粘贴板!

6.3.1. 执行多站点 Ceph 对象网关的数据同步的计数器复制链接链接已复制到粘贴板!

6.4. 在多站点 Ceph 对象网关配置中同步数据复制链接链接已复制到粘贴板!

第 7 章 对 Ceph iSCSI 网关（有限的可用性）进行故障排除复制链接链接已复制到粘贴板!

7.1. 先决条件复制链接链接已复制到粘贴板!

7.2. 为丢失的连接收集信息会导致 VMware ESXi 上的存储失败复制链接链接已复制到粘贴板!

7.3. 检查 iSCSI 登录失败，因为未发送数据复制链接链接已复制到粘贴板!

7.4. 检查 iSCSI 登录失败，因为超时或无法找到门户组复制链接链接已复制到粘贴板!

7.5. timeout 命令错误复制链接链接已复制到粘贴板!

7.6. Abort 任务错误复制链接链接已复制到粘贴板!

7.7. 其它资源复制链接链接已复制到粘贴板!

第 8 章 Ceph 放置组故障排除复制链接链接已复制到粘贴板!

8.1. 先决条件复制链接链接已复制到粘贴板!

8.2. 大多数常见的 Ceph 放置组错误复制链接链接已复制到粘贴板!

8.2.1. 先决条件复制链接链接已复制到粘贴板!

8.2.2. 放置组错误消息复制链接链接已复制到粘贴板!

8.2.3. Stale 放置组复制链接链接已复制到粘贴板!

8.2.4. Inconsistent placement groups复制链接链接已复制到粘贴板!

8.2.5. unclean PG复制链接链接已复制到粘贴板!

8.2.6. 不活跃的放置组复制链接链接已复制到粘贴板!

8.2.7. 放置组停机复制链接链接已复制到粘贴板!

8.2.8. Unfound objects复制链接链接已复制到粘贴板!

第 1 章初始故障排除
复制链接

1.1. 先决条件
复制链接

1.2. 识别问题
复制链接

1.3. 诊断存储集群的健康状况
复制链接

1.4. 了解 Ceph 的健康状态
复制链接

1.5. 变异 Ceph 集群的健康警报
复制链接

1.6. 了解 Ceph 日志
复制链接

1.7. 生成 sos 报告
复制链接

第 2 章配置日志记录
复制链接

2.1. 先决条件
复制链接

2.2. Ceph 子系统
复制链接

2.3. 在运行时配置日志记录
复制链接

2.4. 配置登录配置文件
复制链接

2.5. 加快日志轮转
复制链接

2.6. 为 Ceph 对象网关创建和收集操作日志
复制链接

第 3 章网络问题故障排除
复制链接

3.1. 先决条件
复制链接

3.2. 基本网络故障排除
复制链接

3.3. 基本 chrony NTP 故障排除
复制链接

第 4 章 Ceph 监控器故障排除
复制链接

4.1. 先决条件
复制链接

4.2. 大多数常见 Ceph 监控错误
复制链接

4.2.1. 先决条件
复制链接

4.2.2. Ceph 监控错误消息
复制链接

4.2.3. Ceph 日志中的通用 Ceph monitor 错误消息
复制链接

4.2.4. Ceph monitor 超出仲裁数
复制链接

4.2.5. Clock skew
复制链接

4.2.6. Ceph 监控器存储太大
复制链接

4.2.7. 了解 Ceph 监控状态
复制链接

4.2.8. 其它资源
复制链接

4.3. 注入 monmap
复制链接

4.4. 替换失败的 monitor
复制链接

4.5. 压缩 monitor 存储
复制链接

4.6. 为 Ceph Manager 打开端口
复制链接

4.7. 恢复 Ceph 监控存储
复制链接

4.7.1. 使用 BlueStore 时恢复 Ceph monitor 存储
复制链接

4.8. 其它资源
复制链接

第 5 章 Ceph OSD 故障排除
复制链接

5.1. 先决条件
复制链接

5.2. 大多数常见 Ceph OSD 错误
复制链接

5.2.1. 先决条件
复制链接

5.2.2. Ceph OSD 错误消息
复制链接

5.2.3. Ceph 日志中的常见 Ceph OSD 错误消息
复制链接

5.2.4. OSD 已满
复制链接

5.2.5. backfillfull OSD
复制链接

5.2.6. nearfull OSD
复制链接

5.2.7. OSD 下线
复制链接

5.2.8. Flapping OSD
复制链接

5.2.9. 请求慢或请求被阻塞
复制链接

5.3. 停止并启动重新平衡
复制链接

5.4. 替换 OSD 驱动器
复制链接

5.5. 增加 PID 数量
复制链接

5.6. 从完整存储集群中删除数据
复制链接

第 6 章多站点 Ceph 对象网关故障排除
复制链接

6.1. 先决条件
复制链接

6.2. Ceph 对象网关的代码定义错误
复制链接

6.3. 同步多站点 Ceph 对象网关
复制链接

6.3.1. 执行多站点 Ceph 对象网关的数据同步的计数器
复制链接

6.4. 在多站点 Ceph 对象网关配置中同步数据
复制链接

第 7 章对 Ceph iSCSI 网关（有限的可用性）进行故障排除
复制链接

7.1. 先决条件
复制链接

7.2. 为丢失的连接收集信息会导致 VMware ESXi 上的存储失败
复制链接

7.3. 检查 iSCSI 登录失败，因为未发送数据
复制链接

7.4. 检查 iSCSI 登录失败，因为超时或无法找到门户组
复制链接

7.5. timeout 命令错误
复制链接

7.6. Abort 任务错误
复制链接

7.7. 其它资源
复制链接

第 8 章 Ceph 放置组故障排除
复制链接

8.1. 先决条件
复制链接

8.2. 大多数常见的 Ceph 放置组错误
复制链接

8.2.1. 先决条件
复制链接

8.2.2. 放置组错误消息
复制链接

8.2.3. Stale 放置组
复制链接

8.2.4. Inconsistent placement groups
复制链接

8.2.5. unclean PG
复制链接

8.2.6. 不活跃的放置组
复制链接

8.2.7. 放置组停机
复制链接

8.2.8. Unfound objects
复制链接

8.3. 列出 PG 停留在 stale、inactive 或 unclean 状态
复制链接

8.4. 列出放置组不一致
复制链接