7.4. 检查 iSCSI 登录失败,因为超时或无法找到门户组
在 iSCSI 网关节点上,您可能会看到超时,或者无法在系统日志中找到目标门户组消息,默认为 /var/log/messages
。
示例
Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260
Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260
或
示例
Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
虽然系统处于此状态,但请按照此流程中的建议开始收集系统信息。
先决条件
- 一个正在运行的 Red Hat Ceph Storage 集群。
- 正在运行的 Ceph iSCSI 网关。
- 对 Ceph iSCSI 网关节点的 root 级别访问权限。
流程
启用等待任务转储,并将其写入文件中:
dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt
[root@igw ~]# dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 查看等待以下消息的任务列表:
-
iscsit_tpg_disable_portal_group
-
core_tmr_abort_task
-
transport_generic_free_cmd
如果这些消息显示在等待的任务列表中,则表示
tcmu-runner
服务出现了某种错误。或许tcmu-runner
服务没有正确重启,或者tcmu-runner
服务已崩溃。-
验证
tcmu-runner
服务是否正在运行:systemctl status tcmu-runner
[root@igw ~]# systemctl status tcmu-runner
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果
tcmu-runner
服务没有运行,在重启tcmu-runner
服务前停止rbd-target-gw
服务:systemctl stop rbd-target-gw systemctl stop tcmu-runner systemctl start tcmu-runner systemctl start rbd-target-gw
[root@igw ~]# systemctl stop rbd-target-gw [root@igw ~]# systemctl stop tcmu-runner [root@igw ~]# systemctl start tcmu-runner [root@igw ~]# systemctl start rbd-target-gw
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 重要首先停止 Ceph iSCSI 网关可防止 IO 在
tcmu-runner
服务停机时卡住。-
如果
tcmu-runner
服务正在运行,这可能是一个新程序错误。创建一个新的红帽支持问题单。
其它资源
-
请参阅红帽的知识库解决方案,了解如何为 Red Hat 全球支持服务 创建
sosreport
。 - 有关 上传红帽全球支持服务的文件,请参阅红帽知识库解决方案。
- 如何在客户门户上创建红帽 支持问题单?