8.4. タイムアウトまたはポータルグループが見つからないことによる iSCSI ログイン失敗の確認
iSCSI ゲートウェイノードでは、デフォルトで /var/log/messages
でタイムアウトが発生したり、システムログでターゲットポータルグループメッセージが見つからないことがあります。
例
Mar 28 00:29:01 osd2 kernel: iSCSI Login timeout on Network Portal 10.2.132.2:3260
または
例
Mar 23 20:25:39 osd1 kernel: Unable to locate Target Portal Group on iqn.2017-12.com.redhat.iscsi-gw:ceph-igw
システムがこの状態である間、この手順で提案されているシステム情報の収集を開始します。
前提条件
- 稼働中の Red Hat Ceph Storage クラスターがある。
- 実行中の Ceph iSCSI ゲートウェイ。
- Ceph iSCSI ゲートウェイノードへの root レベルのアクセス。
手順
待機中のタスクのダンプを有効にして、ファイルに書き込みます。
[root@igw ~]# dmesg -c ; echo w > /proc/sysrq-trigger ; dmesg -c > /tmp/waiting-tasks.txt
待機中のタスクのリストを見て、以下のメッセージを確認します。
-
iscsit_tpg_disable_portal_group
-
core_tmr_abort_task
-
transport_generic_free_cmd
待機タスクリストにこれらのメッセージが表示されると、
tcmu-runner
サービスで何らかの問題が発生したことを示します。tcmu-runner
サービスが正常に再起動しなかったか、tcmu-runner
サービスがクラッシュしました。-
tcmu-runner
サービスが実行中かどうかを確認します。[root@igw ~]# systemctl status tcmu-runner
tcmu-runner
サービスが実行していない場合は、tcmu-runner
サービスを再起動する前にrbd-target-gw
サービスを停止します。[root@igw ~]# systemctl stop rbd-target-api [root@igw ~]# systemctl stop rbd-target-gw [root@igw ~]# systemctl stop tcmu-runner [root@igw ~]# systemctl start tcmu-runner [root@igw ~]# systemctl start rbd-target-gw [root@igw ~]# systemctl start rbd-target-api
重要Ceph iSCSI ゲートウェイを停止すると、まず
tcmu-runner
サービスがダウンしても IO がスタックできなくなります。-
tcmu-runner
サービスが実行されている場合には、これは新しいバグである可能性があります。新しい Red Hat サポートケースを作成します。
関連情報
-
Red Hat グローバルサポートサービス向けに
sosreport
を作成する方法 は Red Hat ナレッジベースソリューションを参照してください。 - Red Hat グローバルサポートサービスの ファイルのアップロード に関する Red Hat ナレッジベースソリューションを参照してください。
- カスタマーポータルで Red Hat サポートケース を作成する方法