第3章 セルフホストエンジンのデプロイメントのトラブルシューティング
セルフホストエンジンがすでにデプロイされているかどうかを確認するには、hosted-engine --check-deployed
を実行します。セルフホストエンジンがデプロイされていない場合にだけ、エラーが表示されます。
3.1. Manager 用仮想マシンのトラブルシューティング リンクのコピーリンクがクリップボードにコピーされました!
hosted-engine --vm-status
を実行して Manager 用仮想マシンのステータスを確認します。
Manager 用仮想マシンに加えた変更がステータスコマンドの出力に反映されるには、20 秒ほどかかります。
出力の Engine status
ごとに、問題を特定または解決するためのアドバイスを以下に示します。
Engine status: "health": "good", "vm": "up", "detail": "up"
Manager 用仮想マシンが通常通りに稼働中の場合には、以下のような出力が表示されます。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 出力は正常だが Manager に接続することができない場合は、ネットワーク接続を確認してください。
Engine status: "reason": "failed liveliness check", "health": "bad", "vm": "up", "detail": "up"
health
がbad
でvm
がup
の場合、HA サービスは Manager 用仮想マシンを再起動して Manager の復旧を試みます。数分で復旧しない場合は、コマンドラインからグローバルメンテナンスモードを有効にして、ホストを HA サービスの管理対象外にします。hosted-engine --set-maintenance --mode=global
# hosted-engine --set-maintenance --mode=global
Copy to Clipboard Copied! Toggle word wrap Toggle overflow コンソールに接続します。プロンプトが表示されたら、オペレーティングシステムの root パスワードを入力します。コンソールのオプションについての詳しい説明は、「How to access Hosted Engine VM console from RHEV-H host?」を参照してください。
hosted-engine --console
# hosted-engine --console
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - Manager 用仮想マシンにログインして、オペレーティングシステムが動作していることを確認します。
ovirt-engine
サービスのステータスを確認します。systemctl status -l ovirt-engine journalctl -u ovirt-engine
# systemctl status -l ovirt-engine # journalctl -u ovirt-engine
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - ログ /var/log/messages、/var/log/ovirt-engine/engine.log、および /var/log/ovirt-engine/server.log を確認します。
問題を解決したら、セルフホストエンジンノードのいずれかから、手動で Manager 用仮想マシンを再起動します。
hosted-engine --vm-shutdown hosted-engine --vm-start
# hosted-engine --vm-shutdown # hosted-engine --vm-start
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注記セルフホストエンジンノードがグローバルメンテナンスモードにある場合は、Manager 用仮想マシンを手動で再起動する必要があります。コマンドラインから
reboot
コマンドを送信して Manager 用仮想マシンを再起動しようとしても、設計上 Manager 用仮想マシンは電源オフのままです。Manager 用仮想マシンで
ovirt-engine
サービスが稼働中であることを確認します。systemctl status ovirt-engine.service
# systemctl status ovirt-engine.service
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Manager 用仮想マシンが稼働中であることを確認した後には、コンソールセッションを終了して、メンテナンスモードを無効にし、HA サービスを再び有効にします。
hosted-engine --set-maintenance --mode=none
# hosted-engine --set-maintenance --mode=none
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
Engine status: "vm": "down", "health": "bad", "detail": "unknown", "reason": "vm not running on this host"
- 環境内に複数のホストがある場合は、現在別のホストが Manager 用仮想マシンの再起動を試みていないことを確認します。
- グローバルメンテナンスモードにないことを確認します。
- /var/log/ovirt-hosted-engine-ha/agent.log で ovirt-ha-agent のログを確認します。
セルフホストエンジンノードのいずれかから、手動で Manager 用仮想マシンの再起動を試みます。
hosted-engine --vm-shutdown hosted-engine --vm-start
# hosted-engine --vm-shutdown # hosted-engine --vm-start
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
Engine status: "vm": "unknown", "health": "unknown", "detail": "unknown", "reason": "failed to getVmStats"
このステータスは、ovirt-ha-agent
が VDSM から仮想マシンの詳細を取得できなかったことを意味しています。
- /var/log/vdsm/vdsm.log で VDSM のログを確認します。
- /var/log/ovirt-hosted-engine-ha/agent.log で ovirt-ha-agent のログを確認します。
Engine status: セルフホストエンジンの設定が共有ストレージから取得されていない
ステータスが The hosted engine configuration has not been retrieved from shared storage. Please ensure that ovirt-ha-agent is running and the storage server is reachable
と表示される場合は、ovirt-ha-agent
サービスもしくはストレージ (またはその両方) に問題があります。
ホストの
ovirt-ha-agent
のステータスを確認します。systemctl status -l ovirt-ha-agent journalctl -u ovirt-ha-agent
# systemctl status -l ovirt-ha-agent # journalctl -u ovirt-ha-agent
Copy to Clipboard Copied! Toggle word wrap Toggle overflow ovirt-ha-agent
が停止状態の場合は、再起動します。systemctl start ovirt-ha-agent
# systemctl start ovirt-ha-agent
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
/var/log/ovirt-hosted-engine-ha/agent.log で
ovirt-ha-agent
のログを確認します。 - 共有ストレージに ping を送信できることを確認します。
- 共有ストレージがマウントされているかどうかを確認します。
その他のトラブルシューティング用コマンド
以下のコマンドのいずれかを実行してセルフホストエンジン環境のトラブルシューティングを行う必要がある場合には、Red Hat サポートまでご連絡ください。
-
hosted-engine --reinitialize-lockspace
: このコマンドは、sanlock ロックスペースが壊れている場合に使用します。sanlock ロックスペースを再初期化する前に、グローバルメンテナンスモードが有効で Manager 用仮想マシンが停止していることを確認してください。 -
hosted-engine --clean-metadata
: ホストのエージェントのメタデータをグローバルステータスデータベースから削除します。これにより、他のホストではすべて、このホストについての情報はなくなります。ターゲットのホストが停止状態でグローバルメンテナンスモードが有効であることを確認してください。 -
hosted-engine --check-liveliness
: このコマンドは、ovirt-engine サービスの liveliness ページを確認します。また、Web ブラウザーでhttps://engine-fqdn/ovirt-engine/services/health/
に接続して確認することもできます。 -
hosted-engine --connect-storage
: このコマンドは、ホストと Manager 用仮想マシンに必要な全ストレージ接続の準備をするように VDSM に指示します。これは通常、セルフホストエンジンのデプロイ中にバックエンドで実行します。このコマンドを実行してストレージの問題のトラブルシューティングを行う必要がある場合には、グローバルメンテナンスモードを必ず有効にしてください。