23.10. Compute 节点故障排除
Compute 节点使用 Compute 服务来执行基于虚拟机监控程序的操作。这意味着,对 Compute 节点进行故障排除可以解决与这个服务相关的问题。
步骤
查找
stackrc
文件:source ~/stackrc
$ source ~/stackrc
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 获取包含故障的 Compute 节点的 IP 地址:
(undercloud) $ openstack server list
(undercloud) $ openstack server list
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 登录到节点:
(undercloud) $ ssh heat-admin@192.168.24.60
(undercloud) $ ssh heat-admin@192.168.24.60
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 切换到 root 用户:
sudo -i
$ sudo -i
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 查看容器状态:
sudo podman ps -f name=nova_compute
$ sudo podman ps -f name=nova_compute
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
Compute 节点的主日志文件为
/var/log/containers/nova/nova-compute.log
。如果与 Compute 节点的通信出现问题,从这个日志文件开始诊断是个好办法。 - 如果需要在 Compute 节点上进行维护工作,把主机上存在的实例迁移到另外一个可以正常工作的 Compute 节点上,然后禁用需要进行维护的节点。