14.8. Compute 节点故障排除
Compute 节点使用 Compute 服务来执行基于虚拟机监控程序的操作。这意味着,对 Compute 节点进行故障排除可以解决与这个服务相关的问题。
步骤
Source
stackrc文件:source ~/stackrc
$ source ~/stackrcCopy to Clipboard Copied! Toggle word wrap Toggle overflow 获取包含故障的 Compute 节点的 IP 地址:
(undercloud) $ openstack server list
(undercloud) $ openstack server listCopy to Clipboard Copied! Toggle word wrap Toggle overflow 登录该节点:
(undercloud) $ ssh tripleo-admin@192.168.24.60
(undercloud) $ ssh tripleo-admin@192.168.24.60Copy to Clipboard Copied! Toggle word wrap Toggle overflow 切换到 root 用户:
sudo -i
$ sudo -iCopy to Clipboard Copied! Toggle word wrap Toggle overflow 查看容器状态:
sudo podman ps -f name=nova_compute
$ sudo podman ps -f name=nova_computeCopy to Clipboard Copied! Toggle word wrap Toggle overflow -
Compute 节点的主日志文件为
/var/log/containers/nova/nova-compute.log。如果 Compute 节点通信出现问题,请使用此文件开始诊断。 - 如果需要在 Compute 节点上进行维护工作,把主机上存在的实例迁移到另外一个可以正常工作的 Compute 节点上,然后禁用需要进行维护的节点。