28.4. 节点置备故障排除
OpenStack Orchestration (heat) 服务控制置备过程。如果节点置备失败,则使用 OpenStack 客户端和服务日志文件诊断问题。
步骤
Source
stackrc
文件:$ source ~/stackrc
检查裸机恢复服务以查看所有注册节点及其当前状态:
(undercloud) $ openstack baremetal node list +----------+------+---------------+-------------+-----------------+-------------+ | UUID | Name | Instance UUID | Power State | Provision State | Maintenance | +----------+------+---------------+-------------+-----------------+-------------+ | f1e261...| None | None | power off | available | False | | f0b8c1...| None | None | power off | available | False | +----------+------+---------------+-------------+-----------------+-------------+
可用于置备的所有节点都应设置以下状态:
-
Maintenance 设置为
False
。 -
在置备前,Provision State 设置为
available
。
-
Maintenance 设置为
如果节点没有设置为
False
或Provision State
设置为available
,则使用下表来识别问题和解决方案:问题 原因 解决方案 Maintenance 自动将自身设置为
True
。director 无法访问节点的电源管理。
检查节点电源管理的凭据。
Provision State 设置为
available
,但节点未置备。此问题在启动裸机部署前发生。
检查包括配置集和类别映射的节点详细信息。检查节点硬件详细信息是否在该类别的要求内。
节点的 Provision State 设置为
wait call-back
。此节点的节点置备过程尚未完成。
等到此状态更改。否则,连接到节点的虚拟控制台并检查输出。
Provision State 处于
active
,Power State 处于power on
,但节点无响应。节点置备已成功完成,并在部署后配置步骤中出问题。
诊断节点配置过程。连接到节点的虚拟控制台并检查输出。
Provision State 为
error
或deploy failed
。节点置备已失败。
使用
openstack baremetal node show
命令查看裸机节点详细信息,并检查last_error
字段,其中包含错误说明。
其他资源