28.2. 硬件内省故障排除
如果检查 RAM 磁盘没有响应,裸机置备检查器服务 ironic-inspector
服务会在默认的一小时后超时。超时可能表示检查 RAM 磁盘中的错误,但通常因为环境错误配置而发生超时。
您可以诊断和解决常见环境错误配置问题,以确保内省进程运行完成。
步骤
查找
stackrc
undercloud 凭证文件:$ source ~/stackrc
确保您的节点处于
manageable
状态。内省不检查处于available
状态的节点,该状态意味着用于部署。如果要检查处于available
状态的节点,请在内省前将节点状态更改为manageable
状态:(undercloud)$ openstack baremetal node manage <node_uuid>
要在内省调试过程中配置对内省 RAM 磁盘的临时访问,请使用
sshkey
参数将公共 SSH 密钥附加到/httpboot/inspector.ipxe
文件中的内核
配置中:kernel http://192.2.0.1:8088/agent.kernel ipa-inspection-callback-url=http://192.168.0.1:5050/v1/continue ipa-inspection-collectors=default,extra-hardware,logs systemd.journald.forward_to_console=yes BOOTIF=${mac} ipa-debug=1 ipa-inspection-benchmarks=cpu,mem,disk selinux=0 sshkey="<public_ssh_key>"
在节点上运行内省:
(undercloud)$ openstack overcloud node introspect <node_uuid> --provide
内省完成后,使用
--provide
选项将节点状态更改为available
。从
dnsmasq
日志中识别节点的 IP 地址:(undercloud)$ sudo tail -f /var/log/containers/ironic-inspector/dnsmasq.log
如果出错,则使用根用户和临时访问详细信息访问节点:
$ ssh root@192.168.24.105
在内省期间访问节点以运行诊断命令并排除内省故障。
要停止内省过程,请运行以下命令:
(undercloud)$ openstack baremetal introspection abort <node_uuid>
您也可以等待操作过程超时。
注意Red Hat OpenStack Platform director 在初始中止后重试内省三次。在每次尝试时均运行
openstack baremetal introspection abort
命令以完全中止内省。