28.2. 硬件内省故障排除


如果检查 RAM 磁盘没有响应,裸机置备检查器服务 ironic-inspector 服务会在默认的一小时后超时。超时可能表示检查 RAM 磁盘中的错误,但通常因为环境错误配置而发生超时。

您可以诊断和解决常见环境错误配置问题,以确保内省进程运行完成。

步骤

  1. 查找 stackrc undercloud 凭证文件:

    $ source ~/stackrc
  2. 确保您的节点处于 manageable 状态。内省不检查处于 available 状态的节点,该状态意味着用于部署。如果要检查处于 available 状态的节点,请在内省前将节点状态更改为 manageable 状态:

    (undercloud)$ openstack baremetal node manage <node_uuid>
  3. 要在内省调试过程中配置对内省 RAM 磁盘的临时访问,请使用 sshkey 参数将公共 SSH 密钥附加到 /httpboot/inspector.ipxe 文件中的 内核 配置中:

    kernel http://192.2.0.1:8088/agent.kernel ipa-inspection-callback-url=http://192.168.0.1:5050/v1/continue ipa-inspection-collectors=default,extra-hardware,logs systemd.journald.forward_to_console=yes BOOTIF=${mac} ipa-debug=1 ipa-inspection-benchmarks=cpu,mem,disk selinux=0 sshkey="<public_ssh_key>"
  4. 在节点上运行内省:

    (undercloud)$ openstack overcloud node introspect <node_uuid> --provide

    内省完成后,使用 --provide 选项将节点状态更改为 available

  5. dnsmasq 日志中识别节点的 IP 地址:

    (undercloud)$ sudo tail -f /var/log/containers/ironic-inspector/dnsmasq.log
  6. 如果出错,则使用根用户和临时访问详细信息访问节点:

    $ ssh root@192.168.24.105

    在内省期间访问节点以运行诊断命令并排除内省故障。

  7. 要停止内省过程,请运行以下命令:

    (undercloud)$ openstack baremetal introspection abort <node_uuid>

    您也可以等待操作过程超时。

    注意

    Red Hat OpenStack Platform director 在初始中止后重试内省三次。在每次尝试时均运行 openstack baremetal introspection abort 命令以完全中止内省。

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.