7.8. 对数据平面创建和部署进行故障排除


要在服务没有正确部署或运行时对部署进行故障排除,您可以检查该服务的作业条件消息,您可以检查节点集的日志。

7.8.1. 检查服务的作业条件消息

环境中的每个数据平面部署都有关联的服务。每个服务都有与为该服务执行的 AnsibleEE 作业的当前状态匹配的作业条件消息。当服务没有正确部署或运行时,您可以使用这些信息来对部署进行故障排除。

流程

  1. 确定所有部署的名称和状态:

    $ oc get openstackdataplanedeployment
    Copy to Clipboard Toggle word wrap

    以下示例输出显示了当前正在进行的两个部署:

    $ oc get openstackdataplanedeployment
    
    NAME              NODESETS                       STATUS  MESSAGE
    data-plane-deploy ["openstack-compute-nodes"]    False   Deployment in progress
    data-plane-deploy ["openstack-networker-nodes"]  False   Deployment in progress
    Copy to Clipboard Toggle word wrap
  2. 确定所有服务及其作业条件的名称和状态:

    $ oc get openstackansibleee
    Copy to Clipboard Toggle word wrap

    以下示例输出显示了所有当前部署的所有服务及其作业状况:

    $ oc get openstackansibleee
    
    NAME                             NETWORKATTACHMENTS   STATUS   MESSAGE
    bootstrap-openstack-edpm         ["ctlplane"]         True     Job complete
    download-cache-openstack-edpm    ["ctlplane"]         False    Job is running
    repo-setup-openstack-edpm        ["ctlplane"]         True     Job complete
    validate-network-another-osdpd   ["ctlplane"]         False    Job is running
    Copy to Clipboard Toggle word wrap

    有关作业条件消息的详情,请查看 作业条件消息

  3. 过滤特定部署的名称和服务:

    $ oc get openstackansibleee -l \
    openstackdataplanedeployment=<deployment_name>
    Copy to Clipboard Toggle word wrap
    • <deployment_name > 替换为用来过滤服务列表的部署名称。

      以下示例过滤列表仅显示 data-plane-deploy 部署的服务和其作业条件:

      $ oc get openstackansibleee -l \
      openstackdataplanedeployment=data-plane-deploy
      
      NAME                            NETWORKATTACHMENTS   STATUS   MESSAGE
      bootstrap-openstack-edpm        ["ctlplane"]         True     Job complete
      download-cache-openstack-edpm   ["ctlplane"]         False    Job is running
      repo-setup-openstack-edpm       ["ctlplane"]         True     Job complete
      Copy to Clipboard Toggle word wrap

7.8.1.1. 作业情况消息

AnsibleEE 作业关联条件消息,指示服务作业的当前状态。此条件消息显示在 oc get job <job_name&gt; 命令的输出的 MESSAGE 字段中。查询时,作业会返回以下条件之一:

  • Job not started: 作业尚未启动。
  • Job not found: 无法找到作业。
  • 作业正在运行 :作业当前正在运行。
  • 作业完成 :作业执行已完成。
  • 作业错误发生 <error_message&gt; :作业停止意外执行。& lt;error_message > 替换为特定的错误消息。

要进一步调查显示特定作业条件消息的服务,请使用 oc logs job/<service> 命令查看其日志。例如,若要查看 repo-setup-openstack-edpm 服务的日志,请使用 oc logs job/repo-setup-openstack-edpm 命令。

7.8.2. 检查节点集的日志

您可以访问节点集的日志,以检查部署问题。

流程

  1. 检索带有 OpenStackAnsibleEE 标签的 pod:

    $ oc get pods -l app=openstackansibleee
    configure-network-edpm-compute-j6r4l   0/1     Completed           0          3m36s
    validate-network-edpm-compute-6g7n9    0/1     Pending             0          0s
    validate-network-edpm-compute-6g7n9    0/1     ContainerCreating   0          11s
    validate-network-edpm-compute-6g7n9    1/1     Running             0          13s
    Copy to Clipboard Toggle word wrap
  2. SSH 到要检查的 pod:

    1. 正在运行的 Pod:

      $ oc rsh validate-network-edpm-compute-6g7n9
      Copy to Clipboard Toggle word wrap
    2. 没有运行的 Pod:

      $ oc debug configure-network-edpm-compute-j6r4l
      Copy to Clipboard Toggle word wrap
  3. 列出 /runner/artifacts 挂载中的目录:

    $ ls /runner/artifacts
    configure-network-edpm-compute
    validate-network-edpm-compute
    Copy to Clipboard Toggle word wrap
  4. 查看所需工件的 stdout

    $ cat /runner/artifacts/configure-network-edpm-compute/stdout
    Copy to Clipboard Toggle word wrap
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat