5.8. 对数据平面创建和部署进行故障排除
要在服务没有正确部署或运行时对部署进行故障排除,您可以检查该服务的作业条件消息,您可以检查节点集的日志。
5.8.1. 检查服务的作业条件消息 复制链接链接已复制到粘贴板!
环境中的每个数据平面部署都有关联的服务。每个服务都有与为该服务执行的 AnsibleEE 作业的当前状态匹配的作业条件消息。当服务没有正确部署或运行时,您可以使用这些信息来对部署进行故障排除。
流程
确定所有部署的名称和状态:
$ oc get openstackdataplanedeployment以下示例输出显示了当前正在进行的两个部署:
$ oc get openstackdataplanedeployment NAME NODESETS STATUS MESSAGE edpm-compute ["openstack-edpm-ipam"] False Deployment in progress检索并检查 Ansible 执行的作业。
Kubernetes 作业使用
OpenStackDataPlaneDeployment的名称标记。您可以使用标签列出每个OpenStackDataPlaneDeployment的作业:$ oc get job -l openstackdataplanedeployment=edpm-compute NAME STATUS COMPLETIONS DURATION AGE bootstrap-edpm-compute-openstack-edpm-ipam Complete 1/1 78s 25h configure-network-edpm-compute-openstack-edpm-ipam Complete 1/1 37s 25h configure-os-edpm-compute-openstack-edpm-ipam Complete 1/1 66s 25h download-cache-edpm-compute-openstack-edpm-ipam Complete 1/1 64s 25h install-certs-edpm-compute-openstack-edpm-ipam Complete 1/1 46s 25h install-os-edpm-compute-openstack-edpm-ipam Complete 1/1 57s 25h libvirt-edpm-compute-openstack-edpm-ipam Complete 1/1 2m37s 25h neutron-metadata-edpm-compute-openstack-edpm-ipam Complete 1/1 61s 25h nova-edpm-compute-openstack-edpm-ipam Complete 1/1 3m20s 25h ovn-edpm-compute-openstack-edpm-ipam Complete 1/1 78s 25h run-os-edpm-compute-openstack-edpm-ipam Complete 1/1 33s 25h ssh-known-hosts-edpm-compute Complete 1/1 19s 25h telemetry-edpm-compute-openstack-edpm-ipam Complete 1/1 2m5s 25h validate-network-edpm-compute-openstack-edpm-ipam Complete 1/1 16s 25h您可以使用
oc logs -f job/<job-name> 来检查日志,例如,如果要检查 configure-network 作业的日志:$ oc logs -f jobs/configure-network-edpm-compute-openstack-edpm-ipam | tail -n2 PLAY RECAP ********************************************************************* edpm-compute-0 : ok=22 changed=0 unreachable=0 failed=0 skipped=17 rescued=0 ignored=0
5.8.1.1. 作业情况消息 复制链接链接已复制到粘贴板!
AnsibleEE 作业关联条件消息,指示服务作业的当前状态。此条件消息显示在 oc get job <job_name> 命令的输出的 MESSAGE 字段中。查询时,作业会返回以下条件之一:
-
Job not started: 作业尚未启动。 -
Job not found: 无法找到作业。 -
作业正在运行:作业当前正在运行。 -
作业完成:作业执行已完成。 -
作业错误发生 <error_message> :作业停止意外执行。<error_message> 替换为特定的错误消息。
要进一步调查显示特定作业条件消息的服务,请使用 oc logs job/<service> 命令查看其日志。例如,若要查看 repo-setup-openstack-edpm 服务的日志,请使用 oc logs job/repo-setup-openstack-edpm 命令。
5.8.2. 检查节点集的日志 复制链接链接已复制到粘贴板!
您可以访问节点集的日志,以检查部署问题。
流程
检索带有
OpenStackAnsibleEE标签的 pod:$ oc get pods -l app=openstackansibleee configure-network-edpm-compute-j6r4l 0/1 Completed 0 3m36s validate-network-edpm-compute-6g7n9 0/1 Pending 0 0s validate-network-edpm-compute-6g7n9 0/1 ContainerCreating 0 11s validate-network-edpm-compute-6g7n9 1/1 Running 0 13sSSH 到要检查的 pod:
正在运行的 Pod:
$ oc rsh validate-network-edpm-compute-6g7n9没有运行的 Pod:
$ oc debug configure-network-edpm-compute-j6r4l
列出
/runner/artifacts挂载中的目录:$ ls /runner/artifacts configure-network-edpm-compute validate-network-edpm-compute查看所需工件的
stdout:$ cat /runner/artifacts/configure-network-edpm-compute/stdout