7.8. 对数据平面创建和部署进行故障排除
要在服务没有正确部署或运行时对部署进行故障排除,您可以检查该服务的作业条件消息,您可以检查节点集的日志。
7.8.1. 检查服务的作业条件消息 复制链接链接已复制到粘贴板!
环境中的每个数据平面部署都有关联的服务。每个服务都有与为该服务执行的 AnsibleEE 作业的当前状态匹配的作业条件消息。当服务没有正确部署或运行时,您可以使用这些信息来对部署进行故障排除。
流程
确定所有部署的名称和状态:
oc get openstackdataplanedeployment
$ oc get openstackdataplanedeployment
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下示例输出显示了当前正在进行的两个部署:
oc get openstackdataplanedeployment
$ oc get openstackdataplanedeployment NAME NODESETS STATUS MESSAGE data-plane-deploy ["openstack-compute-nodes"] False Deployment in progress data-plane-deploy ["openstack-networker-nodes"] False Deployment in progress
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 确定所有服务及其作业条件的名称和状态:
oc get openstackansibleee
$ oc get openstackansibleee
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下示例输出显示了所有当前部署的所有服务及其作业状况:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 有关作业条件消息的详情,请查看 作业条件消息。
过滤特定部署的名称和服务:
oc get openstackansibleee -l \ openstackdataplanedeployment=<deployment_name>
$ oc get openstackansibleee -l \ openstackdataplanedeployment=<deployment_name>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将
<deployment_name
> 替换为用来过滤服务列表的部署名称。以下示例过滤列表仅显示
data-plane-deploy
部署的服务和其作业条件:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
7.8.1.1. 作业情况消息 复制链接链接已复制到粘贴板!
AnsibleEE 作业关联条件消息,指示服务作业的当前状态。此条件消息显示在 oc get job <job_name>
; 命令的输出的 MESSAGE
字段中。查询时,作业会返回以下条件之一:
-
Job not started
: 作业尚未启动。 -
Job not found
: 无法找到作业。 -
作业正在运行
:作业当前正在运行。 -
作业完成
:作业执行已完成。 -
作业错误发生 <error_message>
; :作业停止意外执行。<error_message
> 替换为特定的错误消息。
要进一步调查显示特定作业条件消息的服务,请使用 oc logs job/<service> 命令查看其日志
。例如,若要查看 repo-setup-openstack-edpm
服务的日志,请使用 oc logs job/repo-setup-openstack-edpm
命令。
7.8.2. 检查节点集的日志 复制链接链接已复制到粘贴板!
您可以访问节点集的日志,以检查部署问题。
流程
检索带有
OpenStackAnsibleEE
标签的 pod:oc get pods -l app=openstackansibleee
$ oc get pods -l app=openstackansibleee configure-network-edpm-compute-j6r4l 0/1 Completed 0 3m36s validate-network-edpm-compute-6g7n9 0/1 Pending 0 0s validate-network-edpm-compute-6g7n9 0/1 ContainerCreating 0 11s validate-network-edpm-compute-6g7n9 1/1 Running 0 13s
Copy to Clipboard Copied! Toggle word wrap Toggle overflow SSH 到要检查的 pod:
正在运行的 Pod:
oc rsh validate-network-edpm-compute-6g7n9
$ oc rsh validate-network-edpm-compute-6g7n9
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 没有运行的 Pod:
oc debug configure-network-edpm-compute-j6r4l
$ oc debug configure-network-edpm-compute-j6r4l
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
列出
/runner/artifacts
挂载中的目录:ls /runner/artifacts
$ ls /runner/artifacts configure-network-edpm-compute validate-network-edpm-compute
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 查看所需工件的
stdout
:cat /runner/artifacts/configure-network-edpm-compute/stdout
$ cat /runner/artifacts/configure-network-edpm-compute/stdout
Copy to Clipboard Copied! Toggle word wrap Toggle overflow