6.9. Kueue 置备的 pod 在拉取前终止
问题
Kueue 会在将工作负载标记为就绪前等待一段时间,以便启用所有工作负载 pod 被置备并运行。默认情况下,Kue 会等待 5 分钟。如果 pod 镜像非常大,且仍然在 5 分钟等待期限后被拉取,Kue 会失败并终止相关的 pod。
诊断
- 在 OpenShift 控制台中,从 Project 列表中选择您的项目。
- 单击 Search,然后从 Resources 列表中选择 Pod。
- 单击 Ray head pod 名称,以打开 pod 详情页面。
- 点 Events 选项卡,并查看 pod 事件来检查镜像拉取是否已成功完成。
解决方案
如果 pod 需要超过 5 分钟才能拉取镜像,请联系您的管理员请求协助。