6.2. 我的 Ray 集群处于失败状态
问题
您可能没有足够的资源。
诊断
Ray 集群 head pod 或 worker pod 没有运行。创建 Ray 集群时,它最初会进入 失败状态
。这个失败状态通常在协调过程完成并且 Ray 集群 pod 正在运行后解决。
解决方案
如果失败的状态仍然存在,请完成以下步骤:
- 在 OpenShift 控制台中,从 Project 列表中选择您的项目。
- 单击 Search,然后从 Resources 列表中选择 Pod。
- 点 pod 名称打开 Pod 详情页面。
- 点 Events 选项卡,并查看 pod 事件以确定问题的原因。
- 如果您无法解决这个问题,请联系您的管理员以请求帮助。