6.2. 用户的笔记本服务器没有启动
问题
托管用户笔记本服务器的 OpenShift Dedicated 集群可能无法访问充足的资源,或者 Jupyter pod 可能出现问题。
诊断
- 登录到 OpenShift Dedicated Web 控制台。
删除并重启此用户的笔记本服务器 Pod。
-
点 Workloads
Pods,将项目设置为 rhods-notebooks
。 搜索属于此用户的笔记本服务器 pod,例如
jupyter-nb-<username>-*
。如果笔记本服务器 pod 存在,则笔记本服务器 pod 中可能会出现间歇性失败。
如果用户的笔记本服务器 pod 不存在,请继续诊断。
-
点 Workloads
根据所选笔记本服务器镜像所需的资源,检查 OpenShift 集群中当前可用的资源。
如果有足够 CPU 和 RAM 的 worker 节点可用于在集群中调度,请继续诊断过程。
- 检查 Jupyter pod 的状态。
解决方案
如果笔记本服务器 pod 出现间歇性失败:
- 删除属于用户的笔记本服务器 pod。
- 询问用户再次启动其笔记本服务器。
- 如果笔记本服务器没有足够的资源来运行所选笔记本服务器镜像,请将更多资源添加到 OpenShift 集群,或者选择较小的镜像大小。
如果 Jupyter pod 处于 FAILED 状态:
-
检索
jupyter-nb-*
pod 的日志,并将其发送到红帽支持以进行进一步评估。 -
删除
jupyter-nb-*
pod。
-
检索
- 如果没有以前的解决方案,请联系红帽支持。