第 5 章 创建项目工作台
要在隔离的区域中检查和使用数据模型,您可以创建一个工作台。此工作台可让您从现有笔记本容器镜像创建一个新的 Jupyter 笔记本,以访问其资源和属性。对于需要保留数据的数据科学项目,您可以在您要创建的工作台中添加容器存储。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
或rhods-admin
)的一部分。 - 您已创建了一个数据科学项目,您可向其中添加工作台。
步骤
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页将打开。
点您要将工作台添加到的项目的名称。
将打开项目的 Details 页面。
在 Workbenches 部分中,点 Create workbench。
Create workbench 页面将打开。
配置您要创建的工作台的属性。
- 输入工作台的名称。
- 输入工作台的描述。
- 选择用于工作台服务器的笔记本镜像。
- 为服务器选择容器大小。
- 可选:选择并指定任何新的环境变量的值。
配置 OpenShift Data Science 集群的存储。
- 选择 Create new persistent storage 来创建在从 OpenShift Data Science 后保留的存储。填写相关字段以定义存储。
- 选择 Use existing persistent storage 来重新使用现存的存储,然后从 Persistent storage 列表中选择存储。
- 点 Create workbench。
验证
- 您创建的工作台会出现在项目的 Details 页面中。
- 您在创建过程中与工作台关联的任何集群存储都会出现在项目的 Details 页面中。
- Status 列位于 Details 页面的 Workbenches 部分中,在工作台服务器启动时显示 Starting 状态,并在工作台成功启动时显示 Running。
5.1. 启动 Jupyter 并启动笔记本服务器
启动 Jupyter 并启动笔记本服务器以使用您的笔记本。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
您知道笔记本服务器环境中要用于任何环境变量的名称和值,例如
AWS_SECRET_ACCESS_KEY
。 - 如果您需要使用非常大的数据集,请与管理员合作主动提高笔记本服务器的存储容量。
步骤
- 在 Enabled applications 页面中找到 Jupyter 卡。
点 Launch application。
如果您看到 Access 权限所需的 消息,代表您不在 OpenShift Data Science 的默认用户组或默认管理员组中。请联络您的管理员,将您加入到正确的组中(根据 Adding users for OpenShift Data Science.)
如果您之前没有授权
jupyter-nb-<username>
服务帐户来访问您的帐户,则 Authorize Access 页面会显示提示您提供授权。检查默认选择的权限,然后单击 Allow selected permissions 按钮。如果接受凭证,记事本服务器控制面板将打开开始一个笔记本服务器页面。
启动一个笔记本服务器。
如果您之前打开了 Jupyter,则不需要此项。
- 选择用于您的服务器的笔记本镜像。
如果笔记本镜像包含多个版本,请从 Versions 部分中选择笔记本镜像的版本。
注意当发布新版本的笔记本镜像时,上一版本仍然可用并被支持。这为您提供将工作迁移到最新版本的笔记本镜像。
- 为您的服务器选择容器大小。
可选:为您的服务器选择 GPU 数 (图像处理单元)。
重要只有在 PyTorch、TensorFlow 和 CUDA 笔记本服务器镜像中才支持使用 GPU 来加快工作负载性能。另外,只有在集群中启用了 GPU 时,您可以指定笔记本服务器所需的 GPU 数量。要了解如何启用 GPU 支持,请参阅在 OpenShift Data Science 中启用 GPU 支持。
可选:选择并指定任何新的环境变量的值。
这个接口会存储这些变量,以便您只需要输入一次。为经常集成的环境和框架(如 Amazon Web Services(AWS))自动提供常见环境变量的变量名称示例。
重要确保您为具有敏感值(如密码)的敏感值选择 Secret 复选框。
- 可选:如果需要,选择 Start server in current tab。
单击 Start server。
此时会显示 Starting server 进程的状态。点 Expand 事件日志,以查看服务器创建流程的附加信息。根据您请求的部署大小和资源,启动服务器可能需要几分钟的时间。点 Cancel 以取消服务器创建。
服务器启动后,您会看到以下行为之一:
- 如果您之前选择了 Start server in current tab,则 JupyterLab 界面会在 Web 浏览器的当前标签页中打开。
如果您之前没有选中 Start server in current tab,则启动服务器对话框会提示您在新浏览器标签页或当前标签页中打开服务器。
JupyterLab 接口根据您的选择打开。
验证
- 此时会打开 JupyterLab 接口。
其他资源
故障排除
- 如果您遇到 "Unable to load notebook server configuration options" 错误信息,请联系您的管理员来检查与您的 Jupyter pod 相关的日志信息,以进一步分析存在的问题。