2.2. 设置数据科学项目
要实现数据科学工作流,您必须创建一个数据科学项目(如下所述)。项目有助于您的团队在分离的命名空间内组织并合作资源。从项目中,您可以创建许多工作台,每个工作台都有自己的 IDE 环境(如 JupyterLab),每个环境都有自己的连接和集群存储。另外,工作台还可以与管道和模型服务器共享模型和数据。
先决条件
- 您已登陆到 Red Hat OpenShift AI。
流程
- 在导航菜单中,选择 Data Science projects。本页列出了您可以访问的所有现有项目。
如果您使用 Red Hat Developer Sandbox,它提供了一个默认的数据科学项目(如
myname-dev)。选择它并跳至 Verification 部分。如果使用自己的 OpenShift 集群,您可以选择现有项目(若有)或创建新项目。点 Create project。
注意您可以点 Start basic workbench 按钮、选择 notebook 镜像并点 Start server 来启动 Jupyter 笔记本。然而,在这种情况下,它是一个一次性 Jupyter 笔记本,以隔离方式运行。
在 Create project 部分,输入显示名称和描述。
- 点 Create。
验证
您可以看到项目的初始状态。单个标签页显示有关项目组件和项目访问权限的更多信息:
- 工作台是您开发和实验环境的实例。它们通常包含单个开发环境(IDE),如 JupyterLab、RStudio 和 Visual Studio Code。
- 管道包含在项目中运行的数据科学项目。
- 用于 快速为实时推测提供受培训模型的模型。每个数据科学项目可以有多个模型服务器。一个模型服务器可以托管多种模型。
- 集群存储是 一个持久性卷,用于保留您在工作台中处理的文件和数据。工作台可以访问一个或多个集群存储实例。
- 连接 包含连接到数据源所需的配置参数,如 S3 对象存储桶。
- 权限 定义哪些用户和组可以访问项目。
后续步骤