2.2. 设置数据科学项目
要实现数据科学工作流,您必须创建一个数据科学项目(如下所述)。通过项目,您的团队可在独立命名空间中组织并合作资源。从项目中,您可以创建多个工作台,每个工作台都有自己的 IDE 环境(如 JupyterLab),每个环境都有自己的连接和集群存储。另外,工作台还可以与管道和模型服务器共享模型和数据。
先决条件
- 您已登陆到 Red Hat OpenShift AI。
流程
- 在导航菜单中,选择 Data Science projects。本页列出了您可以访问的所有现有项目。
如果您使用 Red Hat Developer Sandbox,它提供了一个默认的数据科学项目(如
myname-dev
)。选择它并跳至 Verification 部分。如果使用自己的 OpenShift 集群,您可以选择现有项目(若有)或创建新项目。点 Create project。
注意您可以点击 Launch standalone workbench 按钮、选择 notebook 镜像并点 Start server 来启动 Jupyter 笔记本。但是,它是一个一次性的 Jupyter 笔记本,以隔离方式运行。
在 Create project 部分,输入显示名称和描述。
- 点 Create。
验证
您可以看到项目的初始状态。单个标签页提供有关项目组件和项目访问权限的更多信息:

- 工作台是您开发和实验环境的实例。它们通常包含 IDE,如 JupyterLab、RStudio 和 Visual Studio Code。
- 管道 包含在项目内执行的数据科学项目。
- 通过 模型,您可以快速为实时推测提供受培训的模式。每个数据科学项目都有多个模型服务器。个模型服务器可以托管多个模型。
- 集群存储是 一个持久性卷,用于保留您在工作台中处理的文件和数据。工作台可以访问一个或多个集群存储实例。
- 连接包含连接 数据源所需的配置参数,如 S3 对象存储桶。
- 权限 定义哪些用户和组可以访问项目。
后续步骤