2.2. 设置数据科学项目
开始之前,请确保您已登陆到 Red Hat OpenShift AI。
流程
在导航菜单中选择 Data Science Projects。本页列出了您可以访问的所有现有项目。在此页面中,您可以选择现有项目(若有)或创建新项目。
请注意,可以通过点 Launch Jupyter 链接来启动 Jupyter 笔记本。但是,它是一个一次性的 Jupyter 笔记本,以隔离方式运行。要实现数据科学工作流,您必须创建一个数据科学项目(如下所述)。通过项目,您的团队可在独立命名空间中组织并合作资源。从项目中,您可以创建多个工作台,每个工作台都有自己的 IDE 环境(如 JupyterLab),每个环境都有自己的数据连接和集群存储。另外,工作台还可以与管道和模型服务器共享模型和数据。
如果您使用 Red Hat Developer Sandbox,会为您提供一个默认的数据科学项目(如
myname-dev
)。选择它并跳至 Verification 部分。如果您使用自己的 OpenShift 集群,请点击 Create data Science project。
输入显示名称和描述。根据显示名称,会自动生成资源名称,但如果您愿意,可以更改它。
验证
现在,您可以看到项目的初始状态。单个标签页提供有关项目组件和项目访问权限的更多信息:
- 工作台是您开发和实验环境的实例。它们通常包含 IDE,如 JupyterLab、RStudio 和 Visual Studio Code。
- 管道 包含在项目内执行的数据科学项目。
- 通过 模型,您可以快速为实时推测提供受培训的模式。每个数据科学项目都有多个模型服务器。个模型服务器可以托管多个模型。
- 集群存储是 一个持久性卷,用于保留您在工作台中处理的文件和数据。工作台可以访问一个或多个集群存储实例。
- 数据连接 包含连接到数据源所需的配置参数,如 S3 对象存储桶。
- 权限 定义哪些用户和组可以访问项目。
后续步骤