2.2. 设置您的数据科学项目
要实现数据科学工作流,您必须创建一个数据科学项目(如下所述)。通过项目,您可以和您的团队在分离的命名空间内组织并合作资源。从项目中,您可以创建多个工作台,每个工作台都有自己的 IDE 环境(如 JupyterLab),每个环境都有自己的连接和集群存储。另外,工作台可以使用管道和模型服务器共享模型和数据。
先决条件
开始之前,请先登录 Red Hat OpenShift AI。
流程
在导航菜单中,选择 Data Science projects。本页列出了您有权访问的任何现有项目。在此页面中,您可以选择现有项目(若有)或创建新项目。
注意您可以点击 Launch standalone workbench 按钮、选择 notebook 镜像并点 Start server 来启动 Jupyter 笔记本。但是,它是一个一次性的 Jupyter 笔记本,以隔离方式运行。
如果使用自己的 OpenShift 集群,请点击 Create project。
注意如果您使用 Red Hat Developer Sandbox,会为您提供一个默认的数据科学项目(如
myname-dev
)。选择它并跳至 Verification 部分。输入显示名称和描述。
- 点 Create。
验证
您可以看到项目的初始状态。单个标签页提供有关项目组件和项目访问权限的更多信息:
- 工作台 是您的开发和试验环境的实例。它们通常包含 IDE,如 JupyterLab、RStudio 和 Visual Studio Code。
- Pipelines 包含在项目中执行的数据科学管道。
- 通过 模型,您可以快速提供受培训的模式,以实现实时推测。每个数据科学项目可以有多个模型服务器。一个模型服务器可以托管多个模型。
- 集群存储是 一个持久性卷,用于保留您在工作台内处理的文件和数据。工作台可以访问一个或多个集群存储实例。
- 连接包含连接 数据源所需的配置参数,如 S3 对象存储桶。
- 权限 定义哪些用户和组可以访问项目。
后续步骤