2.2. 设置您的数据科学项目

要实现数据科学工作流，您必须创建一个数据科学项目（如下所述）。通过项目，您可以和您的团队在分离的命名空间内组织并合作资源。从项目中，您可以创建多个工作台，每个工作台都有自己的 IDE 环境（如 JupyterLab），每个环境都有自己的连接和集群存储。另外，工作台可以使用管道和模型服务器共享模型和数据。

先决条件

开始之前，请先登录 Red Hat OpenShift AI。

流程

在导航菜单中，选择 Data Science projects。本页列出了您有权访问的任何现有项目。在此页面中，您可以选择现有项目（若有）或创建新项目。

View larger image

注意
您可以点击 Launch standalone workbench 按钮、选择 notebook 镜像并点 Start server 来启动 Jupyter 笔记本。但是，它是一个一次性的 Jupyter 笔记本，以隔离方式运行。
如果使用自己的 OpenShift 集群，请点击 Create project。
注意
如果您使用 Red Hat Developer Sandbox，会为您提供一个默认的数据科学项目（如 myname-dev）。选择它并跳至 Verification 部分。
输入显示名称和描述。

View larger image
点 Create。

验证

您可以看到项目的初始状态。单个标签页提供有关项目组件和项目访问权限的更多信息：

工作台 是您的开发和试验环境的实例。它们通常包含 IDE，如 JupyterLab、RStudio 和 Visual Studio Code。
Pipelines 包含在项目中执行的数据科学管道。
通过模型，您可以快速提供受培训的模式，以实现实时推测。每个数据科学项目可以有多个模型服务器。一个模型服务器可以托管多个模型。
集群存储是 一个持久性卷，用于保留您在工作台内处理的文件和数据。工作台可以访问一个或多个集群存储实例。
连接包含连接 数据源所需的配置参数，如 S3 对象存储桶。
权限定义哪些用户和组可以访问项目。

后续步骤

使用连接存储数据

2.2. 设置您的数据科学项目

学习

尝试、购买和销售

社区

关于红帽文档

让开源更具包容性

關於紅帽

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links