4.3. 使用数据连接
4.3.1. 在您的数据科学项目中添加数据连接
您可以通过添加与数据源的连接来提高数据科学项目。当您想要使用非常大的数据集时,您可以将数据存储在 Amazon Web Services (AWS) Simple Storage Service (S3)存储桶中,以便不会填满本地存储。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
)的一部分。 - 您已创建了数据科学项目,您可向其添加数据连接。
流程
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页面 将打开。
点您要添加数据连接的项目名称。
将打开项目的 Details 页面。
在 Data connection 部分点 Add data connection。
此时会打开 Add data connection 对话框。
- 输入数据连接的名称。
- 在 AWS_ACCESS_KEY_ID 字段中输入 Amazon Web Services 的访问密钥 ID。
- 为您在 AWS_SECRET_ACCESS_KEY_ID 字段中指定的帐户输入您的 secret 访问密钥。
- 在 AWS_S3_ENDPOINT 字段中输入 AWS S3 存储的端点。
- 在 AWS_DEFAULT_REGION 字段中输入 AWS 帐户的默认区域。
- 在 AWS_S3_BUCKET 字段中输入 AWS S3 存储桶的名称。
- 点 Add data connection。
验证
- 您添加的数据连接会出现在项目的 Details 页面中的 Data connections 部分。