2.2. 自定义功能存储配置
另外,您可以将以下配置应用到您的 Feature Store 实例中:
- 配置离线存储
- 配置在线存储
- 配置功能 registry
- 配置持久性卷声明(PVC)
- 配置基于角色的访问控制(RBAC)
以下部分中的示例描述了如何通过创建新的自定义资源定义(CRD)来自定义功能存储实例。或者,您可以自定义现有功能实例,如 编辑现有功能存储实例 中所述。
有关如何自定义功能存储配置的更多信息,请参阅 Feast API 文档。
2.2.1. 配置离线存储 复制链接链接已复制到粘贴板!
当您创建使用最小配置的 Feature Store 实例时,Feature Store 会默认使用基于 SQLite 文件的存储进行离线存储。
以下流程中的示例演示了如何为离线存储配置 DuckDB。
您可以配置其他离线存储,如 Snowflake、bigQuery、Redshift,如 Feast 参考文档用于离线存储。
以下流程中的示例代码要求您使用特定于您的用例的值编辑它。
先决条件
- 具有集群管理员特权。
- 您已启用了 Feature Store 组件,如 启用 Feature Store 组件 中所述。
-
您已创建了数据科学项目,如创建 数据科学项目 中所述。在以下步骤中,
my-ds-project是数据科学项目的名称。 - 您的数据科学项目包含一个现有 secret,它为访问您要用于离线存储的数据库提供凭证。以下流程中的示例要求您已配置了 DuckDB。
流程
-
在 OpenShift 控制台中,点 Quick Create (
)图标,然后点 Import YAML 选项。
- 验证您的数据科学项目是否为所选项目。
复制以下代码并将其粘贴到 YAML 编辑器中:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
编辑
services.offlineStore部分,以指定特定于您的用例的值。 - 点 Create。
验证
-
在 OpenShift 控制台中,选择 Workloads
Pods。 -
请确定您的项目(如
my-ds-project)已选中。 -
找到具有
feast-前缀的 pod,后跟您在 CRD 配置中指定的元数据名称,例如feast-sample-db-persistence。 - 验证状态为 Running。
2.2.2. 配置在线存储 复制链接链接已复制到粘贴板!
当您使用 minimal 配置创建 Feature Store 实例时,默认情况下,在线存储是 SQLite 数据库。
以下流程中的示例演示了如何为在线存储配置 PostgreSQL 数据库。
您可以配置其他在线存储,如 Snowflake、Redis 和 DynamoDB,如 在线存储的 Feast 参考文档中所述。
以下流程中的示例代码要求您使用特定于您的用例的值编辑它。
先决条件
- 具有集群管理员特权。
- 您已启用了 Feature Store 组件,如 启用 Feature Store 组件 中所述。
-
您已创建了数据科学项目,如创建 数据科学项目 中所述。在以下步骤中,
my-ds-project是数据科学项目的名称。 - 您的数据科学项目包含一个现有 secret,它为访问您要用于在线存储的数据库提供凭证。以下流程中的示例需要您已经配置了 PostgreSQL 数据库。
流程
-
在 OpenShift 控制台中,点 Quick Create (
)图标,然后点 Import YAML 选项。
- 验证您的数据科学项目是否为所选项目。
复制以下代码并将其粘贴到 YAML 编辑器中:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
编辑
services.onlineStore部分,以指定特定于您的用例的值。 - 点 Create。
验证
-
在 OpenShift 控制台中,选择 Workloads
Pods。 -
请确定您的项目(如
my-ds-project)已选中。 -
找到具有
feast-前缀的 pod,后跟您在 CRD 配置中指定的元数据名称,例如feast-sample-db-persistence。 - 验证状态为 Running。
2.2.3. 配置功能 registry 复制链接链接已复制到粘贴板!
默认情况下,当使用最小配置创建功能实例时,registry 是一个简单的 SQLite 数据库。
以下流程中的示例演示了如何配置 S3 registry。
您可以配置其他类型的 registry,如 GCS、SQL、Snowflake,如 Feast 参考文档中所述。
以下流程中的示例代码要求您使用特定于您的用例的值编辑它。
先决条件
- 具有集群管理员特权。
- 您已启用了 Feature Store 组件,如 启用 Feature Store 组件 中所述。
-
您已创建了数据科学项目,如创建 数据科学项目 中所述。在以下步骤中,
my-ds-project是数据科学项目的名称。 - 您的数据科学项目包含一个现有 secret,它为访问您要用于 registry 的数据库提供凭证。以下流程中的示例要求您已配置了 S3。
流程
-
在 OpenShift 控制台中,点 Quick Create (
)图标,然后点 Import YAML 选项。
- 验证您的数据科学项目是否为所选项目。
复制以下代码并将其粘贴到 YAML 编辑器中:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
编辑
services.registry部分,以指定特定于您的用例的值。 - 点 Create。
验证
-
在 OpenShift 控制台中,选择 Workloads
Pods。 -
请确定您的项目(如
my-ds-project)已选中。 -
找到具有
feast-前缀的 pod,后跟您在 CRD 配置中指定的元数据名称,如sample-s3-registry。 - 单击 feast pod,然后选择 Pod details。
- 点 Terminal。
在 Terminal 窗口中,输入以下命令查看配置,包括 S3 registry:
cat feature_store.yaml
$ cat feature_store.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow
2.2.4. PVC 配置示例 复制链接链接已复制到粘贴板!
当您配置在线存储、离线存储或 registry 时,您还可以配置持久性卷声明(PVC),如以下 Feature Store 自定义资源定义(CRD)示例所示。
以下示例代码要求您使用特定于您的用例的值编辑它。
2.2.5. 编辑现有功能存储实例 复制链接链接已复制到粘贴板!
本文档中的示例描述了如何通过创建新的自定义资源定义(CRD)来自定义 Feature Store 实例。或者,您可以自定义现有功能实例。
先决条件
- 具有集群管理员特权。
- 您已创建了 Feature Store 实例,如在数据科学项目中部署功能存储实例 中所述。
流程
-
在 OpenShift 控制台中,选择 Administration
CustomResourceDefinitions。 - 要过滤列表,请在 Search by Name 字段中输入 feature。
- 点 FeatureStore CRD,然后点 Instances。
- 选择您要编辑的实例,然后点 YAML。
- 在 YAML 编辑器中,编辑配置。
- 单击 Save,然后单击 Reload。
验证
Feature Store 实例 CRD 已被成功部署。