第 5 章 在 OpenShift Data Science 上提供的模型
当前,模型服务作为 Field Trial 功能提供。如需有关 Field Trial 状态范围的更多信息,请参阅 OpenShift Data Science 服务定义。
作为数据科学家,您可以部署受培训的计算机学习模型,为生产中的智能应用程序服务。部署完模型后,应用程序可以使用其部署的 API 端点向模型发送请求。
5.1. 配置模型服务器
5.1.1. 为您的数据科学项目配置模型服务器
在 OpenShift Data Science 上成功部署数据科学模型前,您必须配置模型服务器。这包括配置要部署的副本数量、服务器大小、令牌授权以及如何访问项目。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
)的一部分。 - 您已创建了可添加模型服务器的数据科学项目。
流程
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页面 将打开。
点击您要为其配置模型服务器的项目名称。
将打开项目的 Details 页面。
在 Models 和 model servers 部分中,点 Configure server。
此时会出现 Configure model server 对话框。
在 每个副本的计算资源 部分中配置项目的模型服务器。
- 选择 要部署的模型服务器 副本数。
为您的模型选择以下服务器大小之一:
- small
- Medium
- Large
- Custom
可选:如果您选择了 Custom,请在 Model server size 部分中配置以下设置以自定义模型服务器:
- 在 CPU 请求字段中,输入与模型一起使用的 CPU 数量。
- 在 CPU limit 字段中输入与您的型号一起使用的 CPU 数量上限。
- 在 Memory requested 字段中,以 GB (GB)输入模型服务器请求的内存。
- 在 Memory limit 字段中,以 GB (GB)输入模型服务器的最大内存限值。
- 可选: 选择 Model route 部分中的 external route 复选框提供的 Make deploy,使部署的模型可在外部使用。
可选: 选择 Token Authorization 部分中的 Require token authorization 复选框,将令牌身份验证应用到您的模型服务器。
- 编辑在 Token secret 字段中生成的令牌的服务帐户名称。当配置模型服务器时,生成的令牌会被创建并显示。
- 要添加额外服务帐户,请点击 Add a service account,然后在 Token secret 字段中输入相关信息。
验证
- 您配置的模型服务器会在项目的 Details 页面中的 Models 和 model servers 部分显示。
5.1.2. 更新模型服务器
您可以通过更改详情来更新数据科学项目的模型服务器,如部署的副本数、服务器大小、令牌授权以及如何访问项目。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
)的一部分。 - 您已创建了一个分配了模型服务器的数据科学项目。
流程
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页面 将打开。
点击您要更新模型服务器详情的项目的名称。
将打开项目的 Details 页面。
在 Models and model servers 部分,找到您要更新的型号服务器,然后点击操作菜单(⋮)→ Edit model server。
此时会打开 Configure model server 对话框。
更新模型服务器的属性。
- 选择 要部署的模型服务器 副本数。
为您的模型选择以下服务器大小之一:
- small
- Medium
- Large
- Custom
可选:如果您选择了 Custom,请在 Model server size 部分中配置以下设置以自定义模型服务器:
- 在 CPU 请求字段中,输入与模型一起使用的 CPU 数量。
- 在 CPU limit 字段中输入与您的型号一起使用的 CPU 数量上限。
- 在 Memory requested 字段中,以 GB (GB)输入模型服务器请求的内存。
- 在 Memory limit 字段中,以 GB (GB)输入模型服务器的最大内存限值。
- 可选: 选择 Model route 部分中的 external route 复选框提供的 Make deploy,使部署的模型可在外部使用。
可选: 选择 Token Authorization 部分中的 Require token authorization 复选框,将令牌身份验证应用到您的模型服务器。
- 编辑在 Token secret 字段中生成的令牌的服务帐户名称。当配置模型服务器时,生成的令牌会被创建并显示。
- 要添加额外服务帐户,请点击 Add a service account,然后在 Token secret 字段中输入相关信息。
- 单击 配置。
验证
- 您更新的模型服务器会在项目的 Details 页面中的 Models 和 model servers 部分显示。
5.1.3. 删除模型服务器
您可以删除分配给托管数据科学项目的模型服务器。这可让您删除不再需要的模型服务器。如果您删除项目的模型服务器,则服务器托管的模型将无法使用。红帽建议您在删除模型服务器前建议这些模型的用户。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
)的一部分。 - 您已创建了数据科学项目和关联的模型服务器。
流程
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页面 将打开。
点击您要从中删除模型服务器的项目的名称。
将打开项目的 Details 页面。
点击您要在 Models 和 model servers 部分删除的项目旁的操作菜单(swagger),然后点击 Delete model server。
此时会打开 Delete model server 对话框。
- 在文本字段中输入模型服务器的名称,以确认您想要删除它。
- 点 Delete model server。
验证
- 您删除的模型服务器不再显示在项目 Details 页面中的 Models 和 model servers 部分中。