4.5. 配置模型服务器
4.5.1. 为您的数据科学项目配置模型服务器
在 OpenShift Data Science 上成功部署数据科学模型前,您必须配置模型服务器。这包括配置要部署的副本数量、服务器大小、令牌授权以及如何访问项目。
先决条件
- 您已登陆到 Red Hat OpenShift Data Science。
-
如果您使用专用的 OpenShift Data Science 组,则作为 OpenShift 中的用户组或 admin 组(如
rhods-users
)的一部分。 - 您已创建了可添加模型服务器的数据科学项目。
流程
在 OpenShift Data Science 仪表板中,点 Data Science Projects。
Data Science 项目页面 将打开。
点击您要为其配置模型服务器的项目名称。
将打开项目的 Details 页面。
在 Models 和 model servers 部分中,点 Configure server。
此时会出现 Configure model server 对话框。
在 每个副本的计算资源 部分中配置项目的模型服务器。
- 选择 要部署的模型服务器 副本数。
为您的模型选择以下服务器大小之一:
- small
- Medium
- Large
- Custom
可选:如果您选择了 Custom,请在 Model server size 部分中配置以下设置以自定义模型服务器:
- 在 CPU 请求字段中,输入与模型一起使用的 CPU 数量。
- 在 CPU limit 字段中输入与您的型号一起使用的 CPU 数量上限。
- 在 Memory requested 字段中,以 GB (GB)输入模型服务器请求的内存。
- 在 Memory limit 字段中,以 GB (GB)输入模型服务器的最大内存限值。
- 可选: 选择 Model route 部分中的 external route 复选框提供的 Make deploy,使部署的模型可在外部使用。
可选: 选择 Token Authorization 部分中的 Require token authorization 复选框,将令牌身份验证应用到您的模型服务器。
- 编辑在 Token secret 字段中生成的令牌的服务帐户名称。当配置模型服务器时,生成的令牌会被创建并显示。
- 要添加额外服务帐户,请点击 Add a service account,然后在 Token secret 字段中输入相关信息。
验证
- 您配置的模型服务器会在项目的 Details 页面中的 Models 和 model servers 部分显示。