7.3. 在 Red Hat OpenShift AI 2.19.0 中解决的问题(April 2025)
当使用带有 TensorFlow 2024.1 笔记本镜像的 Elyra JupyterLab 扩展时,无法配置 RHOAIENG-64 86- Pod 标签、注解和容限。
在以前的版本中,使用基于 TensorFlow 的工作台镜像不允许用户在使用 Elyra JupyterLab 扩展时使用 pod 标签、注解和容限。使用 2025.1 镜像时,基于 TensorFlow 的工作台使用 Kubeflow pipeline SDK (kfp)升级。使用升级的 SDK 时,您可以在使用 Elyra 扩展来调度 Data Science 管道时设置 pod 标签、注解和容限。
当在启用了 FIPS 的集群中的 AMD GPU 加速器中使用 vLLM 运行时时,RHOAIENG-21197 - 部署失败
在以前的版本中,当在启用了 FIPS 的集群中的 AMD GPU 加速器中使用 vLLM 运行时部署模型时,部署可能会失败。这个问题现已解决。
RHOAIENG-202 45- Certain model registry 操作从注册的模型和版本中删除自定义属性
在以前的版本中,编辑模型版本的描述、标签或属性从关联的模型中删除标签和自定义属性。部署模型版本,或编辑其模型源格式,从版本和关联的模型中删除标签和自定义属性。这个问题现已解决。
RHOAIENG-19954- Kueue 在 OpenShift 中没有监控的警报
在以前的版本中,在 OpenShift 控制台中,Kueue 警报不会被监控。新的 ServiceMonitor
资源拒绝使用 BearerTokenFile
字段,这意味着 Prometheus 没有提取目标所需的权限。因此,Kueue 警报不会在 Observe
RHOAIENG-1971 6- 使用控制面板无法删除 system-authenticated
用户组
在以前的版本中,在安装或升级 Red Hat OpenShift AI 后,system-authenticated
用户组会显示在 Data Science 用户组 下的 Settings > User management 中。如果您从 Data Science 用户组中删除了这个用户组 并保存更改,则组被错误地添加。这个问题现已解决。
RHOAIENG-182 38- Inference 端点在升级 Authorino Operator 后返回 403 错误
在以前的版本中,在升级 Authorino Operator 后,可能无法重新应用自动 Istio sidecar 注入。如果没有 sidecar,则 Authorino 没有正确集成到服务网格中,并导致 inference 端点请求失败,并显示 HTTP 403 错误。这个问题现已解决。
RHOAIENG-1137 1- 使用 ExitHandler 报告运行状态
在以前的版本中,当使用管道退出处理程序(dsl.ExitHandler
)时,如果句柄中的某个任务失败,但退出任务成功时,整个管道运行状态不准确报告为 Succeeded
,而不是 Failed
。这个问题现已解决。
从模型 registry 部署模型时,RHOAIENG-161 46- Connection 有时不会预先选择
在以前的版本中,当从模型 registry 部署模型时,对象存储 连接 (以前称为 数据连接)可能没有被预先选择。这个问题现已解决。
当参数 sdg_repo_pr 留空时,无法创建 RHOAIENG-21068 - InstructLab pipeline run
在以前的版本中,当创建 InstructLab 管道的管道运行时,如果参数 sdg_repo_pr
留空,则无法创建管道运行,并会出现错误消息。这个问题现已解决。