第 6 章 已解决的问题
以下显著问题在 Red Hat OpenShift AI 2.24 中解决。Red Hat OpenShift AI 2.24 的安全更新、程序错误修正和增强将会作为异步勘误发布。所有 OpenShift AI 勘误公告都发布 在红帽客户门户上。
6.1. 在 Red Hat OpenShift AI 2.24 中解决的问题 复制链接链接已复制到粘贴板!
OCPBUGS-4443 2- ImageStream 无法在断开连接的 OpenShift 环境中导入镜像标签
在此次更新之前,如果您在断开连接的 OpenShift 环境中使用了 ImageTagMirrorSet
(ITMS)或 ImageDigestMirrorSet
(IDMS),则 ImageStream 资源会阻止镜像导入镜像,且无法创建 RHOAI workbench 实例。这个问题已在 OpenShift Container Platform 4.19.13 或更高版本中解决。将 OpenShift 实例更新至 4.19.13 或更高版本,以避免出现这个问题。
升级后,在重启循环中 RHOAIENG-29729 - Model registry Operator
从启用了模型 registry 组件的 OpenShift AI 2.22 或更早版本升级后,模型 registry Operator 可能会进入重启循环。这是因为 model-registry-operator-controller-manager
pod 中 manager 容器的内存限值不足。这个问题现已解决。
RHOAIENG-31248 - KServe http: TLS 握手错误
在以前的版本中,localmodelcache
验证 Webhook 配置中的 OpenShift CA auto-injection 缺少必要的注解,从而导致重复使用 TLS 握手错误。这个问题现已解决。
RHOAIENG-31376 - Inference 服务创建使用 vLLM 运行时在 IBM Power 集群中失败
在以前的版本中,当您试图在 IBM Power 集群上使用 vLLM 运行时创建 inference 服务时,会失败并显示以下错误: OpNamespace' '_C_utils' 对象没有属性 'init_cpu_threads_env
错误。这个问题现已解决。
RHOAIENG-31377 - Inference 服务创建在 IBM Power 集群上失败
在以前的版本中,当您试图在 IBM Power 集群上使用 vLLM 运行时创建 inference 服务时,会失败并显示以下错误:ValueError : 'aimv2' 已由 Transformers 配置使用,选择另一个名称
。这个问题现已解决。
RHOAIENG-31498 - 在 LlamaStack LMEval 提供商中的破坏 URL
在此次更新之前,当使用 LMEval 供应商在 Llama Stack 上运行评估时,评估作业会错误地将模型服务器端点用作 v1/openai/v1/completions
。这会导致作业失败,因为正确的模型服务器端点是 v1/completions
。这个问题现已解决。
RHOAIENG- 31536- Prometheus 配置没有正确协调
在此次更新之前,监控资源没有正确协调,并在升级到或安装 2.23 时显示 "Not Ready" 状态。出现这个问题的原因是,即使没有新的监控或追踪配置被添加到 DSCInitialization
资源中,也需要安装 OpenTelemetry 和 Cluster Observability Operator。因此,Prometheus 配置没有协调,并导致空或过时的警报配置。这个问题现已解决。
RHOAIENG-414 8- Standalone notebook 无法启动,因为字符长度
在以前的版本中,在笔记本控制器逻辑试图创建资源前不会主动检查用户名长度。笔记本控制器直接使用您的用户名创建 OpenShift 资源。因此,如果 OpenShift Route 和命名空间的组合名称超过 DNS 子域的 63 个字符限制,则 OpenShift Route 的创建会失败,并显示以下错误验证错误: spec.host: ... 不得超过 63 个字符
。如果没有路由,无法配置依赖的 OAuthClient,并且工作台无法启动。
在这个版本中,笔记本控制器的逻辑已被更新,以便在创建资源前主动检查名称字符长度。对于 Routes,如果笔记本名称和命名空间的组合长度超过 63 个字符的限制,控制器现在使用 generateName
字段创建路由,前缀为 nb-
。对于 StatefulSets,如果笔记本名称超过 52 个字符,控制器还会使用 generateName: "nb-"
来防止命名冲突。
RHOAIENG-3913 - Red Hat OpenShift AI Operator 错误地显示 False
的 Degraded
条件并带有错误
在以前的版本中,如果您在 OpenShift AI Operator 使用的 DataScienceCluster (DSC)对象中启用了 KServe 组件,但没有安装依赖的 Red Hat OpenShift Service Mesh 和 Red Hat OpenShift Serverless Operator,则 DSC 对象中的 kserveReady
条件可以正确地显示 KServe is not ready。但是,Degraded
条件会错误地显示 False
值。这个问题现已解决。
RHOAIENG-29352 - 缺少文档和支持菜单项
在以前的版本中,在 OpenShift AI 顶部导航栏中,当您点击帮助图标(
)时,菜单仅包含 About 菜单项,以及 Documentation 和 Support 菜单项。这个问题现已解决。
RHAIENG-496 - 以非管理员用户身份创建 LlamaStackDistribution
在以前的版本中,因为部署的角色定义已过时或不完整(例如 LlamaStackDistribution
CRD),所以非管理员请求会失败,因为基于角色的访问控制(RBAC)不足。这个问题现已解决。