第 3 章已知问题

当您使用启用了-- enable-chunked-prefill 的 Red Hat AI Inference Server 3.1 容器镜像在 NVIDIA T4 加速器上部署模型时，任何 chat 或 text completion 查询都会导致模型崩溃并重启。要解决这个问题，请在部署模型 时删除-enable-chunked-prefill 标志。

我们提供强化的解决方案，使企业能够更轻松地跨平台和环境（从核心数据中心到网络边缘）工作。

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情，请参阅红帽博客.

通过我们的产品和服务，以及可以信赖的内容，帮助红帽用户创新并实现他们的目标。了解我们当前的更新.

返回顶部

第 3 章 已知问题