5.3. 生成的模型响应质量


  • 在某些情况下,所生成的模型响应的质量可能会在更新后去除去。

    在新版本中更新了默认抽样参数源。对于 vLLM 版本 0.8.4 及更高版本,默认的抽样参数来自模型创建器提供的 generation_config.json 文件。在大多数情况下,这会导致更高的质量响应,因为模型创建者可能知道哪个抽样参数最适合其模型。然而,在某些情况下,模型创建者提供的默认值可能会导致性能下降。

    如果您遇到这个问题,请使用-- generation-config vllm 服务器参数使用旧默认值提供模型。

    重要

    如果应用 -generation-config vllm 服务器参数改进了模型输出,请继续使用 vLLM 默认值,并利用 Hugging Face 上的模型创建者更新其默认的 generation_config.json,以便生成更好的质量的生成。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat