LLM CompressorRed Hat AI Inference Server 3.0使用 LLM Compressor 库压缩大型语言模型Red Hat AI Documentation Team法律通告摘要 描述 LLM Compressor 库,以及如何使用它来优化和压缩大型语言模型,然后再推断。 下一个