Este contenido no está disponible en el idioma seleccionado.

Chapter 2. Version 3.3.3 release notes


Red Hat AI Inference Server 3.3.3 is a maintenance release containing security fixes and enhancements.

Note

Version 3.3.2 was skipped to align version numbering across Red Hat AI Inference Server components.

The following container images are available from registry.redhat.io:

  • registry.redhat.io/rhaiis/vllm-cuda-rhel9:3.3.3
  • registry.redhat.io/rhaiis/model-opt-cuda-rhel9:3.3.3
  • registry.redhat.io/rhaiis/vllm-rocm-rhel9:3.3.3
  • registry.redhat.io/rhaiis/vllm-spyre-rhel9:3.3.3

Red Hat AI Inference Server 3.3.3 packages vLLM v0.13.0 for CUDA, ROCm, and CPU container images, and vLLM v0.11.0 for Spyre container images (Power, Z, x86). These are the same vLLM versions as Red Hat AI Inference Server 3.3.1.

Red Hat AI Model Optimization Toolkit 3.3.3 packages LLM Compressor v0.9.0.3 in the model-opt container image. The Spyre container image packages LLM Compressor v0.7.1.2.

This release provides security updates. For a complete list of updates, see the following errata advisories:

2.2. Enhancements

TranslateGemma model support for CUDA AI accelerators

The google/translategemma-12b-it multimodal translation model is supported for inference serving on CUDA AI accelerators. TranslateGemma supports text and image translation across 100+ languages.

Note

The model requires the --chat-template-content-format openai flag when starting the server.

Red Hat logoGithubredditYoutubeTwitter

Aprender

Pruebe, compre y venda

Comunidades

Acerca de Red Hat

Ofrecemos soluciones reforzadas que facilitan a las empresas trabajar en plataformas y entornos, desde el centro de datos central hasta el perímetro de la red.

Hacer que el código abierto sea más inclusivo

Red Hat se compromete a reemplazar el lenguaje problemático en nuestro código, documentación y propiedades web. Para más detalles, consulte el Blog de Red Hat.

Acerca de la documentación de Red Hat

Legal Notice

Theme

© 2026 Red Hat
Volver arriba