4.4. Mejoras a NUMA en Red Hat Enterprise Linux 6
Red Hat Enterprise Linux 6 incluye una serie de mejoras para capitalizar en todo el potencial actual del hardware escalable. Esta sección entrega una visión general de las mejoras de rendimiento más importantes relacionadas con NUMA proporcionadas por Red Hat Enterprise Linux 6.
4.4.1. Optimización de escalabilidad y en vacío
4.4.1.1. Mejoras en reconocimiento de topología
Las siguientes mejoras permiten a Red Hat Enterprise detectar información de arquitectura y hardware de bajo nivel, mejorando así su capacidad para optimizar de forma automática el procesamiento en su sistema.
- Detección de topología mejorada
- Permite al sistema operativo detectar información de hardware de bajo nivel (tal como CPU, hiper procesos, núcleos, conectores, nodos de NUMA y tiempos de acceso en su sistema.
- Programador de reparto justo
- Este nuevo modo de programación garantiza que el tiempo de ejecución sea compartido por igual entre los procesos elegibles. Al combinarlo con esta detección de topología permite la programación de los procesos en las CPU dentro del mismo conector para evitar el costoso acceso de memoria remota, y garantizar que el contenido de cache sea preservado siempre que sea posible.
malloc
malloc
ahora se ha optimizado para garantizar que las regiones de memoria asignadas al proceso sean tan físicas como sea posible. Incluido el aumento de velocidad de acceso de memoria.- asignación de búfer de E/S skbuff
- Al igual que
malloc
, ha sido optimizado para usar memoria que está cerca físicamente a las operaciones de manejo de E/S tales como la interrupciones. - Afinidad de interrupciones de dispositivo
- La información registrada por los controladores de dispositivos acerca de cuál CPU maneja cada una de las interrupciones, puede utilizarse para restringir el manejo de interrupciones a las CPU dentro del mismo conector físico, preservando así, la afinidad de cache y limitando la comunicación entre conectores de alto volumen.
4.4.1.2. Mejoras en sincronización de multiprocesador
La coordinación de tareas entre múltiples procesadores requiere operaciones de consumo de tiempo frecuentes para garantizar que los procesos que se ejecutan en paralelo no comprometan la integridad de los datos. Red Hat Enterprise Linux incluye las siguientes mejoras de rendimiento en esta área.
- Cerrojos de Leer-Copiar-Actualizar (RCU)
- El 90% de cerrojos suele adquirirse para propósitos de lectura. El cerramiento de RCU retira la necesidad para obtener un cerrojo de acceso exclusivo cuando los datos que se acceden no sean modificados. Este modo de cerramiento ahora se utiliza para asignar o desasignar operaciones.
- algoritmos por CPU y por socket
- Muchos algoritmos han sido actualizados para realizar coordinación de cerrojos entre las CPU que cooperan en el mismo socket para permitir un cerramiento más específico. Numerosos Spinlocks han sido sustituidos por métodos de cerramiento por socket, y zonas de asignador de memoria actualizadas y listas de páginas de memoria relacionadas con la lógica de asignación de memoria para atravesar un subconjunto de estructuras de datos de operaciones de asignación o desasignación de memoria.