Chapitre 6. Configuration des limites PID
L’identificateur de processus (PID) est un identifiant unique attribué par le noyau Linux à chaque processus ou thread actuellement exécuté sur un système. Le nombre de processus pouvant s’exécuter simultanément sur un système est limité à 4 194 304 par le noyau Linux. Ce nombre pourrait également être affecté par un accès limité à d’autres ressources du système telles que la mémoire, le CPU et l’espace disque.
Dans Red Hat OpenShift Service sur AWS 4.11 et plus tard, par défaut, un pod peut avoir un maximum de 4 096 PID. Lorsque votre charge de travail nécessite plus que cela, vous pouvez augmenter le nombre maximal autorisé de PID en configurant un objet KubeletConfig.
Le service OpenShift Red Hat sur les clusters AWS exécutant des versions antérieures à 4.11 utilise une limite PID par défaut de 1024.
6.1. Comprendre les limites d’identification du processus
Dans Red Hat OpenShift Service sur AWS, considérez ces deux limites prises en charge pour l’utilisation de l’ID de processus (PID) avant de planifier le travail sur votre cluster:
Le nombre maximum de PID par dose.
La valeur par défaut est 4,096 dans Red Hat OpenShift Service sur AWS 4.11 et versions ultérieures. Cette valeur est contrôlée par le paramètre podPidsLimit défini sur le nœud.
Le nombre maximum de PID par nœud.
La valeur par défaut dépend des ressources des nœuds. Dans Red Hat OpenShift Service sur AWS, cette valeur est contrôlée par le paramètre --system-réservé, qui réserve des PID sur chaque nœud en fonction des ressources totales du nœud.
Lorsqu’une gousse dépasse le nombre maximal autorisé de PID par dose, la gousse peut cesser de fonctionner correctement et peut être expulsée du nœud. Consultez la documentation Kubernetes pour les signaux d’expulsion et les seuils pour plus d’informations.
Lorsqu’un nœud dépasse le nombre maximal autorisé de PID par nœud, le nœud peut devenir instable car les nouveaux processus ne peuvent pas avoir de PID assignés. Lorsque les processus existants ne peuvent pas s’achever sans créer de processus supplémentaires, l’ensemble du nœud peut devenir inutilisable et nécessiter un redémarrage. Cette situation peut entraîner une perte de données, en fonction des processus et des applications en cours d’exécution. Les administrateurs clients et Red Hat Site Reliability Engineering sont informés lorsque ce seuil est atteint, et un nœud de travail connaît un avertissement de sécurité PIDP apparaîtra dans les journaux des clusters.