Accueiil
Products
OpenShift Dedicated
4
Introduction à OpenShift dédié
2.3. Comprendre le processus et la sécurité pour OpenShift Dédié

2.3. Comprendre le processus et la sécurité pour OpenShift Dédié

2.3.1. Examen et notifications des groupes d’action
Copier lien

Les notifications de cluster sont des messages sur l’état, la santé ou les performances de votre cluster.

Les notifications de cluster sont la principale façon dont Red Hat Site Reliability Engineering (SRE) communique avec vous sur la santé de votre cluster géré. Le SRE peut également utiliser des notifications de cluster pour vous inviter à effectuer une action afin de résoudre ou d’empêcher un problème avec votre cluster.

Les propriétaires de clusters et les administrateurs doivent régulièrement examiner et agir les notifications de clusters pour s’assurer que les clusters restent en bonne santé et pris en charge.

Dans l’onglet Historique des clusters de votre cluster, vous pouvez afficher les notifications de cluster dans la console de cloud hybride Red Hat. Par défaut, seul le propriétaire du cluster reçoit des notifications de cluster sous forme d’e-mails. Lorsque d’autres utilisateurs doivent recevoir des e-mails de notification en cluster, ajoutez chaque utilisateur comme contact de notification pour votre cluster.

2.3.1.1. La politique de notification par groupe
Copier lien

Les notifications de cluster sont conçues pour vous tenir informé de la santé de votre cluster et des événements à fort impact qui l’affectent.

La plupart des notifications de cluster sont générées et envoyées automatiquement pour vous assurer que vous êtes immédiatement informé des problèmes ou des changements importants à l’état de votre cluster.

Dans certaines situations, Red Hat Site Reliability Engineering (SRE) crée et envoie des notifications de cluster pour fournir un contexte supplémentaire et des conseils pour un problème complexe.

Les notifications de cluster ne sont pas envoyées pour les événements à faible impact, les mises à jour de sécurité à faible risque, les opérations et la maintenance de routine, ou les problèmes transitoires mineurs qui sont rapidement résolus par SRE.

Les services Red Hat envoient automatiquement des notifications lorsque:

Les contrôles de surveillance de la santé ou de vérification de l’environnement à distance détectent un problème dans votre cluster, par exemple lorsqu’un nœud de travail a peu d’espace disque.
Des événements importants du cycle de vie des clusters se produisent, par exemple, lorsque la maintenance ou les mises à niveau programmées commencent, ou que les opérations de cluster sont touchées par un événement, mais ne nécessitent pas d’intervention du client.
D’importants changements de gestion des clusters se produisent, par exemple, lorsque la propriété de clusters ou le contrôle administratif est transféré d’un utilisateur à un autre.
L’abonnement à votre cluster est modifié ou mis à jour, par exemple lorsque Red Hat met à jour les conditions d’abonnement ou les fonctionnalités disponibles pour votre cluster.

La SRE crée et envoie des notifications lorsque:

L’incident entraîne une dégradation ou une panne qui affecte la disponibilité ou les performances de votre cluster, par exemple, votre fournisseur de cloud a une panne régionale. La SRE envoie des notifications ultérieures pour vous informer de l’état d’avancement de la résolution des incidents et lorsque l’incident est résolu.
Des failles de sécurité, des failles de sécurité ou des activités inhabituelles sont détectées sur votre cluster.
Le Red Hat détecte que les changements que vous avez apportés sont en train de créer ou peuvent entraîner une instabilité des clusters.
Le Red Hat détecte que vos charges de travail causent une dégradation des performances ou une instabilité dans votre cluster.

2.3.2. Gestion des incidents et des opérations
Copier lien

Cette documentation détaille les responsabilités de Red Hat pour le service géré OpenShift Dedicated. Le fournisseur de cloud est responsable de la protection de l’infrastructure matérielle qui gère les services offerts par le fournisseur de cloud. Le client est responsable de la gestion des incidents et des opérations des données d’application client et de tout réseau personnalisé que le client a configuré pour le réseau cluster ou le réseau virtuel.

2.3.2.1. La surveillance de la plate-forme
Copier lien

Le Red Hat Site Reliability Engineer (SRE) maintient un système de surveillance et d’alerte centralisé pour tous les composants de cluster dédiés OpenShift, les services SRE et les comptes de fournisseurs cloud sous-jacents. Les journaux d’audit de plate-forme sont transmis en toute sécurité à un système centralisé SIEM (Security Information and Event Monitoring), où ils peuvent déclencher des alertes configurées à l’équipe SRE et sont également soumis à un examen manuel. Les journaux d’audit sont conservés dans le SIEM pendant un an. Les journaux d’audit d’un cluster donné ne sont pas supprimés au moment où le cluster est supprimé.

2.3.2.2. Gestion des incidents
Copier lien

L’incident est un événement qui entraîne une dégradation ou une panne d’un ou de plusieurs services Red Hat. L’incident peut être soulevé par un client ou un membre de l’Expérience client et de l’engagement (CEE) par le biais d’un dossier d’assistance, directement par le système centralisé de surveillance et d’alerte, ou directement par un membre de l’équipe SRE.

En fonction de l’impact sur le service et le client, l’incident est classé en termes de gravité.

Le flux de travail général de la façon dont un nouvel incident est géré par Red Hat:

Le premier intervenant de SRE est alerté d’un nouvel incident et commence une enquête initiale.
Après l’enquête initiale, l’incident est assigné à un responsable de l’incident, qui coordonne les efforts de rétablissement.
Le responsable de l’incident gère toute communication et coordination autour de la récupération, y compris toute notification pertinente ou toute mise à jour de cas d’assistance.
L’incident est récupéré.
L’incident est documenté et une analyse des causes profondes est effectuée dans les 5 jours ouvrables suivant l’incident.
Le projet de document d’analyse des causes profondes (RCA) est communiqué au client dans les 7 jours ouvrables suivant l’incident.

2.3.2.3. Sauvegarde et récupération
Copier lien

Les clusters dédiés OpenShift sont sauvegardés à l’aide de snapshots des fournisseurs de cloud. En particulier, cela n’inclut pas les données clients stockées sur des volumes persistants (PV). Les snapshots sont pris à l’aide des API instantanées appropriées du fournisseur de cloud et sont téléchargés sur un seau de stockage d’objets sécurisé (S3 dans AWS et GCS dans Google Cloud) dans le même compte que le cluster.

Expand

Composante	Fréquence de prise de vue	La rétention	Les notes
Sauvegarde complète du magasin d’objets	Au quotidien	7 jours	Il s’agit d’une sauvegarde complète de tous les objets Kubernetes comme etcd. Aucun PV n’est sauvegardé dans ce calendrier de sauvegarde.
Sauvegarde complète du magasin d’objets	Chaque semaine	30 jours
Sauvegarde complète du magasin d’objets	Horaire	24 heures	Il s’agit d’une sauvegarde complète de tous les objets Kubernetes comme etcd. Aucun PV n’est sauvegardé dans ce calendrier de sauvegarde.
Le volume de racine des nœuds	Jamais jamais	C) N/A	Les nœuds sont considérés comme à court terme. Aucune critique ne doit être stockée sur le volume racine d’un nœud.

Le Red Hat ne s’engage à aucun objectif de point de récupération (RPO) ou objectif de temps de récupération (RTO).
Les clients sont responsables de prendre régulièrement des sauvegardes de leurs données
Les clients devraient déployer des clusters multiAZ avec des charges de travail qui suivent les meilleures pratiques de Kubernetes afin d’assurer une disponibilité élevée dans une région.
Lorsqu’une région cloud entière n’est pas disponible, les clients doivent installer un nouveau cluster dans une autre région et restaurer leurs applications à l’aide de leurs données de sauvegarde.

2.3.2.4. Capacité des clusters
Copier lien

L’évaluation et la gestion de la capacité des clusters est une responsabilité partagée entre Red Hat et le client. Le Red Hat SRE est responsable de la capacité de tous les nœuds d’avion de contrôle et d’infrastructure sur le cluster.

Le Red Hat SRE évalue également la capacité des clusters lors des mises à niveau et en réponse aux alertes de clusters. L’impact d’une mise à niveau du cluster sur la capacité est évalué dans le cadre du processus d’essai de mise à niveau afin de s’assurer que la capacité n’est pas affectée négativement par de nouveaux ajouts au cluster. Lors d’une mise à niveau de cluster, des nœuds de travail supplémentaires sont ajoutés pour s’assurer que la capacité totale du cluster est maintenue pendant le processus de mise à niveau.

Les évaluations des capacités du personnel de SRE ont également lieu en réponse aux alertes du groupe, une fois que les seuils d’utilisation sont dépassés pendant une certaine période. De telles alertes peuvent également entraîner une notification au client.

2.3.3. Gestion du changement
Copier lien

Cette section décrit les stratégies sur la façon dont les changements de cluster et de configuration, les correctifs et les versions sont gérés.

2.3.3.1. Changements initiés par le client
Copier lien

Il est possible d’initier des modifications en utilisant des fonctionnalités en libre-service telles que le déploiement de clusters, la mise à l’échelle des nœuds de travail ou la suppression de clusters.

L’historique des changements est capturé dans la section Historique des clusters dans l’onglet Aperçu OpenShift Cluster Manager, et est disponible pour vous. L’historique des changements comprend, sans s’y limiter, les journaux des changements suivants:

Ajout ou suppression de fournisseurs d’identité
Ajout ou suppression d’utilisateurs vers ou à partir du groupe admins dédiés
Dimensionnement des nœuds de calcul du cluster
Dimensionnement de l’équilibreur de charge du cluster
Dimensionnement du stockage persistant du cluster
Amélioration du cluster

Il est possible d’implémenter une exclusion de maintenance en évitant les changements dans OpenShift Cluster Manager pour les composants suivants:

La suppression d’un cluster
Ajout, modification ou suppression de fournisseurs d’identité
Ajout, modification ou suppression d’un utilisateur d’un groupe élevé
Installation ou suppression des add-ons
La modification des configurations de réseau de clusters
Ajout, modification ou suppression de pools de machines
Activer ou désactiver la surveillance de la charge de travail des utilisateurs
Lancement d’une mise à niveau

Important

Afin de faire respecter l’exclusion de la maintenance, assurez-vous que les politiques d’autoscaling ou de mise à niveau automatique du pool de machines ont été désactivées. Après que l’exclusion de maintenance a été levée, procéder à l’activation automatique de la mise à l’échelle de la machine ou des politiques de mise à niveau automatique comme souhaité.

2.3.3.2. Changements initiés par Red Hat
Copier lien

L’ingénierie de fiabilité du site Red Hat (SRE) gère l’infrastructure, le code et la configuration d’OpenShift Dedicated à l’aide d’un flux de travail GitOps et de pipelines CI/CD entièrement automatisés. Ce processus permet à Red Hat d’introduire en toute sécurité des améliorations de service sur une base continue sans impact négatif sur les clients.

Chaque changement proposé fait l’objet d’une série de vérifications automatisées dès l’enregistrement. Les changements sont ensuite déployés dans un environnement de mise en scène où ils subissent des tests d’intégration automatisés. Enfin, des changements sont déployés dans l’environnement de production. Chaque étape est entièrement automatisée.

L’examinateur autorisé doit approuver l’avancement à chaque étape. L’examinateur ne peut pas être la même personne qui a proposé le changement. Les modifications et approbations sont entièrement vérifiables dans le cadre du flux de travail GitOps.

Certaines modifications sont publiées à la production progressivement, en utilisant des drapeaux de fonctionnalités pour contrôler la disponibilité de nouvelles fonctionnalités pour des clusters ou des clients spécifiés.

2.3.3.3. Gestion des patchs
Copier lien

Le logiciel OpenShift Container Platform et l’image immuable du système d’exploitation Red Hat Enterprise Linux CoreOS (RHCOS) sont corrigées pour les bogues et les vulnérabilités dans les mises à niveau régulières du flux z. En savoir plus sur l’architecture RHCOS dans la documentation OpenShift Container Platform.

2.3.3.4. Gestion des libérations
Copier lien

Le Red Hat ne met pas automatiquement à niveau vos clusters. Il est possible de programmer la mise à niveau des clusters à intervalles réguliers (mise à niveau récurrente) ou une seule fois (mise à niveau individuelle) à l’aide de la console Web OpenShift Cluster Manager. Le Red Hat pourrait mettre à niveau avec force un cluster vers une nouvelle version z-stream seulement si le cluster est affecté par un CVE d’impact critique. Consultez l’historique de tous les événements de mise à niveau de cluster dans la console Web OpenShift Cluster Manager. Consultez la politique sur le cycle de vie pour plus d’informations sur les communiqués.

2.3.4. Conformité à la sécurité et à la réglementation
Copier lien

La conformité à la sécurité et à la réglementation comprend des tâches telles que la mise en œuvre de contrôles de sécurité et la certification de conformité.

2.3.4.1. Classification des données
Copier lien

Red Hat définit et suit une norme de classification des données pour déterminer la sensibilité des données et mettre en évidence le risque inhérent à la confidentialité et à l’intégrité de ces données lors de leur collecte, de leur utilisation, de leur transmission et de leur traitement. Les données appartenant au client sont classées au plus haut niveau de sensibilité et d’exigences de manipulation.

2.3.4.2. Gestion des données
Copier lien

Le service OpenShift Dedicated utilise des services de fournisseurs de cloud tels qu’AWS Key Management Service (KMS) et Google Cloud KMS pour aider à gérer en toute sécurité les clés de chiffrement pour les données persistantes. Ces clés sont utilisées pour chiffrer tous les volumes racine des plans de contrôle, de l’infrastructure et des nœuds de travail. Les clients peuvent spécifier leur propre clé KMS pour chiffrer les volumes racine au moment de l’installation. Les volumes persistants (PV) utilisent également KMS pour la gestion des clés. Les clients peuvent spécifier leur propre clé KMS pour chiffrer les PV en créant une nouvelle StorageClass faisant référence à la clé KMS Amazon Resource Name (ARN) ou ID.

Lorsqu’un client supprime son cluster dédié OpenShift, toutes les données de cluster sont définitivement supprimées, y compris les volumes de données de plan de contrôle et les volumes de données d’application client, un tel volume persistant (PV).

2.3.4.3. Gestion de la vulnérabilité
Copier lien

Le Red Hat effectue une analyse périodique de vulnérabilité d’OpenShift Dedicated à l’aide d’outils standard de l’industrie. Les vulnérabilités identifiées sont suivies de leur assainissement en fonction des échéanciers en fonction de la gravité. Les activités d’analyse et d’assainissement des vulnérabilités sont documentées aux fins de vérification par des tiers évaluateurs dans le cadre d’audits de certification de conformité.

2.3.4.4. La sécurité du réseau
Copier lien

2.3.4.4.1. Coupe-feu et protection DDoS
Copier lien

Chaque cluster dédié OpenShift est protégé par une configuration réseau sécurisée au niveau de l’infrastructure cloud en utilisant les règles de pare-feu (AWS Security Groups ou Google Cloud Compute Engine). Les clients dédiés sur AWS sont également protégés contre les attaques DDoS avec AWS Shield Standard. De même, tous les équilibreurs de charge GCP et les adresses IP publiques utilisées par OpenShift Dedicated on GCP sont protégés contre les attaques DDoS avec Google Cloud Armor Standard.

2.3.4.4.2. Clusters privés et connectivité réseau
Copier lien

Les clients peuvent éventuellement configurer leurs points de terminaison OpenShift Dedicated cluster (console Web, API et routeur d’applications) pour être rendus privés de sorte que le plan de contrôle du cluster ou les applications ne soient pas accessibles à partir d’Internet.

Dans le cas d’AWS, les clients peuvent configurer une connexion réseau privée à leur cluster dédié OpenShift via AWS VPC peering, AWS VPN ou AWS Direct Connect.

2.3.4.4.3. Contrôles d’accès au réseau cluster
Copier lien

Les règles de contrôle d’accès réseau fines peuvent être configurées par les clients par projet.

2.3.4.5. Essais de pénétration
Copier lien

Le Red Hat effectue des tests de pénétration périodiques contre OpenShift Dedicated. Les tests sont effectués par une équipe interne indépendante à l’aide d’outils standard de l’industrie et de meilleures pratiques.

Les problèmes qui sont découverts sont prioritaires en fonction de la gravité. Les problèmes constatés dans le cadre de projets open source sont partagés avec la communauté aux fins de résolution.

2.3.4.6. Conformité
Copier lien

La société OpenShift Dedicated suit les meilleures pratiques courantes de l’industrie en matière de sécurité et de contrôle. Les certifications sont décrites dans le tableau suivant.

Expand

Tableau 2.2. Certifications de sécurité et de contrôle pour OpenShift Dedicated
Conformité	Dédié à OpenShift sur AWS	Dédié à OpenShift sur GCP
HIPAA Qualifié	(abonnements uniquement au cloud client)	(abonnements uniquement au cloud client)
ISO 27001	♪ oui ♪	♪ oui ♪
DSS 4.0 PCI	♪ oui ♪	♪ oui ♪
Le SOC 2 de type 2	♪ oui ♪	♪ oui ♪

2.3.5. La reprise après sinistre
Copier lien

L’OpenShift Dedicated fournit une reprise après sinistre pour les défaillances qui se produisent au niveau de la pod, du nœud de travail, du nœud d’infrastructure, du nœud d’avion de contrôle et des niveaux de zone de disponibilité.

La récupération après sinistre exige que le client utilise les meilleures pratiques pour le déploiement d’applications, de stockage et d’architecture de clusters hautement disponibles (par exemple, déploiement d’une zone unique contre déploiement multizone) pour tenir compte du niveau de disponibilité souhaité.

En cas de panne d’une zone ou d’une zone de disponibilité, un groupe unique n’assurera pas d’évitement ou de reprise en cas de catastrophe. De multiples clusters à zone unique avec basculement entretenu par le client peuvent tenir compte des pannes au niveau de la zone ou de la région.

En cas de panne totale de la région, un groupe multizones ne permettra pas d’éviter les catastrophes ou de se remettre en état. De multiples clusters multizones avec basculement entretenu par le client peuvent tenir compte des pannes au niveau de la région.

Retour au début

2.3. Comprendre le processus et la sécurité pour OpenShift Dédié

2.3.1. Examen et notifications des groupes d’action
Copier lien

2.3.1.1. La politique de notification par groupe
Copier lien

2.3.2. Gestion des incidents et des opérations
Copier lien

2.3.2.1. La surveillance de la plate-forme
Copier lien

2.3.2.2. Gestion des incidents
Copier lien

2.3.2.3. Sauvegarde et récupération
Copier lien

2.3.2.4. Capacité des clusters
Copier lien

2.3.3. Gestion du changement
Copier lien

2.3.3.1. Changements initiés par le client
Copier lien

2.3.3.2. Changements initiés par Red Hat
Copier lien

2.3.3.3. Gestion des patchs
Copier lien

2.3.3.4. Gestion des libérations
Copier lien

2.3.4. Conformité à la sécurité et à la réglementation
Copier lien

2.3.4.1. Classification des données
Copier lien

2.3.4.2. Gestion des données
Copier lien

2.3.4.3. Gestion de la vulnérabilité
Copier lien

2.3.4.4. La sécurité du réseau
Copier lien

2.3.4.4.1. Coupe-feu et protection DDoS
Copier lien

2.3.4.4.2. Clusters privés et connectivité réseau
Copier lien

2.3.4.4.3. Contrôles d’accès au réseau cluster
Copier lien

2.3.4.5. Essais de pénétration
Copier lien

2.3.4.6. Conformité
Copier lien

2.3.5. La reprise après sinistre
Copier lien

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Rendre l’open source plus inclusif

À propos de Red Hat

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

2.3. Comprendre le processus et la sécurité pour OpenShift Dédié

2.3.1. Examen et notifications des groupes d’actionCopier lienLien copié sur presse-papiers!

2.3.1.1. La politique de notification par groupeCopier lienLien copié sur presse-papiers!

2.3.2. Gestion des incidents et des opérationsCopier lienLien copié sur presse-papiers!

2.3.2.1. La surveillance de la plate-formeCopier lienLien copié sur presse-papiers!

2.3.2.2. Gestion des incidentsCopier lienLien copié sur presse-papiers!

2.3.2.3. Sauvegarde et récupérationCopier lienLien copié sur presse-papiers!

2.3.2.4. Capacité des clustersCopier lienLien copié sur presse-papiers!

2.3.3. Gestion du changementCopier lienLien copié sur presse-papiers!

2.3.3.1. Changements initiés par le clientCopier lienLien copié sur presse-papiers!

2.3.3.2. Changements initiés par Red HatCopier lienLien copié sur presse-papiers!

2.3.3.3. Gestion des patchsCopier lienLien copié sur presse-papiers!

2.3.3.4. Gestion des libérationsCopier lienLien copié sur presse-papiers!

2.3.4. Conformité à la sécurité et à la réglementationCopier lienLien copié sur presse-papiers!

2.3.4.1. Classification des donnéesCopier lienLien copié sur presse-papiers!

2.3.4.2. Gestion des donnéesCopier lienLien copié sur presse-papiers!

2.3.4.3. Gestion de la vulnérabilitéCopier lienLien copié sur presse-papiers!

2.3.4.4. La sécurité du réseauCopier lienLien copié sur presse-papiers!

2.3.4.4.1. Coupe-feu et protection DDoSCopier lienLien copié sur presse-papiers!

2.3.4.4.2. Clusters privés et connectivité réseauCopier lienLien copié sur presse-papiers!

2.3.4.4.3. Contrôles d’accès au réseau clusterCopier lienLien copié sur presse-papiers!

2.3.4.5. Essais de pénétrationCopier lienLien copié sur presse-papiers!

2.3.4.6. ConformitéCopier lienLien copié sur presse-papiers!

2.3.5. La reprise après sinistreCopier lienLien copié sur presse-papiers!

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Rendre l’open source plus inclusif

À propos de Red Hat

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

2.3.1. Examen et notifications des groupes d’action
Copier lien

2.3.1.1. La politique de notification par groupe
Copier lien

2.3.2. Gestion des incidents et des opérations
Copier lien

2.3.2.1. La surveillance de la plate-forme
Copier lien

2.3.2.2. Gestion des incidents
Copier lien

2.3.2.3. Sauvegarde et récupération
Copier lien

2.3.2.4. Capacité des clusters
Copier lien

2.3.3. Gestion du changement
Copier lien

2.3.3.1. Changements initiés par le client
Copier lien

2.3.3.2. Changements initiés par Red Hat
Copier lien

2.3.3.3. Gestion des patchs
Copier lien

2.3.3.4. Gestion des libérations
Copier lien

2.3.4. Conformité à la sécurité et à la réglementation
Copier lien

2.3.4.1. Classification des données
Copier lien

2.3.4.2. Gestion des données
Copier lien

2.3.4.3. Gestion de la vulnérabilité
Copier lien

2.3.4.4. La sécurité du réseau
Copier lien

2.3.4.4.1. Coupe-feu et protection DDoS
Copier lien

2.3.4.4.2. Clusters privés et connectivité réseau
Copier lien

2.3.4.4.3. Contrôles d’accès au réseau cluster
Copier lien

2.3.4.5. Essais de pénétration
Copier lien

2.3.4.6. Conformité
Copier lien

2.3.5. La reprise après sinistre
Copier lien