01 september 2022
Les « baleines » sur lesquelles se dressent les nuages. Parlons des centres de données sur l'exemple de Microsoft Azure
Les technologies cloud sont devenues une partie importante de notre vie et dans la plupart des cas, les ingénieurs informatiques modernes ne peuvent pas imaginer leur travail sans interagir avec les services cloud. Mais les nuages ne fonctionnent pas d’eux-mêmes quelque part dans le ciel. Quelque part sur notre planète, il existe des centres de données dotés de nombreux serveurs qui hébergent tous les services SaaS, PaaS et IaaS que nous utilisons. Dans cet article, je parlerai un peu des centres de données - des « baleines » sur lesquelles se dressent les nuages.
Je voudrais commencer par quelques mots sur ce que sont les clouds.

L'Institut National des Standards et de la Technologie (NIST) indique qu'un véritable cloud doit répondre aux critères suivants:

  • On-demand self-service. Un consommateur peut provisionner unilatéralement des capacités informatiques, telles que le temps serveur et le stockage réseau, selon les besoins automatiquement sans nécessiter d'interaction humaine avec chaque fournisseur de service.
  • Broad network access. Les capacités sont disponibles via le réseau et accessibles par des mécanismes standards favorisant l'utilisation par des plates-formes clientes hétérogènes, fines ou épaisses (par exemple, téléphones mobiles, tablettes, ordinateurs portables et postes de travail).
  • Resource pooling. Les ressources informatiques du fournisseur sont regroupées pour servir plusieurs consommateurs selon un modèle multi-locataire, avec différentes ressources physiques et virtuelles attribuées et réattribuées dynamiquement en fonction de la demande des consommateurs.
  • Rapid elasticity. Les capacités peuvent être provisionnées et libérées élastiquement, parfois automatiquement, pour évoluer rapidement vers l'extérieur et vers l'intérieur en fonction de la demande. Pour le consommateur, les capacités disponibles pour la provision apparaissent souvent comme illimitées et peuvent être appropriées en toute quantité à tout moment.
  • Measured service. Les systèmes de cloud contrôlent et optimisent automatiquement l'utilisation des ressources en exploitant une capacité de comptage à un certain niveau d'abstraction approprié au type de service (par exemple, stockage, traitement, bande passante et comptes utilisateur actifs). L'utilisation des ressources peut être surveillée, contrôlée et rapportée, offrant une transparence à la fois pour le fournisseur et le consommateur du service utilisé.

Ainsi, le Cloud est une certaine quantité de ressources informatiques partagées entre tous les utilisateurs, qui ont un accès universel, indépendant de la plate-forme, au réseau, ont la possibilité d'auto-gestion pour les utilisateurs, et ont la fonction de facturation uniquement pour les ressources consommées.

Par ressources informatiques, nous entendons le CPU, le GPU, la RAM, etc., qui doivent physiquement exister quelque part. Et ils existent dans des centres de données, qui ont tout pour permettre aux clouds de répondre aux critères ci-dessus.

Jetons un coup d'œil à la carte des centres de données Azure.

Vous pouvez consulter cette carte vous-même sur un site Web très cool sur l'infrastructure Azure : https://infrastructuremap.microsoft.com/

Pour comprendre ce qui est représenté sur cette carte, vous devez connaître plusieurs définitions que Microsoft utilise:

  • Les centres de données Azure sont des bâtiments physiques uniques, situés dans le monde entier, qui abritent un groupe de serveurs informatiques connectés en réseau.
  • Une région Azure est un ensemble de centres de données, déployés dans un périmètre défini par la latence et connectés via un réseau régional à faible latence dédié.
  • Une géographie Azure est un marché distinct, contenant généralement au moins une ou plusieurs régions, qui préserve les frontières de résidence des données et de conformité.
  • Les Zones de Disponibilité Azure sont des emplacements physiques uniques au sein d'une région Azure et offrent une haute disponibilité pour protéger vos applications et données contre les défaillances des centres de données. Chaque zone est composée d'un ou plusieurs centres de données équipés d'alimentations, de refroidissements et de réseaux indépendants.
  • Le réseau mondial Azure fait référence à tous les composants du réseau et est composé du réseau étendu mondial de Microsoft (WAN), des points de présence (PoPs), de la fibre, et d'autres.

Comme vous pouvez le voir, les centres de données sont regroupés en régions, les régions en géographies, et tout cela est connecté par un réseau mondial.
Dans une région, il existe des Zones de Disponibilité Azure, composées d'un ou plusieurs centres de données, qui vous permettent de distribuer vos ressources de manière à ce qu'elles ne soient pas affectées par des problèmes avec un centre de données spécifique.
Ainsi, sur l'image ci-dessus, la couleur bleue indique les régions existantes, le gris - celles annoncées, et les lignes en pointillés - les réseaux entre les régions.
Azure, avec 39 régions existantes, compte au moins 78 centres de données (en supposant qu'une région a deux Zones de Disponibilité). Mais je pense qu'en réalité, leur nombre est supérieur à cent, voire même à deux cents. C'est très impressionnant.

Mais qu'est-ce que ce Centre de Données ?
Si l'on en croit ce tweet, alors en 2019, la région Azure de Dublin ressemblait à cela.
À partir de l'image, nous pouvons voir très clairement que les centres de données eux-mêmes sont composés de modules identiques, combinés en une seule unité. Pourquoi ? Parce qu'il est plus facile et moins cher d'assembler quelque chose de grand à partir de petites pièces identiques.

Je ne sais pas exactement ce qui se trouve à l'intérieur de ces modules, mais la logique suggère que toutes les communications doivent être établies pendant la production : électricité, réseau, refroidissement, et cadres spatiaux pour les serveurs. Il est très probable que les serveurs et l'équipement réseau soient également préassemblés en usine. Ainsi, le centre de données est assemblé comme un constructeur - en reliant les conteneurs en un réseau unique de communications.

Et que devrait inclure d'autre le centre de données ? Bien sûr, les éléments qui font fonctionner ces communications : les sources d'alimentation et les systèmes de refroidissement. Ce sont les deux composants les plus importants qui affectent directement la fiabilité de vos services. Jetons un bref coup d'œil à chacun d'eux.

Le système d'alimentation doit résoudre les tâches suivantes :
  • La source d'énergie pour cent kilowatts - mieux une connexion directe avec une centrale électrique puissante
  • Stabilité des caractéristiques de l'alimentation électrique (courant et tension) + système de "redressement" en cas de caractéristiques hors des plages acceptables.
  • Système d'alimentation de secours, composé de générateurs, de batteries et de basculement automatique en mode hors ligne en cas d'urgence.

https://pixabay.com/
Système de refroidissement:

  • Dissipation de la chaleur
  • Contrôle de l'humidité (et statique)
  • Minimisation de la consommation de ressources et de l'impact sur l'environnement

https://pixabay.com/
Ça a l'air impressionnant, n'est-ce pas ? Et maintenant, ajoutez à tout cela les exigences écologiques pour l'impact sur l'environnement, et il s'avère que ce qui semblait être la chose la plus importante - les serveurs avec les ressources informatiques et l'équipement réseau - est presque le composant le plus simple du centre de données.

La complexité et la valeur des systèmes d'énergie et de refroidissement sont vraiment énormes et nécessitent des ingénieurs très qualifiés pour les gérer. Après tout, si un ou deux serveurs tombent en panne ou si la passerelle réseau tombe en panne, les dommages ne seront pas aussi importants que si le système d'alimentation ou de refroidissement de l'ensemble du centre de données échoue.

Mais ce n'est pas tout. Il y a d'autres départements dans le centre de données sans lesquels sa vie est impossible. Ce sont les agents de sécurité responsables à la fois de la protection contre les incidents d'information et de la sécurité "physique" du centre de données. Et si nous sommes tous plus ou moins familiers avec la sécurité de l'information, quand il s'agit de sécurité "physique", nous pensons aux tours avec des armes automatiques et aux patrouilles avec des chiens :) Mais je pense qu'en réalité, il s'agit plutôt d'un certain nombre de caméras avec un système d'analyse d'image intelligent et d'une équipe de sécurité capable de capturer rapidement les intrus du périmètre.

Et une autre chose que nous devons mentionner est la gestion. Toutes les parties et équipes du centre de données doivent être gérées d'une manière ou d'une autre. De plus, gérées de telle sorte que le nombre d'incidents conduisant à des défaillances matérielles et de connectivité tende vers zéro. Et comme nous le savons des lois de Murphy, tout peut tomber en panne au moment le plus inopportun.

Voici plusieurs règles que suivent les responsables des centres de données:

  • Chaque action est réglementée par des protocoles.
  • Chaque incident doit être analysé, et le protocole correspondant doit être révisé pour éviter que des incidents similaires ne se reproduisent à l'avenir.
  • Formation, certification et tests réguliers des employés.
  • "Exercices" réguliers et exercices pratiques d'incidents.
  • Audits externes réguliers.
  • Indépendance maximale vis-à-vis du facteur humain.

Nous pourrions parler des centres de données pendant très longtemps, car le sujet est très complexe et en même temps extrêmement intéressant. Cependant, le format de l'article n'est pas infini. J'ai essayé d'expliquer en termes simples comment fonctionnent les centres de données et de montrer leur complexité (et leur attractivité).

Si vous êtes intéressé par ce sujet, je vous recommande vivement de consulter le site Web de l'infrastructure Azure :
https://azure.microsoft.com/fr-fr/explore/global-infrastructure
Jetez un œil à la carte mondiale des régions Azure :
https://infrastructuremap.microsoft.com/
Et faites une visite virtuelle du centre de données Azure :
https://news.microsoft.com/stories/microsoft-datacenter-tour/

Eh bien, c'est tout pour le moment. Merci pour votre attention !