Au CERN, on a l’habitude de gérer une montagne de données, mais ce qu’on entend par « montagne » en termes de chiffres a considérablement évolué au fil des années. De nos jours, les expériences LHC enregistrent chaque jour un peu moins de trois pétaoctets (Po) de données de collision en moyenne, soit presque autant que la quantité de données enregistrées en un mois lors de la première période d’exploitation. Près de 200 Po de données ont déjà été écrites sur disque dans le cadre de la campagne de protons 2024. En comparaison, seuls 204 Po de données ont été enregistrés sur l’ensemble de la deuxième période d’exploitation, entre 2015 et 2018. Les prochaines campagnes et les futurs accélérateurs produiront toujours plus de données ; la tendance est déjà très marquée, mais se précisera au fil des années.
En 2020, il est apparu clairement que le Centre de données de Meyrin, à lui tout seul, ne suffirait plus à faire face à toutes les données produites par les expériences LHC au CERN. La seule solution viable pour augmenter les capacités de stockage et de traitement était de construire un nouveau centre : le Centre de données de Prévessin, inauguré en début d’année.
Il existe des différences fondamentales entre ces deux infrastructures : « Le Centre de données de Meyrin est très robuste et entièrement couvert par des systèmes d’alimentation électrique sans coupure (UPS), mais il n’est capable de soutenir qu’une densité de puissance basse dans les baies, explique Wayne Salter, responsable du groupe Fabric du département IT, chargé des achats, de la gestion et de l’exploitation des centres de données. Ce centre est donc plus adapté aux équipements de basse densité qui nécessitent une alimentation sans faille, comme pour le stockage. Dans le nouveau Centre de données de Prévessin, où l’on ne dispose pas d’une couverture UPS totale, on se concentre sur la capacité de traitement, moins vulnérable aux coupures de courant, qui est entièrement mise à disposition de la Grille de calcul mondiale pour le LHC (WLCG). »
Toutes les données produites au CERN continuent de passer par le Centre de données de Meyrin. C’est le seul endroit qui soit connecté à toutes les expériences grâce au réseau ultra-rapide de fibres optiques. C’est là que les données sont encore collectées, copiées et réparties.
Outre la construction d’un nouveau centre de données, une mise à niveau générale des services IT du CERN est un processus continu essentiel. Dans le cadre de celui-ci, le service de supervision du Centre de données de Meyrin a été fermé à la fin du mois de mars. Depuis, les deux centres de données sont gérés à distance, les fonctions les plus importantes étant prises en charge par les opérateurs du Centre de contrôle du CERN (CCC).
Les interventions de terrain 24 heures sur 24 ne sont plus nécessaires dans les centres de données, grâce à une combinaison de services IT résilients et, dans certains cas, autoréparables. « Des années 1960 jusqu’à récemment, les opérateurs du service de supervision ont joué un rôle essentiel dans le stockage et le traitement des données, ainsi que dans l’exploitation des équipements informatiques. Ils géraient de vastes bibliothèques de bandes, qui constituaient un dépositaire central pour le stockage de données, explique Olof Bärring, responsable de la section Infrastructures et exploitation au sein du groupe Fabric, chargée de l’exploitation des centres de données. Durant des décennies, le succès de l’informatique au CERN s’est appuyé les compétences hautement spécialisées des opérateurs du service de supervision, qui effectuaient les opérations manuellement. Leur contribution a été inestimable, et elle restera dans les annales du CERN. »
Que nous réserve l’avenir ? Comment le CERN réussira-il à gérer le taux de production croissant des données issues des futures expériences ? « Il est probablement trop tôt pour prédire le volume exact de données produites par les futurs accélérateurs et comment nous y feront face, mais nous savons que de grands défis nous attendent, et que seule une organisation minutieuse et précoce permettra à notre communauté scientifique de les relever », explique Wayne Salter. Pour répondre aux besoins du LHC à haute luminosité, le département IT envisage déjà l’agrandissement du Centre de données de Prévessin en 2027, afin de disposer de plus d’espace et de puissance, et de continuer à gérer les besoins croissants du Centre de données de Meyrin.