L'expérience LHCb au CERN est l’expérience de référence dans le monde pour la physique de la saveur des quarks, et elle mène à bien un vaste programme de physique des particules. Les données qu'elle a collectées lors des deux premières périodes d'exploitation du Grand collisionneur de hadrons (LHC) ont été utilisées pour plus de 600 publications scientifiques et ont notamment été à l'origine de plusieurs découvertes notables. Tous les résultats scientifiques de la collaboration LHCb ont déjà été rendus publics grâce à la publication en libre accès des articles ; les données utilisées par les scientifiques pour obtenir leurs résultats sont désormais accessibles à tous sur le portail de données ouvertes du CERN. Les ensembles de données sont rendus publics dans le cadre de la politique de science ouverte du CERN, qui reflète les valeurs de transparence et de collaboration internationale inscrites dans la Convention du CERN depuis plus de 60 ans.
« Les données collectées à LHCb constituent un patrimoine exceptionnel pour l'humanité car aucune autre expérience ne couvre la région observée par ce détecteur, souligne Sebastian Neubert, à la tête du projet Données ouvertes de LHCb. C'est le résultat d'un gigantesque effort de collaboration internationale financé par des fonds publics. Les données appartiennent donc à la société. »
L'échantillon de données rendu public représente 20 % de l'ensemble de données collectées par l'expérience LHCb en 2011 et 2012, lors de la première période d'exploitation du LHC. Il contient 200 téraoctets d'informations sur les collisions proton-proton filtrées et enregistrées dans le détecteur. La collaboration LHCb a réalisé un premier traitement des données en reconstituant les signatures observées par l'expérience, comme les trajectoires des particules chargées, à partir des informations brutes recueillies par son système de détection complexe. Les données sont filtrées et classées par processus et mode de désintégration (environ 300 catégories), puis mises à disposition sous la même forme que pour les physiciens de l'expérience.
Analyser les données du LHC est un exercice complexe qui prend du temps. Aussi, pour faciliter la tâche, les échantillons sont accompagnés d'une importante documentation et d'un grand nombre de métadonnées, ainsi que d'un glossaire expliquant les centaines de termes spécialisés utilisés pour le premier traitement. Les données peuvent être analysées grâce à des algorithmes propres à LHCb, mis à disposition en tant que logiciel open source.
Les données conviennent pour différents types d'études de physique et tout le monde peut les télécharger. « Elles sont supposées être utilisées par des scientifiques professionnels car, pour pouvoir les interpréter, une certaine connaissance de la physique des particules est nécessaire ; mais tout le monde peut tenter sa chance, poursuit Sebastian Neubert. Ce serait formidable que ces données soient à l'origine de nouveaux axes de recherche et soient utilisées par des scientifiques d'autres disciplines, comme la science des données ou l'intelligence artificielle. Nous attendons avec impatience que les utilisateurs de ces données nous fassent part de leurs découvertes.
La collaboration LHCb prévoit de publier d'autres données à l'avenir. Pour en savoir plus, rendez-vous sur le site web de l’expérience LHCb (en anglais).
La collaboration LHCb souhaite remercier le département Technologies de l’information du CERN d'avoir permis de mettre à disposition ces données sur le portail des données du CERN.