• Aucun résultat trouvé

Online, 13 TeV

3.3 Traitement des données

Figure 3.13 – Les détecteurs vers l’avant d’ATLAS [89]. Ils permettent d’étudier les propriétés des particules

qui se sont éloignées de plusieurs mètres du point d’interaction dans le détecteur d’ATLAS. Diet Qireprésentent

respectivement les électroaimants dipôles et quadrupôles du LHC.

3.3 Traitement des données

Le traitement des données produites auprès du LHC représente un véritable défi puisque les expériences génèrent une quantité de données phénoménale : près de 15 millions de milliards d’octets par an, soit l’équivalent de 20 millions de CDs. La taille d’une collision enregistrée par ATLAS est d’environ 1.6 million d’octets (1.6

MB) [90]. Étant donné que la fréquence de collision du LHC est de 40 MHz, l’enregistrement de chaque

collision entraîne un débit de données d’environ 60 téraoctets par seconde (60 TB/s). Avec ces volumes de données et les calculs nécessaires, il n’est plus possible de tout faire au CERN.

Le flux de données est traité selon deux approches. D’un côté, un système spécialisé de sélection d’événements, le système de déclenchement, est utilisé pour sélectionner des événements ayant des caractéristiques distinctives qui les rendent intéressants pour les analyses physiques. D’un autre côté, pour pouvoir faire face à l’infrastructure de calcul nécessaire au traitement et au stockage des données, les expériences se servent du calcul distribué qui permet d’exploiter de façon optimale les ressources informatiques quelle que soit leur localisation.

3.3.1 Système de déclenchement et d’acquisition des données

Le système de déclenchement d’ATLAS doit réduire le taux d’événements de 40 MHz à un taux d’environ 1 KHz, soit le taux maximal auquel les données peuvent être traitées. Il est divisé en deux étages successifs :

• le niveau 1 : le déclencheur de niveau 1 (Level 1 ou L1) est un déclencheur physique implémenté

dans des composants électroniques des sous-détecteurs d’ATLAS. Il utilise des informations provenant des chambres à muons, des calorimètres et des détecteurs vers l’avant. Le déclencheur L1 filtre des signaux de particules à haute impulsion transverse : muons, électrons, photons et jets, ainsi que de grandes énergies transverses manquantes et totales. Pour chaque événement, le déclencheur L1 définit une ou plusieurs régions d’intérêt (RoI); Ce sont les régions du détecteur où le processus de sélection a identifié des caractéristiques intéressantes. La décision L1 est caractérisée par une latence globale inférieure à 2.5 µs réduisant le taux d’événements à environ 100 kHz.

• le niveau 2 : le déclencheur de haut niveau (HLT) est un déclencheur logiciel. Il utilise toutes les

informations disponibles, identifiées par le déclencheur L1, en exploitant l’ensemble du détecteur et des algorithmes de type hors ligne. Le HLT réduit le débit de sortie à environ 1 kHz avec un temps de traitement nominal d’environ 4 s.

La figure3.14montre un exemple de taux de déclenchement L1 et HLT regroupés par signature de déclencheur.

3.3.2 La Grille de calcul mondiale pour le LHC

La Grille de calcul mondiale pour le LHC, WLCG (Worldwide LHC Computing Grid), est une collaboration entre de nombreux centres de calcul et de stockage répartis dans le monde entier. Elle est actuellement composée de plus de 170 centres de calcul, appelés aussi sites, répartis dans 42 pays. Les sites sont mis à disposition de

Figure 3.14 – Vue globale du système de déclenchement et d’acquisition de données.

plus de 8 000 chercheurs travaillant sur les quatre grandes expériences du LHC et qui sollicitent activement les données et les analysent en temps quasi-réel.

La Grille de calcul WLCG est structurée en différents niveaux appelés Tier :

le Tier0 : il regroupe deux sites qui sont le centre de calcul situé au CERN et un deuxième situé à

Budapest, en Hongrie. Les deux sites sont connectés via trois liaisons de données à 100 Gbit/s en débit. Le rôle de Tier0 est d’une part de sauvegarder, au fur et à mesure de leur arrivée, les données produites par les expériences et de les répliquer dans un des sites de Tier1 pour le stockage et le traitement ultérieur. D’autre part, Tier0 effectue le premier traitement des données des expériences.

le Tier1 : les sites de Tier1 sont de grands sites nationaux, disposant d’une capacité de stockage

suffisante et prenant en charge la grille 24 heures sur 24. Ils sont au nombre de 13 comme on peut le voir

sur la figure3.15, y compris le Centre de Calcul de l’IN2P32(CC-IN2P3) en France. Les 13 sites de

Tier1 sont responsables de la sauvegarde d’une part proportionnelle des données brutes et reconstruites, du re-traitement à grande échelle et de la sauvegarde de la sortie correspondante, de la distribution des données aux sites du Tier2 et de la sauvegarde d’une partie des données simulées produites dans ces sites.

le Tier2 : les 160 sites de Tier2 (figure 3.15) sont généralement des universités ou des instituts

scientifiques, qui peuvent stocker suffisamment de données et fournir une puissance de calcul suffisante pour des tâches d’analyse spécifiques. Ils permettent de produire les données de simulation et accueillent les tâches d’analyse des utilisateurs. Ils hébergent donc aussi de façon partagée les données des détecteurs ou de simulation une fois traitées.

le Tier3 : il n’y a pas d’engagement formel entre WLCG et les sites de Tier3 en terme de ressources

3.4 Conclusion

minimales à fournir aux expériences LHC. Ils mettent néanmoins à disposition leurs ressources (fermes de calcul ou même simplement un PC individuel), en particulier pour l’analyse, en priorité à leurs utilisateurs locaux. Ces sites peuvent aussi fournir des ressources pour effectuer de la simulation.

Figure 3.15 – Schéma montrant la structure de Tier0, Tier1 et Tier2

3.4 Conclusion

L’accélérateur-collisonneur LHC a été décrit dans ce chapitre, ainsi que le détecteur ATLAS et le traitement des données. On a vu que les protons entrent en collision à de très hautes énergies à l’intérieur du détecteur ATLAS, produisant de nouvelles particules qui se désintègrent de façon très complexe en traversant les différents sous-détecteurs (le détecteur interne, les calorimètres, le spectromètre à muons). Ceux-ci enregistrent le passage de chaque particule sous forme de signaux électriques, regroupant les informations pour créer un résumé numérique de la collision (événement). Cependant ces signaux ne sont pas directement exploitables en l’état dans les analyses de physique où l’on manipule plutôt des particules (électron, muon, jets, etc) et des quantités physiques (masse, énergie, impulsion transverse, etc). Le chapitre suivant décrit les procédures employées pour la reconstruction des événements à partir des données enregistrées et simulées.

C H A P I T R E 4