Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
SL-DRF-25-0803
Direction
DRF
Description du sujet de thèse
Domaine
Autre
Sujets de thèse
Apprentissage automatique pour l’inspection visuel et la reconstruction d’état final dans l’expérience ATLAS
Contrat
Thèse
Description de l'offre
Le grand collisionneur de hadrons (LHC) collecte des données à une énergie record de 13.6 TeV, permettant d'explorer une nouvelle frontière en énergie. La phase haute luminosité (HL-LHC) est également déjà en préparation. Un des objectifs majeurs du (HL-)LHC est de découvrir de potentielles déviations par rapport aux prédictions du Modèle Standard de la physique des particules. Pour cela, il est important d'étudier la pierre angulaire du modèle, le boson de Higgs et le quark top, la particule élémentaire la plus massive connue.
Le sujet de thèse vise à développer des techniques d'apprentissage automatique pour deux projets au sein de l'expérience ATLAS au LHC: l'inspection visuelle des nouveaux modules du trajectographe d’ATLAS et la reconstruction d’état final pour étudier des processus rares avec plusieurs leptons dans l'état final.
Pour répondre aux exigences du HL-LHC, le détecteur interne d'ATLAS sera remplacé par un nouveau détecteur tout en silicium, comprenant des modules à pixels. La production de ces modules implique plusieurs étapes d'assemblage, suivies d'un contrôle qualité. La première partie de la thèse vise à automatiser l'inspection visuelle des contacts métalliques (pads) des modules avant leur connexion à l'électronique. Des travaux préliminaires ont montré que des défauts visibles sur les pads peuvent être détectés par des algorithmes d'apprentissage automatique.
Le travail de thèse explorera plusieurs directions :
- Une investigation complète des approches supervisées. La période de démarrage de la production permettra de collecter le jeu de données nécessaire pour entraîner des modèles de segmentation supervisée visant non seulement à détecter les anomalies, mais aussi à les classer.
- Une investigation de la détection d'anomalies non supervisée basée sur des modèles génératifs. Le modèle DRAEM [1], par exemple, apprend une représentation conjointe d'une image anormale, sa reconstruction sans anomalie, et simultanément à distinguer les deux. Des modèles génératifs avancés, tels que les GANs, pourront être testés.
- Une investigation de divers modèles traitant une surface de pad sans anomalie comme un bruit de fond. Ces algorithmes peuvent être utilisés pour augmenter l'information et des autoencodeurs pour réduire le bruit.
La deuxième partie de la thèse sera consacrée à l'étude de processus rares impliquant des quarks top et des bosons (ttW, ttZ, ttH, tH, 4tops). Ces processus ont été observés pour la première fois à l'aide du jeu de données enregistré à 13 TeV (sauf tH) dans des états finaux avec plusieurs leptons. Cependant, ces analyses ont toujours été réalisées séparément, ce qui limite fortement notre compréhension globale, en raison de corrélations importantes mais inconnues entre les mesures. L'approche proposée ici consiste à développer une analyse globale pour remédier à ces limitations. Cette approche nécessite des techniques de pointe pour reconstruire précisément l'état final, rendu complexe par les neutrinos non détectés et la combinatoire due aux produits de désintégration. Une approche basée sur des GNN a déjà été testées, mais d'autres modèles doivent être explorés pour améliorer les performances de reconstruction. Deux modèles en particulier, développés au sein de la communauté du LHC, sont interessants :
- Le modèle topograph [2], également basé sur des GNN, utilise des informations supplémentaires sur la chaîne de désintégration de l'événement.
- Le modèle Spanet [3], un réseau d'attention préservant les symétries, exploite les invariances naturelles pour trouver efficacement des correspondances entre particules sans évaluer toutes les permutations.
Une évaluation des incertitudes pertinentes est également un aspect important lors de l'utilisation de ces outils.
Ce projet double offre l'opportunité d'être impliqué dans toute la chaîne de développement des applications de l’intelligence artificielle, tout en faisant partie de la collaboration mondiale ATLAS.
Université / école doctorale
PHENIICS (PHENIICS)
Paris-Saclay
Localisation du sujet de thèse
Site
Saclay
Critères candidat
Formation recommandée
formation en intelligence artificielle avec des connaissances en physique des particules
Demandeur
Disponibilité du poste
01/10/2025
Personne à contacter par le candidat
DELIOT Frédéric
frederic.deliot@cern.ch
CEA
DRF/IRFU
CEA-Saclay
Irfu/DPhP
91191 Gif-sur-Yvette CEDEX
0169086424
Tuteur / Responsable de thèse
DELIOT Frédéric
frederic.deliot@cern.ch
CEA
DRF/IRFU
CEA-Saclay
Irfu/DPhP
91191 Gif-sur-Yvette CEDEX
0169086424
En savoir plus