Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
SL-DRT-26-0508
Direction
DRT
Description du sujet de thèse
Domaine
Défis technologiques
Sujets de thèse
Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé
Contrat
Thèse
Description de l'offre
Depuis quelques années, l’apprentissage profond est utilisé avec succès dans de nombreux domaines et est de plus en plus intégré dans la recherche clinique et le domaine de la santé. La capacité à combiner des sources de données diverses, telles que la génomique et l’imagerie, améliore la prise de décision médicale. L’accès à de grands jeux de données hétérogènes est essentiel pour améliorer la qualité et la précision des modèles. L’apprentissage fédéré est actuellement développé pour répondre à cette exigence, en offrant la possibilité d’entraîner des modèles de manière décentralisée garantissant que les données brutes restent stockées localement du côté client (entité qui génère les données sensibles). Plusieurs frameworks open-source intègrent des protocoles de calcul sécurisé pour l’apprentissage fédéré, mais leur applicabilité au domaine de la santé demeure limitée et soulève des enjeux liés à la souveraineté des données.
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d’apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l’apprentissage fédéré afin de favoriser l’innovation en IA appliquée au domaine de la santé et notamment à la génomique.
Ce projet se focalisera sur trois axes principaux :
1) Déploiement, surveillance et optimisation de modèles d’apprentissage profond au sein de solutions d’apprentissage fédéré et décentralisé.
2) Intégration de grands modèles dans l’apprentissage collaboratif.
3) Développement de méthodes d’agrégation pour des situations non IID (Independant and Identically Distributed).
Université / école doctorale
Structure et Dynamique des Systèmes Vivants (SDSV)
Paris-Saclay
Localisation du sujet de thèse
Site
Saclay
Critères candidat
Formation recommandée
Master AI, Data Science
Demandeur
Disponibilité du poste
01/10/2026
Personne à contacter par le candidat
GAZUT Stéphane
stephane.gazut@cea.fr
CEA
DRT/DIN//LIIDE
DRT/ LIST/ DIN/ SMCD/ LIIDE
CEA Saclay, PC 192, bâtiment 565
F-91191 Gif-sur-Yvette cedex
0169088307
Tuteur / Responsable de thèse
MEYER Vincent
vmeyer@cng.fr
CEA
DRF/JACOB//LBI
CNRGH
Batiment G2
2 rue gaston cremieux
Evry
0160872592
En savoir plus