Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
SL-DRT-24-0703
Direction
DRT
Description du sujet de thèse
Domaine
Défis technologiques
Sujets de thèse
Apprentissage continu multimodal sous contraintes
Contrat
Thèse
Description de l'offre
Les méthodes d’apprentissage profond standard sont pensées pour utiliser des données statiques. Cela induit une limitation pratique importante lorsqu’ils sont déployés dans des environnements dynamiques et sont confrontés à des données inconnues. L’apprentissage continu permet de répondre à ce problème, surtout avec l’utilisation de grands modèles pré-entraînés. Toutefois, le déploiement de tels modèles en mode autonome est actuellement impossible dans nombreuses applications frugales qui imposent de fortes contraintes calculatoires et/ou de mémoire. De plus, la plupart des méthodes actuelles sont développées pour une seule modalité (texte ou visuel), alors que les données captées sont souvent multimodales.
Cette thèse propose d’adresser plusieurs objectifs qui permettent le déploiement pratique d’agents capables de mettre à jour leurs représentations sous contraintes. Ce déploiement implique les objectifs suivants :(1) la collecte de corpus orientés domaine et leur augmentation basée sur des modèles génératifs multimodaux, (2) la compression de modèles de fondation pour les adapter au domaine et les rendre utilisables sous contraintes calculatoires et/ou de mémoire, (3) la proposition de méthodes d’apprentissage continu efficientes pour gérer de nouvelles données multimodales, et (4) la gestion de flux de données réalistes pour prendre en compte les specificités de différents contextes applicatifs.
Université / école doctorale
Sciences et Technologies de l’Information et de la Communication (STIC)
Paris-Saclay
Localisation du sujet de thèse
Site
Saclay
Critères candidat
Formation recommandée
Master en informatique ou intelligence artificielle
Demandeur
Disponibilité du poste
01/10/2024
Personne à contacter par le candidat
AUDIGIER Romaric romaric.audigier@cea.fr
CEA
DRT/DIASI//LVIC/SAC
CEA SACLAY
DIASI/LVIC
Bat. 861 - PC 173
91191 Gif-sur-Yvette
01 69 08 01 06
Tuteur / Responsable de thèse
POPESCU Adrian adrian.popescu@cea.fr
CEA
DRT/DIASI//LASTI
CEA SACLAY - NANO INNOV
BAT. 861
Point courier 173
91191 GIF SUR YVETTE
0169080154
En savoir plus
https://kalisteo.cea.fr/index.php/