Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
SL-DRT-24-0526
Direction
DRT
Description du sujet de thèse
Domaine
Défis technologiques
Sujets de thèse
Interactions en langage naturel pour la détection d'anomalies dans des séries temporelles mono et multivariées en utilisant des modèles de langage fondateurs (fondation models) et la génération augmentée par indexation-plongement-récupération (RAG))
Contrat
Thèse
Description de l'offre
La détection d'anomalies dans les séries temporelles mono et multivariées dépend fortement du contexte de la tâche. Les approches de l'état de l'art reposent généralement sur deux méthodes principales : premièrement, une acquisition extensive de données est réalisée pour entraîner des modèles d'intelligence artificielle tels que les auto-encodeurs, capables d'apprendre des représentations latentes utiles pour isoler l'anormalité dans les comportements attendus du système; une seconde approche consiste en la construction minutieuse de caractéristiques basée sur une approche associant un expert intelligence artificielle et un expert du domaine pour isoler les anomalies en utilisant des exemples limités. Une analyse approfondie de la littérature montre que le terme de détection d'anomalies repose sur une définition ambiguë, car un motif donné dans une série temporelle peut apparaître comme normal ou anormal selon le domaine d'application et le contexte immédiat de la série observée. Les modèles de fondation (fondation models) et la génération augmentée par indexation-plongement-récupération (Retrieval Augmented Generation) ont le potentiel de modifier substantiellement les approches de détection d'anomalies. L'idée est qu'un expert du domaine, à travers des interactions en langage naturel, pourrait être en mesure de spécifier la normalité et/ou l'anormalité du comportement du système, et une indexation conjointe de la littérature de l'état de l'art et du plongement de des séries temporelles dans un espace euclidien réduit pourrait guider cet expert du domaine à définir un algorithme de détection d'anomalies fonctionnel.
Université / école doctorale
Sciences et Technologies de l’Information et de la Communication (STIC)
Paris-Saclay
Localisation du sujet de thèse
Site
Saclay
Critères candidat
Formation recommandée
Data science / intelligence artificielle / informatique
Demandeur
Disponibilité du poste
01/09/2024
Personne à contacter par le candidat
GOUY-PAILLER Cédric cedric.gouy-pailler@cea.fr
CEA
DRT/DIN//LIIDE
CEA Saclay
Bâtiment 565, PC 192
91 191 Gif-sur-Yvette
01 69 08 41 87
Tuteur / Responsable de thèse
GOUY-PAILLER Cédric cedric.gouy-pailler@cea.fr
CEA
DRT/DIN//LIIDE
CEA Saclay
Bâtiment 565, PC 192
91 191 Gif-sur-Yvette
01 69 08 41 87
En savoir plus