Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Interactions en langage naturel pour la détection d'anomalies dans des séries temporelles mono et multiv


Détail de l'offre

Informations générales

Entité de rattachement

Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.

Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.

Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.

Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :

• La conscience des responsabilités
• La coopération
• La curiosité
  

Référence

SL-DRT-24-0526  

Direction

DRT

Description du sujet de thèse

Domaine

Défis technologiques

Sujets de thèse

Interactions en langage naturel pour la détection d'anomalies dans des séries temporelles mono et multivariées en utilisant des modèles de langage fondateurs (fondation models) et la génération augmentée par indexation-plongement-récupération (RAG))

Contrat

Thèse

Description de l'offre

La détection d'anomalies dans les séries temporelles mono et multivariées dépend fortement du contexte de la tâche. Les approches de l'état de l'art reposent généralement sur deux méthodes principales : premièrement, une acquisition extensive de données est réalisée pour entraîner des modèles d'intelligence artificielle tels que les auto-encodeurs, capables d'apprendre des représentations latentes utiles pour isoler l'anormalité dans les comportements attendus du système; une seconde approche consiste en la construction minutieuse de caractéristiques basée sur une approche associant un expert intelligence artificielle et un expert du domaine pour isoler les anomalies en utilisant des exemples limités. Une analyse approfondie de la littérature montre que le terme de détection d'anomalies repose sur une définition ambiguë, car un motif donné dans une série temporelle peut apparaître comme normal ou anormal selon le domaine d'application et le contexte immédiat de la série observée. Les modèles de fondation (fondation models) et la génération augmentée par indexation-plongement-récupération (Retrieval Augmented Generation) ont le potentiel de modifier substantiellement les approches de détection d'anomalies. L'idée est qu'un expert du domaine, à travers des interactions en langage naturel, pourrait être en mesure de spécifier la normalité et/ou l'anormalité du comportement du système, et une indexation conjointe de la littérature de l'état de l'art et du plongement de des séries temporelles dans un espace euclidien réduit pourrait guider cet expert du domaine à définir un algorithme de détection d'anomalies fonctionnel.

Université / école doctorale

Sciences et Technologies de l’Information et de la Communication (STIC)
Paris-Saclay

Localisation du sujet de thèse

Site

Saclay

Critères candidat

Formation recommandée

Data science / intelligence artificielle / informatique

Demandeur

Disponibilité du poste

01/09/2024

Personne à contacter par le candidat

GOUY-PAILLER Cédric cedric.gouy-pailler@cea.fr
CEA
DRT/DIN//LIIDE
CEA Saclay
Bâtiment 565, PC 192
91 191 Gif-sur-Yvette
01 69 08 41 87

Tuteur / Responsable de thèse

GOUY-PAILLER Cédric cedric.gouy-pailler@cea.fr
CEA
DRT/DIN//LIIDE
CEA Saclay
Bâtiment 565, PC 192
91 191 Gif-sur-Yvette
01 69 08 41 87

En savoir plus