Pause
Lecture
Moteur de recherche d'offres d'emploi CEA

Stratégies performantes d'exploitation de données massives issues de simulations numériques


Détail de l'offre

Informations générales

Entité de rattachement

Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.

Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.

Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.

Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :

• La conscience des responsabilités
• La coopération
• La curiosité
  

Référence

SL-DAM-24-0588  

Direction

DAM

Description du sujet de thèse

Domaine

Sciences pour l'ingénieur

Sujets de thèse

Stratégies performantes d'exploitation de données massives issues de simulations numériques

Contrat

Thèse

Description de l'offre

Le Département Simulation et Garantie des Armes du CEA/CESTA élabore des modèles physico-numériques multi-physiques, multi-échelles et développe des codes de calcul dans les domaines de l'aérodynamique hypersonique, de l'électromagnétisme et de la dynamique rapide. Ces développements bénéficient des approches les plus modernes du génie logiciel et sont conduits dans le contexte du calcul haute performance afin de tirer le meilleur parti des supercalculateurs de la DAM.
La quantité et le rythme de production grandissants des données issues de simulations nous obligent à repenser la façon dont leur analyse est conduite. Le simple traitement des données écrites sur disque n'est plus possible, tant par la taille de ces dernières que par la capacité de les charger en mémoire avec les outils traditionnels.
Dnas ce contexte, comment analyser les volumes de données massifs générés ? Quelles peuvent être les statégies à mettre en place avant, pendant et après la simulation ?
Des nouveaux usages apparaissent dans le paysage du HPC pouvant y répondre [1], avec l'introduction progressive des techniques d'intelligence artificielle comme bases d'apprentissage, ou encore l'analyse in transit pour visualiser des données en même temps qu'elles sont produites. L'enrichissement des simulations par les données permettra d'obtenir des gains en temps et en précision.

On se propose donc dans cette thèse d'employer une nouvelle approche, orienté HPDA (High Performance Data Analytics), dans laquelle des structures de données du type RDD (Resilient Distributed Dataset) [3] pourront jouer un rôle central pour le traitement non seulement post mortem mais surtout in transit des données produites par la simulation. L'association de ces structures avec des pipelines de données [2] sera à évaluer pour disposer d'un ensemble HPC/HPDA cohérent.
Un des domaines ciblés est la rentrée atmosphérique et plus particulièrement le couplage et l'interopérabilité avec les codes 3D d'aérodynamique utilisés au département. Parmi les applications potentielles font partie l'analyse d'ensembles de calcul sur des simulations de trajectoires de rentrée ainsi que l'exploration des données produites (plusieurs centaines de Go à plusieurs To). Pour répondre à ces enjeux, les étapes de travail seront les suivantes:
1. la première phase du travail consistera à établir l'état de l'art en termes d'outils et de méthodes pour le HPDA,
2. une seconde étape consistera à mettre en œuvre une solution interopérable basée sur ces outils et potentiellement d'autres,
3. finalement, des analyses de données existantes seront portées vers cette solution pour permette de comparer les différentes approches offertes en terme d'expressivité, de performance, etc. sur des cas réalistes.

Université / école doctorale

Ecole Doctorale de Mathématiques et Informatique
Bordeaux

Localisation du sujet de thèse

Site

Cesta

Critères candidat

Formation recommandée

Master 2 informatique

Demandeur

Disponibilité du poste

01/09/2024

Personne à contacter par le candidat

FOVET Benjamin benjamin.fovet@cea.fr
CEA
DAM CESTA
Cea-Cesta
33114 Le Barp
0557044705

Tuteur / Responsable de thèse

MAABOUT Sofian maabout@u-bordeaux.fr
Université de Bordeaux
LaBRI
351, cours de la Libération F-33405 Talence cedex
+33 540 00 35 27

En savoir plus