Où docteurs et entreprises se rencontrent
Menu
Connexion

Détection non supervisée d’images anormales : vers une compréhension améliorée de l’espace latent pour améliorer les performances

ABG-130035 Sujet de Thèse
26/03/2025 Cifre
MINES Paris - PSL
Fontainebleau - Ile-de-France - France
Détection non supervisée d’images anormales : vers une compréhension améliorée de l’espace latent pour améliorer les performances
  • Sciences de l’ingénieur
  • Informatique
  • Mathématiques
Analyse d'images, deep learning, apprentissage profond

Description du sujet

Directeur de thèse : Etienne Decencière, directeur de recherche à Mines Paris - PSL

Encadrants industriels : Vaïa Machairas, Sofiane Medjkoune, Capgemini Invent

Contexte

Dans de nombreuses applications on dispose d’un nombre important d’images considérées comme normales, mais d’un nombre très réduit d’images anormales. On retrouve cette situation dans le milieu médical, avec les maladies rares, mais aussi dans le contrôle industriel, où il est souvent difficile d’anticiper tous les cas d’anomalies. Et en effet, apprendre à détecter des anomalies alors qu’on ne dispose que d’exemples d’images normales a été pendant longtemps un objectif inatteignable. L’arrivée de deep learning a changé les choses.

La détection non supervisée d’images anormales est ainsi devenue un sujet brûlant, qui commence à être appliqué industriellement. Des travaux récents [bertoldo2025] mettent en évidences des limites actuelles dans la construction, la compréhension et l’utilisation des espaces latents employés par la plupart des méthodes du domaine. La thèse que nous proposons a pour but de s’attaquer à ces limites pour casser les verrous technologiques qui empêchent aujourd’hui d’utiliser plus largement ces approches.

Projet de recherche

Les travaux de Liu et al. [Liu2023] et de Bertoldo [Bertoldo2025] montrent que l’exploitation actuelle de l’espace latent pour la détection d’anomalies reste empirique, sans véritable compréhension des phénomènes en jeu.

Trois types d’espaces latents sont employés pour la détection d’images anormales. Historiquement, le premier résulte de l’utilisation d’auto-encodeurs [Sakurada2014], éventuellement variationnels. Le deuxième utilise des réseaux pré-entraînés, typiquement optimisés sur des tâches de classification portant sur la base publique ImageNet [Rippel2020]. Enfin, le troisième utilise l’apprentissage autosupervisé [Langrognet2025].

La première partie de cette thèse portera sur la construction d’expériences pour mieux comprendre le fonctionnement de ces trois types d’espaces latents. On prendra comme point de départ les travaux de Bertoldo [Bertoldo2025]. Dans un deuxième temps, on exploitera les renseignements ainsi acquis pour améliorer la procédure de construction et d’utilisation de ces espaces.

Les méthodes développées seront testées sur des bases de données publiques et appliquées à des cas d’usage proposés par Capgemini Invent.

Références bibliographiques

[bertoldo2025] Bertoldo : Contributions à la détection non supervisée d'anomalies visuelles, thèse de PSL réalisée à Mines Paris, février 2025.

[langrognet2025] Langrognet, Faucon, Decencière : Self-Supervised Metric Learning for Gaussian Anomaly Detection in Fundus Images, ISBI 2025.

[Liu2023] Liu, Z., Zhou, Y., Xu, Y., and Wang, Z. SimpleNet: A Simple Network for Image Anomaly Detection and Localization, CVPR 2023.

[Rippel2020] Rippel, O., Mertens, P., and Merhof, D. (2020). Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection. arXiv:2005.14140.

[Sakurada2014] Sakurada, M. and Yairi, T. (2014). Anomaly Detection Using Autoencoders with Nonlinear Dimensionality Reduction. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data Analysis. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data Analysis.

Prise de fonction :

01/10/2025

Nature du financement

Cifre

Précisions sur le financement

Capgemini Invent

Présentation établissement et labo d'accueil

MINES Paris - PSL

Le Centre de morphologie mathématique (CMM) est le laboratoire d'analyse d'images de l'Ecole des Mines de Paris. Les chercheurs du centre puisent des défis auprès de leurs partenaires pour motiver le développement de nouvelles méthodes. Les domaines d'application sont variés: ils vont de la science des matériaux jusqu'à l'écologie, en passant par la médecine et le contrôle industriel. Les méthodes font appel au deep learning. La culture scientifique des chercheurs du laboratoire donne lieu à des approches originales, combinant la solidité des bases théoriques avec la recherche d'une pertinence pratique.

Intitulé du doctorat

Doctorat en morphologie mathématique

Pays d'obtention du doctorat

France

Etablissement délivrant le doctorat

Paris Sciences et Lettres - PSL

Ecole doctorale

Ingénierie des Systèmes, Matériaux, Mécanique, Energétique

Profil du candidat

Le∙a candidat∙e retenu∙e doit avoir une solide formation en mathématiques, une expérience
avec des outils d'apprentissage tels que Tensorflow, Jax et/ou PyTorch, et une motivation
pour la recherche en analyse d'images, dans un cadre industriel.

30/04/2025
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?