Détection non supervisée d’images anormales : vers une compréhension améliorée de l’espace latent pour améliorer les performances
ABG-130035 | Sujet de Thèse | |
26/03/2025 | Cifre |
- Sciences de l’ingénieur
- Informatique
- Mathématiques
Description du sujet
Directeur de thèse : Etienne Decencière, directeur de recherche à Mines Paris - PSL
Encadrants industriels : Vaïa Machairas, Sofiane Medjkoune, Capgemini Invent
Contexte
Dans de nombreuses applications on dispose d’un nombre important d’images considérées comme normales, mais d’un nombre très réduit d’images anormales. On retrouve cette situation dans le milieu médical, avec les maladies rares, mais aussi dans le contrôle industriel, où il est souvent difficile d’anticiper tous les cas d’anomalies. Et en effet, apprendre à détecter des anomalies alors qu’on ne dispose que d’exemples d’images normales a été pendant longtemps un objectif inatteignable. L’arrivée de deep learning a changé les choses.
La détection non supervisée d’images anormales est ainsi devenue un sujet brûlant, qui commence à être appliqué industriellement. Des travaux récents [bertoldo2025] mettent en évidences des limites actuelles dans la construction, la compréhension et l’utilisation des espaces latents employés par la plupart des méthodes du domaine. La thèse que nous proposons a pour but de s’attaquer à ces limites pour casser les verrous technologiques qui empêchent aujourd’hui d’utiliser plus largement ces approches.
Projet de recherche
Les travaux de Liu et al. [Liu2023] et de Bertoldo [Bertoldo2025] montrent que l’exploitation actuelle de l’espace latent pour la détection d’anomalies reste empirique, sans véritable compréhension des phénomènes en jeu.
Trois types d’espaces latents sont employés pour la détection d’images anormales. Historiquement, le premier résulte de l’utilisation d’auto-encodeurs [Sakurada2014], éventuellement variationnels. Le deuxième utilise des réseaux pré-entraînés, typiquement optimisés sur des tâches de classification portant sur la base publique ImageNet [Rippel2020]. Enfin, le troisième utilise l’apprentissage autosupervisé [Langrognet2025].
La première partie de cette thèse portera sur la construction d’expériences pour mieux comprendre le fonctionnement de ces trois types d’espaces latents. On prendra comme point de départ les travaux de Bertoldo [Bertoldo2025]. Dans un deuxième temps, on exploitera les renseignements ainsi acquis pour améliorer la procédure de construction et d’utilisation de ces espaces.
Les méthodes développées seront testées sur des bases de données publiques et appliquées à des cas d’usage proposés par Capgemini Invent.
Références bibliographiques
[bertoldo2025] Bertoldo : Contributions à la détection non supervisée d'anomalies visuelles, thèse de PSL réalisée à Mines Paris, février 2025.
[langrognet2025] Langrognet, Faucon, Decencière : Self-Supervised Metric Learning for Gaussian Anomaly Detection in Fundus Images, ISBI 2025.
[Liu2023] Liu, Z., Zhou, Y., Xu, Y., and Wang, Z. SimpleNet: A Simple Network for Image Anomaly Detection and Localization, CVPR 2023.
[Rippel2020] Rippel, O., Mertens, P., and Merhof, D. (2020). Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection. arXiv:2005.14140.
[Sakurada2014] Sakurada, M. and Yairi, T. (2014). Anomaly Detection Using Autoencoders with Nonlinear Dimensionality Reduction. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data Analysis. In Proceedings of the 2nd Workshop on Machine Learning for Sensory Data Analysis.
Prise de fonction :
Nature du financement
Précisions sur le financement
Présentation établissement et labo d'accueil
Le Centre de morphologie mathématique (CMM) est le laboratoire d'analyse d'images de l'Ecole des Mines de Paris. Les chercheurs du centre puisent des défis auprès de leurs partenaires pour motiver le développement de nouvelles méthodes. Les domaines d'application sont variés: ils vont de la science des matériaux jusqu'à l'écologie, en passant par la médecine et le contrôle industriel. Les méthodes font appel au deep learning. La culture scientifique des chercheurs du laboratoire donne lieu à des approches originales, combinant la solidité des bases théoriques avec la recherche d'une pertinence pratique.
Site web :
Intitulé du doctorat
Pays d'obtention du doctorat
Etablissement délivrant le doctorat
Ecole doctorale
Profil du candidat
Le∙a candidat∙e retenu∙e doit avoir une solide formation en mathématiques, une expérience
avec des outils d'apprentissage tels que Tensorflow, Jax et/ou PyTorch, et une motivation
pour la recherche en analyse d'images, dans un cadre industriel.
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
MabDesign
PhDOOC
Groupe AFNOR - Association française de normalisation
ADEME
Institut Sup'biotech de Paris
ONERA - The French Aerospace Lab
Aérocentre, Pôle d'excellence régional
Généthon
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
CESI
TotalEnergies
MabDesign
Nokia Bell Labs France
Ifremer
SUEZ
CASDEN
ANRT
Tecknowmetrix
Laboratoire National de Métrologie et d'Essais - LNE
-
EmploiRef. 130080Paris , Ile-de-France , FranceAgence Nationale de la Recherche
Chargé ou chargée de projets scientifiques bioéconomie H/F
Expertises scientifiques :Biochimie
Niveau d’expérience :Confirmé
-
Sujet de ThèseRef. 130176Strasbourg , Grand Est , FranceInstitut Thématique Interdisciplinaire IRMIA++
Schrödinger type asymptotic model for wave propagation
Expertises scientifiques :Mathématiques - Mathématiques