Transformer de vision multimodale efficace pour système embarqué // Efficient Multimodal Vision Transformers for Embedded System
ABG-127247 | Thesis topic | |
2024-11-28 | Public/private mixed funding |
CEA Evry Val d’Essonne Laboratoire Intelligence Artificielle Embarquée
Saclay
Transformer de vision multimodale efficace pour système embarqué // Efficient Multimodal Vision Transformers for Embedded System
- Data science (storage, security, measurement, analysis)
Data intelligence dont Intelligence Artificielle / Défis technologiques / Informatique et logiciels / Sciences pour l’ingénieur
Topic description
La thèse proposée se concentre sur l'optimisation des transformers multimodaux de vision (ViT) pour la segmentation panoptique d'objets, en explorant deux axes principaux. Il s'agit d'abord de développer un pipeline de fusion polyvalent pour intégrer des données multimodales (RGB, IR, profondeur, événements, nuages de points), en exploitant les relations d'alignement inter-modales. Ensuite, une approche combinant le pruning et la quantification à précision mixte sera étudiée. L'objectif global est de concevoir des modèles ViT multimodaux légers, adaptés aux contraintes des systèmes embarqués, tout en optimisant leurs performances et en réduisant la complexité computationnelle.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The proposed thesis focuses on the optimization of multimodal vision transformers (ViT) for panoptic object segmentation, exploring two main directions. The first is to develop a versatile fusion pipeline to integrate multimodal data (RGB, IR, depth, events, point clouds) by leveraging inter-modal alignment relationships. The second is to investigate an approach combining pruning and mixed-precision quantization. The overall goal is to design lightweight multimodal ViT models, tailored to the constraints of embedded systems, while optimizing their performance and reducing computational complexity.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Systèmes et Circuits Intégrés Numériques (LIST)
Service : DSCIN
Laboratoire : Laboratoire Intelligence Artificielle Embarquée
Date de début souhaitée : 01-10-2025
Ecole doctorale : Sciences et Technologies de l’Information et de la Communication (STIC)
Directeur de thèse : BOUCHAFA-BRUNEAU Samia
Organisme : Univ Evry/Université Paris-Saclay
Laboratoire : Laboratoire IBISC - Univ Evry/Université Paris-Saclay
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
The proposed thesis focuses on the optimization of multimodal vision transformers (ViT) for panoptic object segmentation, exploring two main directions. The first is to develop a versatile fusion pipeline to integrate multimodal data (RGB, IR, depth, events, point clouds) by leveraging inter-modal alignment relationships. The second is to investigate an approach combining pruning and mixed-precision quantization. The overall goal is to design lightweight multimodal ViT models, tailored to the constraints of embedded systems, while optimizing their performance and reducing computational complexity.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Systèmes et Circuits Intégrés Numériques (LIST)
Service : DSCIN
Laboratoire : Laboratoire Intelligence Artificielle Embarquée
Date de début souhaitée : 01-10-2025
Ecole doctorale : Sciences et Technologies de l’Information et de la Communication (STIC)
Directeur de thèse : BOUCHAFA-BRUNEAU Samia
Organisme : Univ Evry/Université Paris-Saclay
Laboratoire : Laboratoire IBISC - Univ Evry/Université Paris-Saclay
Funding category
Public/private mixed funding
Funding further details
Presentation of host institution and host laboratory
CEA Evry Val d’Essonne Laboratoire Intelligence Artificielle Embarquée
Pôle fr : Direction de la Recherche Technologique
Pôle en : Technological Research
Département : Département Systèmes et Circuits Intégrés Numériques (LIST)
Service : DSCIN
Candidate's profile
Master en informatique/vision par ordinateur/intelligence artificielle
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
More information about ABG?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
- TotalEnergies
- ADEME
- Généthon
- Institut Sup'biotech de Paris
- Nokia Bell Labs France
- MabDesign
- MabDesign
- ANRT
- Aérocentre, Pôle d'excellence régional
- Groupe AFNOR - Association française de normalisation
- Laboratoire National de Métrologie et d'Essais - LNE
- PhDOOC
- SUEZ
- Tecknowmetrix
- Ifremer
- CASDEN
- Institut de Radioprotection et de Sureté Nucléaire - IRSN - Siège
- ONERA - The French Aerospace Lab
- CESI