Où docteurs et entreprises se rencontrent
Menu
Connexion

Intégration de données multimodales avec des blocs de données manquantes dans l’étude des effets des rayonnements ionisants à faible dose (ThSAN25-12)

ABG-129825 Sujet de Thèse
06/04/2025 Contrat doctoral
Logo de
ASNR
Fontenay aux Roses - Ile-de-France - France
Intégration de données multimodales avec des blocs de données manquantes dans l’étude des effets des rayonnements ionisants à faible dose (ThSAN25-12)
  • Mathématiques
  • Biologie
Intégration des données multimodales, Données manquantes par blocs, Biologie des systèmes

Description du sujet

Des études épidémiologiques montrent l’effet d’une exposition à des rayonnements ionisants (RI) sur le développement de maladies cardiovasculaires (MCV, comme l'athérosclérose ou les accidents vasculaires cérébraux) pour des doses fortes à modérées (au-dessus de 500 mGy). La capacité statistique actuelle est contestée pour qualifier l’effet d’une exposition aux RI sur les MCV à des doses faibles compte tenu des biais, tel que les facteurs de confusion, au premier rang desquels le stress, connu pour activer le système nerveux sympathique impliqué dans les MCV. Or les MCV constituent une préoccupation forte de santé publique, responsable de la mort de près de 17,9 millions de pers./an selon l’Organisation Mondiale de la Santé.

Pour faire progresser la compréhension des conséquences d’une exposition aux RI à faibles doses, les analyses s’appuient sur les données multi-omiques de la réponse biologique d’un organisme vivant. Toutefois, la diversification des types de données utiles à la réduction des facteurs de confusion induit une augmentation du risque de biais lié aux données manquantes, pour lequel le plafond acceptable établi entre 20 % et 30 % est ainsi souvent dépassé. Considérant qu’éliminer les données manquantes peut réduire gravement la précision de l’analyse, la thèse vise à construire une méthode d’analyse qui permette de traiter les données multi-omiques tout en intégrant les données manquantes à l’analyse des effets d’une exposition faible aux RI sur les MCV.

Face à l’abondance croissante de données dans l’étude des effets des rayonnements ionisants (RI) à faible dose (RNA-seq, métabolomique, lipidomique…), l’exploitation efficace des données est confrontée au défi de la gestion des données manquantes induites par la diversification des données prise en compte. En effet celle-ci génère un ensemble d’échantillons/sujets inobservés pour certains types de données, formant des blocs des données manquantes. Ainsi, des approches méthodologiques spécifiques sont nécessaires pour intégrer les différentes modalités de données, en tenant compte des problématiques liées aux données manquantes et à la présence de facteurs confondants (dont les co-expositions), afin d'identifier les mécanismes d’action impliqués dans la réponse d’un organisme à un stress particulier.

S’appuyant sur des données déjà générées, le.a candidat.e sera impliqué.e dans le développement d’algorithmes et de modèles statistiques pour l'analyse de grands ensembles de données biologiques, afin d’y intégrer convenablement le traitement des données manquantes et des facteurs confondants, notamment des co-expositions (Goujon E et al., 2024). Le.a candidat.e aura la charge de développer, tester et évaluer les outils statistiques en s’appuyant sur les méthodes proposées dans la littérature (Peltier C et al., 2023 ; Baena-Miret S et al. 2024)

Les deux premières années de la thèse seront consacrées au développement méthodologique pour l’imputation des données et l’incorporation des facteurs dans une analyse intégrative. Et la dernière année sera consacrée à l’analyse des données et à l’interprétation des résultats par une analyse d’enrichissement des voies biologiques.

La publication des résultats dans des revues internationales et la participation à des conférences sont attendues, notamment au sujet du développement méthodologique relatif à l’imputation des données multi-tableaux et des apports de l’intégration multimodale à l’étude des effets des facteurs de co-exposition sur les maladies cardio-vasculaires.

 

Références :

  • Elen Goujon, Olivier Armant, Clément Car, Jean-Marc Bonzom, Arthur Tenenhaus, and Imène Garali. Batch Effect Correction in a Confounded Scenario: a Case Study on Gene Expression of Chornobyl Tree Frogs. In Roberta Gori, Paolo Milazzo, and Mirco Tribastone, editors, Computational Methods in Systems Biology, pages 89–107, Cham, 2024. Springer Nature Switzerland.
  • Peltier C, Le Brusquet L, Lejeune FX, Moszer I, Tenenhaus A (2022). “Missing Values in RGCCA: Algorithms and Comparisons.” In 8th International Conference on Partial Least Squares Structural Equation Modeling (PLS’22).
  • Baena-Miret S, Reverter F, Vegas E. A framework for block-wise missing data in multi-omics. PLoS One. 2024 Jul 23;19(7):e0307482. doi: 10.1371/journal.pone.0307482. PMID: 39042603; PMCID: PMC11265675.

Prise de fonction :

01/10/2025

Nature du financement

Contrat doctoral

Précisions sur le financement

Présentation établissement et labo d'accueil

ASNR

'Autorité de sûreté nucléaire et de radioprotection est une autorité administrative indépendante créée par la loi du 21 mai 2024 relative à l'organisation de la gouvernance de la sûreté nucléaire et de la radioprotection pour répondre au défi de la relance de la filière nucléaire. Elle assure, au nom de l’État, le contrôle des activités nucléaires civiles en France et remplit des missions d'expertise, de recherche, de formation et d’information des publics.

Le.a doctorant.e effectuera 60% de son temps de recherche au Laboratoire de radiobiologie des expositions accidentelles (LRAcc, ASNR, Fontenay-aux-Roses) et 40% au L2S (CentraleSupelec, Paris).

Le LRAcc mène des recherches en radiobiologie, en dosimétrie biologique, en radiopathologie et en médecine régénérative. Elles sont menées dans un contexte d’exposition accidentelle aux rayonnements ionisants : accident radiologique - industriel - médical ou nucléaire - acte de malveillance afin de développer des capacités d’expertise pour la prise en charge médicale des victimes. Le LRAcc développe des méthodes et des outils opérationnels pour l’établissement d’un diagnostic et d’un pronostic des lésions radio-induites sur les organes, intégrant entre autres la reconstruction a posteriori des doses absorbées par dosimétrie biologique. Par ailleurs, il fournit un appui scientifique et technique à la mise en place de stratégies thérapeutiques adaptées de prise en charge médicale pour des doses susceptibles d’induire des pathologies engageant le pronostic vital à court, moyen et/ou long terme.

 

Etablissement délivrant le doctorat

Université Paris-Saclay

Profil du candidat

Le ou la candidat(e) doit être titulaire d’un master en Mathématique appliquées, Statistiques (parcours data et/ou analyse et modélisation des données) ou domaine connexe avec un intérêt pour la recherche en biologie ou en santé. Le ou la candidat(e) devra posséder un solide bagage théorique en algèbre linéaire et en statistique. Afin de valider et d’appliquer les méthodes développées, il est demandé la maitrise d’outils de programmation tels que R et Python. Un bon niveau d’anglais est souhaitable. La capacité à travailler en équipe multidisciplinaire sera appréciée.

21/04/2025
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?