Where PhDs and companies meet
Menu
Login

Développement et évaluation d'un modèle d'IA pour la prédiction de risque de cancer du sein à 5 ans // Development and evaluation of an AI model for 5-year breast cancer risk prediction

ABG-131429
ADUM-65335
Thesis topic
2025-04-25
Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes
ORSAY - France
Développement et évaluation d'un modèle d'IA pour la prédiction de risque de cancer du sein à 5 ans // Development and evaluation of an AI model for 5-year breast cancer risk prediction
  • Electronics
mammographie, apprentissage profond
X-ray mammograms, deep learning

Topic description

L'objectif de ce projet est d'améliorer l'efficacité du dépistage du cancer du sein en France en adoptant une approche de dépistage personnalisé basée sur un risque individuel défini par une intelligence artificielle. Bien que le dépistage organisé permette de réduire la mortalité, il présente plusieurs limites, notamment des cancers qui échappent à l'intervalle de dépistage défini à 24 mois actuellement, et des risques de surdiagnostic et de surtraitement. L'adoption d'un dépistage personnalisé pourrait maximiser le ratio coût-efficacité en optimisant l'adhésion des femmes, permettant de diagnostiquer plus précocement les cancers, tout en limitant les risques de surdiagnostic et de surtraitements. On estime à plus de 20% le nombre de cancers de l'intervalle, diagnostic de cancers survenant entre les 24 mois entre 2 mammographies. Comparées aux cancers dépistés, les femmes atteintes de cancers de l'intervalle présentent plus fréquemment une atteinte ganglionnaire ou métastatique, avec des traitements plus lourds à stade égal, incluant plus de mastectomies et de chimiothérapies. Le programme de dépistage français fait une distinction entre les femmes présentant un risque de cancer du sein “moyen” des patientes présentant un risque de cancer “élevé” ou “très élevé”. Ce risque est évalué à partir d'antécédents personnels, familiaux et du polymorphisme génétique. Les modèles cliniques prédisant le risque de cancer du sein peuvent être divisés en deux catégories : ceux qui utilisent principalement des facteurs hormonaux et environnementaux et ceux qui se concentrent davantage sur le risque héréditaire. Les modèles les plus pertinents pour la population générale restent de performances modestes et d'application clinique complexe car de nombreuses données sont nécessaires et peuvent s'avérer difficiles à collecter. De nouveaux outils basés sur l'intelligence artificielle se basant seulement sur les images de mammographie réalisées en dépistage ont montré des résultats prometteurs dans les cohortes expérimentales, surpassant les modèles traditionnels. L'algorithme de détection du cancer du sein de Therapixel a systématiquement surpassé un modèle clinique de référence sur tous les horizons temporels. A partir de cette étude, Therapixel a initié le développement d'un nouvel algorithme dédié à l'évaluation du risque de cancer du sein à 5 ans. Une première version du modèle démontrait déjà des performances similaires à MIRAI, un modèle de Deep-Learning développé par le MIT, alors considéré comme l'état de l'art. Depuis, le modèle d'IA a été perfectionné pour prendre en compte à la fois la mammographie de dépistage et ses antériorités dans le calcul du risque. Bien que ce nouveau modèle semble prometteur, une évaluation et une optimisation est indispensable pour démontrer son efficacité et son acceptabilité à partir des données collectées et expertisées à l'Institut Curie.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

The aim of this project is to improve the effectiveness of breast cancer screening in France by adopting a personalized screening approach based on individual risk defined by artificial intelligence. Although organized screening reduces mortality, it has a number of limitations, including cancers that escape the current 24-month screening interval, and risks of over-diagnosis and over-treatment. The adoption of personalized screening could maximize cost-effectiveness by optimizing women's adherence, enabling earlier diagnosis of cancers, while limiting the risks of over-diagnosis and over-treatment. The number of interval cancers, i.e. cancers diagnosed between the 24 months between 2 mammograms, is estimated at over 20%. Compared with screened cancers, women with interval cancers are more likely to have lymph node involvement or metastatic disease, with more extensive treatment for the same stage, including more mastectomies and chemotherapy. The French screening program distinguishes between women with an “average” risk of breast cancer and those with a “high” or “very high” risk. This risk is assessed on the basis of personal and family history, and genetic polymorphism. Clinical models predicting breast cancer risk can be divided into two categories: those that primarily use hormonal and environmental factors, and those that focus more on hereditary risk. The most relevant models for the general population remain modest in performance and complex in clinical application, as a large amount of data is required and can be difficult to collect. New artificial intelligence tools based solely on screening mammography images have shown promising results in experimental cohorts, outperforming traditional models. Therapixel's breast cancer detection algorithm systematically outperformed a clinical reference model over all time horizons. Based on this study, Therapixel initiated the development of a new algorithm dedicated to 5-year breast cancer risk assessment. A first version of the model already demonstrated similar performance to MIRAI, a Deep-Learning model developed by MIT, then considered state-of-the-art. Since then, the AI model has been refined to take into account both the screening mammogram and its antecedents in the risk calculation. Although this new model looks promising, its evaluation and optimization are essential to demonstrate its efficacy and acceptability, based on data collected and assessed at the Institut Curie.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/10/2025
WEB : https://www.therapixel.com

Funding category

Funding further details

Région Ile de France - Paris-Region PhD

Presentation of host institution and host laboratory

Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes

Institution awarding doctoral degree

Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes

Graduate school

575 Electrical, Optical, Bio-physics and Engineering

Candidate's profile

Master 2 ou Ecole d'Ingénieurs Formation en Sciences des Données Formation en méthodes statistiques (tests de comparaison, analyses de survie) Expérience en développement logiciel requise. Une formation en Ingénierie Médicale est un plus. Une première expérience en imagerie médicale est un plus
Master 2 or Engineering School Training in Data Science Training in statistical methods (comparison tests, survival analysis) Experience in software development is required. Training in Medical Engineering and first experience in medical imaging are additional skills.
2025-07-31
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?