Calcul différentiable pour la météorologie et le climat afin de créer une synergie entre modèles et données // Differentiable computing for weather and climate to unlock model-data synergies
ABG-129130
ADUM-61488 |
Sujet de Thèse | |
05/03/2025 |
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
GIF-SUR-YVETTE - France
Calcul différentiable pour la météorologie et le climat afin de créer une synergie entre modèles et données // Differentiable computing for weather and climate to unlock model-data synergies
- Terre, univers, espace
modèle de météorologie et de climat, apprentissage machine, numérique de la dynamique des fluides
weather and climate models, machine learning, computational fluid dynamics
weather and climate models, machine learning, computational fluid dynamics
Description du sujet
Les modèles informatiques de l'atmosphère sont des outils essentiels pour comprendre et prévoir l'évolution du climat, ainsi que pour les prévisions météorologiques, y compris les alertes en cas de phénomènes météorologiques extrêmes à fort impact. Au cœur de ces modèles se trouve un algorithme numérique permettant de résoudre les équations qui régissent la dynamique des fluides atmosphériques. À cet algorithme s'ajoutent d'autres composants qui modélisent les processus physiques qui ne sont pas pris en compte par le modèle central de dynamique des fluides, tels que la turbulence à petite échelle et les processus nuageux. Dans ce projet, nous nous concentrons sur la différentiabilité des composants du modèle, c'est-à-dire sur la nécessité que la sortie dépende de manière régulière de l'entrée. Un manque de différentiabilité dans la formulation mathématique de certains composants du modèle a été lié à un large éventail de problèmes tels que (i) un défaut inattendu de convergence, c'est-à-dire de l'amélioration de la précision de la solution à mesure que la résolution du modèle augmente, (ii) des biais systématiques dans la prévision de la convection tropicale et (iii) une efficacité de calcul sous-optimale. En outre, la différentiabilité du modèle est nécessaire pour une intégration propre avec les données. Ceci est d'autant plus important que les modèles basés sur des algorithmes d'apprentissage automatique (ML) deviennent compétitifs par rapport aux modèles d'écoulement des fluides décrits ci-dessus.
Malgré des résultats impressionnants dans certains contextes, les algorithmes d'apprentissage automatique n'ont pas la capacité de représenter avec précision la dynamique des fluides atmosphériques, ce qui pose des problèmes pour la prévision des phénomènes météorologiques extrêmes et des tendances climatiques à long terme : deux des utilisations les plus importantes des modèles de prévision météorologique et climatique. Une voie de recherche prometteuse consiste à combiner les forces d'un modèle de dynamique des fluides et de composants ML entraînés. La phase d'entraînement de l'algorithme de ML exige alors que le modèle d'écoulement des fluides soit différentiable : c'est le principal défi mathématique auquel s'attaque ce projet.
Objectifs et méthodes du projet
Les objectifs généraux du projet sont (i) d'identifier les facteurs, dans les différents composants d'un modèle atmosphérique, qui ne sont pas différentiables, (ii) de quantifier leur effet, par exemple en termes de taux de convergence, de présence de biais systématiques ou de performances de calcul sous-optimales, et (iii) de développer des modèles ou des méthodes alternatifs qui suppriment ou atténuent ces effets.
Le projet commencera par l'analyse de modèles de composants idéalisés, pour lesquels il existe une forte possibilité de développer une compréhension mathématique quantitative. Les connaissances acquises grâce à cette compréhension peuvent ensuite être utilisées pour améliorer des modèles plus complexes. L'étudiant travaillera avec la boîte à outils dynamique Gusto, qui est écrite en Python et
fournit un cadre facilement adaptable et extensible pour le prototypage des développements de modèles. Dans le cadre du projet, l'étudiant ou l'étudiante disposera d'une grande marge de manœuvre pour développer ses propres idées et déterminer l'orientation du travail.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Computer models of the atmosphere are crucial tools for understanding and predicting the changing climate, and for weather forecasting, including warnings of high-impact extreme weather. At the core of these models lies a numerical algorithm for solving the equations that govern atmospheric fluid dynamics. Coupled to this are other components that model physical processes that are not captured by the core fluid dynamics model, such as small-scale turbulence and cloud processes. In this project, we focus on the differentiability of model components; that is, the requirement for the output to depend smoothly on the input. A lack of differentiability in the mathematical formulation of certain model components has been linked to a wide range of issues such as (i) an unexpected lack of convergence, i.e. improvement in the accuracy of the solution as model resolution is increased, (ii) systematic biases in the prediction of tropical convection and (iii) suboptimal computational efficiency. Moreover, model differentiability is required for seamless integration with data. This is extremely relevant as data-driven models based on machine learning (ML) algorithms become competitive with the fluid flow models described above. Despite impressive results in some contexts, ML algorithms lack the ability to accurately represent the atmospheric fluid dynamics, leading to issues with predicting extreme weather events and long-term climate trends: two of the most important uses for weather and climate prediction models. One promising avenue of research is to combine the strengths of a fluid dynamics model and trained ML components. The training phase for the ML algorithm then requires the fluid flow model to be differentiable: the key mathematical challenge addressed by this project.
Project Aims and Methods
The overall aims of the project are (i) to identify factors, within different components of an atmospheric model, that are not differentiable, (ii) to quantify their effect, e.g. in terms of rates of convergence, the presence of systematic biases, or suboptimal computational performance, and (iii) to develop alternative models or methods that remove or mitigate these effects.
The project will start by analysing idealised component models, for which there is a strong possibility to develop a quantitative mathematical understanding. The insight gained from this understanding
can then be used to improve more complex models. The student will work with the dynamical core toolkit Gusto, which is written in Python and provides an easily adaptible and extensible framework for prototyping model developments. Within the project theme described above, there is considerable scope for the student to develop their own ideas and determine the direction of the project.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Malgré des résultats impressionnants dans certains contextes, les algorithmes d'apprentissage automatique n'ont pas la capacité de représenter avec précision la dynamique des fluides atmosphériques, ce qui pose des problèmes pour la prévision des phénomènes météorologiques extrêmes et des tendances climatiques à long terme : deux des utilisations les plus importantes des modèles de prévision météorologique et climatique. Une voie de recherche prometteuse consiste à combiner les forces d'un modèle de dynamique des fluides et de composants ML entraînés. La phase d'entraînement de l'algorithme de ML exige alors que le modèle d'écoulement des fluides soit différentiable : c'est le principal défi mathématique auquel s'attaque ce projet.
Objectifs et méthodes du projet
Les objectifs généraux du projet sont (i) d'identifier les facteurs, dans les différents composants d'un modèle atmosphérique, qui ne sont pas différentiables, (ii) de quantifier leur effet, par exemple en termes de taux de convergence, de présence de biais systématiques ou de performances de calcul sous-optimales, et (iii) de développer des modèles ou des méthodes alternatifs qui suppriment ou atténuent ces effets.
Le projet commencera par l'analyse de modèles de composants idéalisés, pour lesquels il existe une forte possibilité de développer une compréhension mathématique quantitative. Les connaissances acquises grâce à cette compréhension peuvent ensuite être utilisées pour améliorer des modèles plus complexes. L'étudiant travaillera avec la boîte à outils dynamique Gusto, qui est écrite en Python et
fournit un cadre facilement adaptable et extensible pour le prototypage des développements de modèles. Dans le cadre du projet, l'étudiant ou l'étudiante disposera d'une grande marge de manœuvre pour développer ses propres idées et déterminer l'orientation du travail.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Computer models of the atmosphere are crucial tools for understanding and predicting the changing climate, and for weather forecasting, including warnings of high-impact extreme weather. At the core of these models lies a numerical algorithm for solving the equations that govern atmospheric fluid dynamics. Coupled to this are other components that model physical processes that are not captured by the core fluid dynamics model, such as small-scale turbulence and cloud processes. In this project, we focus on the differentiability of model components; that is, the requirement for the output to depend smoothly on the input. A lack of differentiability in the mathematical formulation of certain model components has been linked to a wide range of issues such as (i) an unexpected lack of convergence, i.e. improvement in the accuracy of the solution as model resolution is increased, (ii) systematic biases in the prediction of tropical convection and (iii) suboptimal computational efficiency. Moreover, model differentiability is required for seamless integration with data. This is extremely relevant as data-driven models based on machine learning (ML) algorithms become competitive with the fluid flow models described above. Despite impressive results in some contexts, ML algorithms lack the ability to accurately represent the atmospheric fluid dynamics, leading to issues with predicting extreme weather events and long-term climate trends: two of the most important uses for weather and climate prediction models. One promising avenue of research is to combine the strengths of a fluid dynamics model and trained ML components. The training phase for the ML algorithm then requires the fluid flow model to be differentiable: the key mathematical challenge addressed by this project.
Project Aims and Methods
The overall aims of the project are (i) to identify factors, within different components of an atmospheric model, that are not differentiable, (ii) to quantify their effect, e.g. in terms of rates of convergence, the presence of systematic biases, or suboptimal computational performance, and (iii) to develop alternative models or methods that remove or mitigate these effects.
The project will start by analysing idealised component models, for which there is a strong possibility to develop a quantitative mathematical understanding. The insight gained from this understanding
can then be used to improve more complex models. The student will work with the dynamical core toolkit Gusto, which is written in Python and provides an easily adaptible and extensible framework for prototyping model developments. Within the project theme described above, there is considerable scope for the student to develop their own ideas and determine the direction of the project.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Nature du financement
Précisions sur le financement
Programme UPSaclay-Exeter (ADI)
Présentation établissement et labo d'accueil
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
Etablissement délivrant le doctorat
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
Ecole doctorale
129 Sciences de l'Environnement d'Ile-de-France
Profil du candidat
Une solide formation en mathématiques est essentielle. Une connaissance de la programmation, des méthodes numériques et de la dynamique des fluides serait un avantage.
A strong mathematical background is essential. Knowledge of programming, numerical methods, and fluid dynamics would be an advantage.
A strong mathematical background is essential. Knowledge of programming, numerical methods, and fluid dynamics would be an advantage.
04/04/2025
Postuler
Fermer
Vous avez déjà un compte ?
Nouvel utilisateur ?
Besoin d'informations sur l'ABG ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
SUEZ
Ifremer
Tecknowmetrix
Laboratoire National de Métrologie et d'Essais - LNE
TotalEnergies
ADEME
Généthon
Groupe AFNOR - Association française de normalisation
ONERA - The French Aerospace Lab
MabDesign
CASDEN
Aérocentre, Pôle d'excellence régional
CESI
Nokia Bell Labs France
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ANRT
Institut Sup'biotech de Paris
MabDesign
PhDOOC
-
EmploiCDIRef. ABG128969Institut Polytechnique des Sciences Avancées - IPSAToulouse - Occitanie - France
Enseignant-chercheur en Mécanique des fluides numérique
IndifférentNiveau d'expérience indifférent -
EmploiCDIRef. ABG129192Association Bernard Gregory (ABG)Paris (3ème) - Ile-de-France - France
Business Developer (F/H)
IndifférentNiveau d'expérience indifférent