Calcul différentiable pour la météorologie et le climat afin de créer une synergie entre modèles et données // Differentiable computing for weather and climate to unlock model-data synergies
ABG-129130
ADUM-61488 |
Thesis topic | |
2025-03-05 |
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
GIF-SUR-YVETTE - France
Calcul différentiable pour la météorologie et le climat afin de créer une synergie entre modèles et données // Differentiable computing for weather and climate to unlock model-data synergies
- Earth, universe, space sciences
modèle de météorologie et de climat, apprentissage machine, numérique de la dynamique des fluides
weather and climate models, machine learning, computational fluid dynamics
weather and climate models, machine learning, computational fluid dynamics
Topic description
Les modèles informatiques de l'atmosphère sont des outils essentiels pour comprendre et prévoir l'évolution du climat, ainsi que pour les prévisions météorologiques, y compris les alertes en cas de phénomènes météorologiques extrêmes à fort impact. Au cœur de ces modèles se trouve un algorithme numérique permettant de résoudre les équations qui régissent la dynamique des fluides atmosphériques. À cet algorithme s'ajoutent d'autres composants qui modélisent les processus physiques qui ne sont pas pris en compte par le modèle central de dynamique des fluides, tels que la turbulence à petite échelle et les processus nuageux. Dans ce projet, nous nous concentrons sur la différentiabilité des composants du modèle, c'est-à-dire sur la nécessité que la sortie dépende de manière régulière de l'entrée. Un manque de différentiabilité dans la formulation mathématique de certains composants du modèle a été lié à un large éventail de problèmes tels que (i) un défaut inattendu de convergence, c'est-à-dire de l'amélioration de la précision de la solution à mesure que la résolution du modèle augmente, (ii) des biais systématiques dans la prévision de la convection tropicale et (iii) une efficacité de calcul sous-optimale. En outre, la différentiabilité du modèle est nécessaire pour une intégration propre avec les données. Ceci est d'autant plus important que les modèles basés sur des algorithmes d'apprentissage automatique (ML) deviennent compétitifs par rapport aux modèles d'écoulement des fluides décrits ci-dessus.
Malgré des résultats impressionnants dans certains contextes, les algorithmes d'apprentissage automatique n'ont pas la capacité de représenter avec précision la dynamique des fluides atmosphériques, ce qui pose des problèmes pour la prévision des phénomènes météorologiques extrêmes et des tendances climatiques à long terme : deux des utilisations les plus importantes des modèles de prévision météorologique et climatique. Une voie de recherche prometteuse consiste à combiner les forces d'un modèle de dynamique des fluides et de composants ML entraînés. La phase d'entraînement de l'algorithme de ML exige alors que le modèle d'écoulement des fluides soit différentiable : c'est le principal défi mathématique auquel s'attaque ce projet.
Objectifs et méthodes du projet
Les objectifs généraux du projet sont (i) d'identifier les facteurs, dans les différents composants d'un modèle atmosphérique, qui ne sont pas différentiables, (ii) de quantifier leur effet, par exemple en termes de taux de convergence, de présence de biais systématiques ou de performances de calcul sous-optimales, et (iii) de développer des modèles ou des méthodes alternatifs qui suppriment ou atténuent ces effets.
Le projet commencera par l'analyse de modèles de composants idéalisés, pour lesquels il existe une forte possibilité de développer une compréhension mathématique quantitative. Les connaissances acquises grâce à cette compréhension peuvent ensuite être utilisées pour améliorer des modèles plus complexes. L'étudiant travaillera avec la boîte à outils dynamique Gusto, qui est écrite en Python et
fournit un cadre facilement adaptable et extensible pour le prototypage des développements de modèles. Dans le cadre du projet, l'étudiant ou l'étudiante disposera d'une grande marge de manœuvre pour développer ses propres idées et déterminer l'orientation du travail.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Computer models of the atmosphere are crucial tools for understanding and predicting the changing climate, and for weather forecasting, including warnings of high-impact extreme weather. At the core of these models lies a numerical algorithm for solving the equations that govern atmospheric fluid dynamics. Coupled to this are other components that model physical processes that are not captured by the core fluid dynamics model, such as small-scale turbulence and cloud processes. In this project, we focus on the differentiability of model components; that is, the requirement for the output to depend smoothly on the input. A lack of differentiability in the mathematical formulation of certain model components has been linked to a wide range of issues such as (i) an unexpected lack of convergence, i.e. improvement in the accuracy of the solution as model resolution is increased, (ii) systematic biases in the prediction of tropical convection and (iii) suboptimal computational efficiency. Moreover, model differentiability is required for seamless integration with data. This is extremely relevant as data-driven models based on machine learning (ML) algorithms become competitive with the fluid flow models described above. Despite impressive results in some contexts, ML algorithms lack the ability to accurately represent the atmospheric fluid dynamics, leading to issues with predicting extreme weather events and long-term climate trends: two of the most important uses for weather and climate prediction models. One promising avenue of research is to combine the strengths of a fluid dynamics model and trained ML components. The training phase for the ML algorithm then requires the fluid flow model to be differentiable: the key mathematical challenge addressed by this project.
Project Aims and Methods
The overall aims of the project are (i) to identify factors, within different components of an atmospheric model, that are not differentiable, (ii) to quantify their effect, e.g. in terms of rates of convergence, the presence of systematic biases, or suboptimal computational performance, and (iii) to develop alternative models or methods that remove or mitigate these effects.
The project will start by analysing idealised component models, for which there is a strong possibility to develop a quantitative mathematical understanding. The insight gained from this understanding
can then be used to improve more complex models. The student will work with the dynamical core toolkit Gusto, which is written in Python and provides an easily adaptible and extensible framework for prototyping model developments. Within the project theme described above, there is considerable scope for the student to develop their own ideas and determine the direction of the project.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Malgré des résultats impressionnants dans certains contextes, les algorithmes d'apprentissage automatique n'ont pas la capacité de représenter avec précision la dynamique des fluides atmosphériques, ce qui pose des problèmes pour la prévision des phénomènes météorologiques extrêmes et des tendances climatiques à long terme : deux des utilisations les plus importantes des modèles de prévision météorologique et climatique. Une voie de recherche prometteuse consiste à combiner les forces d'un modèle de dynamique des fluides et de composants ML entraînés. La phase d'entraînement de l'algorithme de ML exige alors que le modèle d'écoulement des fluides soit différentiable : c'est le principal défi mathématique auquel s'attaque ce projet.
Objectifs et méthodes du projet
Les objectifs généraux du projet sont (i) d'identifier les facteurs, dans les différents composants d'un modèle atmosphérique, qui ne sont pas différentiables, (ii) de quantifier leur effet, par exemple en termes de taux de convergence, de présence de biais systématiques ou de performances de calcul sous-optimales, et (iii) de développer des modèles ou des méthodes alternatifs qui suppriment ou atténuent ces effets.
Le projet commencera par l'analyse de modèles de composants idéalisés, pour lesquels il existe une forte possibilité de développer une compréhension mathématique quantitative. Les connaissances acquises grâce à cette compréhension peuvent ensuite être utilisées pour améliorer des modèles plus complexes. L'étudiant travaillera avec la boîte à outils dynamique Gusto, qui est écrite en Python et
fournit un cadre facilement adaptable et extensible pour le prototypage des développements de modèles. Dans le cadre du projet, l'étudiant ou l'étudiante disposera d'une grande marge de manœuvre pour développer ses propres idées et déterminer l'orientation du travail.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Computer models of the atmosphere are crucial tools for understanding and predicting the changing climate, and for weather forecasting, including warnings of high-impact extreme weather. At the core of these models lies a numerical algorithm for solving the equations that govern atmospheric fluid dynamics. Coupled to this are other components that model physical processes that are not captured by the core fluid dynamics model, such as small-scale turbulence and cloud processes. In this project, we focus on the differentiability of model components; that is, the requirement for the output to depend smoothly on the input. A lack of differentiability in the mathematical formulation of certain model components has been linked to a wide range of issues such as (i) an unexpected lack of convergence, i.e. improvement in the accuracy of the solution as model resolution is increased, (ii) systematic biases in the prediction of tropical convection and (iii) suboptimal computational efficiency. Moreover, model differentiability is required for seamless integration with data. This is extremely relevant as data-driven models based on machine learning (ML) algorithms become competitive with the fluid flow models described above. Despite impressive results in some contexts, ML algorithms lack the ability to accurately represent the atmospheric fluid dynamics, leading to issues with predicting extreme weather events and long-term climate trends: two of the most important uses for weather and climate prediction models. One promising avenue of research is to combine the strengths of a fluid dynamics model and trained ML components. The training phase for the ML algorithm then requires the fluid flow model to be differentiable: the key mathematical challenge addressed by this project.
Project Aims and Methods
The overall aims of the project are (i) to identify factors, within different components of an atmospheric model, that are not differentiable, (ii) to quantify their effect, e.g. in terms of rates of convergence, the presence of systematic biases, or suboptimal computational performance, and (iii) to develop alternative models or methods that remove or mitigate these effects.
The project will start by analysing idealised component models, for which there is a strong possibility to develop a quantitative mathematical understanding. The insight gained from this understanding
can then be used to improve more complex models. The student will work with the dynamical core toolkit Gusto, which is written in Python and provides an easily adaptible and extensible framework for prototyping model developments. Within the project theme described above, there is considerable scope for the student to develop their own ideas and determine the direction of the project.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Début de la thèse : 01/10/2025
Funding category
Funding further details
Programme UPSaclay-Exeter (ADI)
Presentation of host institution and host laboratory
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
Institution awarding doctoral degree
Université Paris-Saclay GS Géosciences, climat, environnement et planètes
Graduate school
129 Sciences de l'Environnement d'Ile-de-France
Candidate's profile
Une solide formation en mathématiques est essentielle. Une connaissance de la programmation, des méthodes numériques et de la dynamique des fluides serait un avantage.
A strong mathematical background is essential. Knowledge of programming, numerical methods, and fluid dynamics would be an advantage.
A strong mathematical background is essential. Knowledge of programming, numerical methods, and fluid dynamics would be an advantage.
2025-04-04
Apply
Close
Vous avez déjà un compte ?
Nouvel utilisateur ?
More information about ABG?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Laboratoire National de Métrologie et d'Essais - LNE
Ifremer
SUEZ
CASDEN
Nokia Bell Labs France
ADEME
MabDesign
PhDOOC
ONERA - The French Aerospace Lab
TotalEnergies
MabDesign
CESI
Généthon
Tecknowmetrix
Aérocentre, Pôle d'excellence régional
Groupe AFNOR - Association française de normalisation
ANRT
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Institut Sup'biotech de Paris
-
JobPermanentRef. ABG128969Institut Polytechnique des Sciences Avancées - IPSAToulouse - Occitanie - France
Enseignant-chercheur en Mécanique des fluides numérique
Open to all scientific expertisesAny -
JobPermanentRef. ABG129192Association Bernard Gregory (ABG)Paris (3ème) - Ile-de-France - France
Business Developer (F/H)
Open to all scientific expertisesAny