Aller au contenu Aller au menu Aller à la recherche

Modélisation du climat : une « montagne » de données

accès rapides, services personnalisés

Rechercher

Recherche détaillée

Modélisation du climat : une « montagne » de données à collecter et à redistribuer

Une approche distribuée de la gestion de données climatiques

 

L'étude du climat et de son évolution s’appuie sur un échange quotidien de données d'observation et de résultats de modèles dont la quantité suit une courbe exponentielle ascendante vertigineuse. Que faire de toutes ces informations ? À qui et comment les distribue-t-on ? Sébastien Denvil, ingénieur de recherche CNRS à l’Institut Pierre-Simon-Laplace (IPSL, CNRS/UPMC/UVSQ/CEA/IRD/Cnes/École polytechnique/ENS), présente le projet PRODIGUER porté par l’IPSL en collaboration étroite avec des partenaires nationaux et internationaux.

 

Qu’est-ce que le CMIP ?

Le Programme Mondial de Recherche sur le Climat (World Climate Research Program, WCRP) a mis en place différents types de projets qui comprennent en particulier des scénarios d'évolution des climats futurs, et qui sont réalisés en phase avec la préparation du rapport d'évaluation du GIEC 2013-2014.

 

Le CMIP (Coupled Model Intercomparison Project) est un projet de comparaison de résultats de modèles climatiques. Il définit un protocole expérimental standard pour l'étude des modèles couplés océan-atmosphère. Les simulations numériques ont porté sur le long terme (centennal) et le court terme (décennal). La phase 5 du projet (CMIP5) achevée en 2012 visait à développer une structure coordinatrice pour les recherches sur le changement climatique entre 2007 et 2012.

 

Que se cache-t-il derrière les modèles ?

Les évolutions climatiques passées et futures peuvent être évaluées en utilisant un modèle climatique global. Ces modèles permettent d’effectuer des simulations du climat de quelques années à plusieurs millénaires, et représente le système climatique planétaire réel de manière numérique. La « planète-climat » réelle est un système très complexe au sein duquel divers milieux sont en perpétuelle interaction : l’atmosphère, l’océan, les glaces marines, la végétation, les rivières... échangent notamment de l’eau et de l’énergie en permanence.

 

Ces composantes du système climatique sont représentées par des modèles numériques, que développent des scientifiques et ingénieurs spécialisés. Ces modèles s’appuient sur les lois de la physique et sont régulièrement testés de manière à ce que chacun d’entre eux simule correctement le milieu qu’il représente et ses interactions avec les autres milieux. Toutes ces composantes sont décrites à l’aide de variables qui permettent de définir leur état à différentes fréquences temporelles : fréquence horaire à annuelle, en passant par des données mensuelles, journalières… Environ 900 variables ou quantités ont été identifiées comme intéressantes pour le programme CMIP5 !

 

Le projet PRODIGUER, un nœud de distribution des données

L'exercice imposé par CMIP5 a donné l’occasion à l’IPSL d'initié le projet PRODIGUER afin d’intégrer une infrastructure mondiale de gestion de données climatiques et de maîtriser les technologies de grilles de données nécessaires lors du passage à l’échelle du calcul pétaflopique. Les résultats du modèle de climat de l'IPSL, IPSL-CM5, sont accessibles depuis cette infrastructure.

 

L'IPSL a pu, via PRODIGUER et une structure informatique multi-site reliant le serveur ClimServ (site IPSL de Palaiseau) au serveur Ciclad (site IPSL de l'UPMC), faire émerger la plateforme ICMC-DATA dédiée à la recherche climatique en explorant les possibilités offertes par les méso-centres de calcul dans le contexte de déploiement d’un portail d’accès et d’analyse de données climatiques de diverses natures.

 

L’IPSL s’est inscrit en acteur incontournable de CMIP5 en réalisant un travail de grande ampleur sur l’environnement logiciel, le stockage et la manipulation de données, la (re)-distribution aux utilisateurs, la description des simulations et de leurs contextes expérimentale. C’est un nombre de simulations, de variables, de fichiers, et un volume de données sans précédent qui ont été mis à la disposition de toute la communauté par l'IPSL (l'IPSL avec les données de son modèle IPSL-CM5 a contribué à CMIP5 à hauteur de 250 To, pour environ 200 simulations).

 

La (re)distribution des données

Earth System Grid Federation (ESGF) est un effort international financé sur leur fond propre par plusieurs institutions ou agence. Le développement logiciel et la gestion du projet sont répartis entre un certain nombre de laboratoires et d’institutions dont, en Europe, le British Atmospheric Data Centre (BADC, UK), le Centro Euro-Mediterraneo sui Cambiamenti Climatici (CMCC, Italie), le Deutsches Klimarechenzentrum (DKRZ, Allemagne)… et, bien sûr, l’IPSL

 

PRODIGUER permet une coordination de cet effort au niveau national et accompagne la communauté française dans le développement et le déploiement des couches logicielles nécessaires (IPSL, CNRM-CERFACS, TGCC, IDRIS). L’Infrastructure for the European Network for Earth (IS-ENES) anime, coordonne et donne un cadre pour faciliter les collaborations au niveau européen. PRODIGUER a permis de réaliser un énorme travail de mise en œuvre opérationnelle de cette structure de grilles qui est la plus grande ressource distribuée en étude du climat.

 

De CMIP3 à CMIP5, un « tsunami » d’informations et de données !

Lors de CMIP3 en 2007, l’unité utilisée était le téraoctet pour un total de 35 téraoctets de données en fin d’exercice, 16 groupes de modélisation, plusieurs milliers d’utilisateurs répartis à travers le monde et une seule et même porte d’entrée pour accéder à ces données.

 

Pour CMIP5, la production et le stockage des données s’est fait en quatre ans avec une véritable difficulté à appréhender les archives : plus de variables, une fréquence plus élevée, plus de type d’expériences, des simulations d’ensemble… Pour CMIP5 (2013), l’unité a ainsi changé, c’est le petaoctet. 24 groupes de modélisation ont participé. Neuf portes d’entrée et 14 nœuds de données répartis sur le globe ont pu héberger les données, pour un total de 3 petaoctets de données. Rendez-vous dans six ans pour CMIP6 ?

 

Pour en savoir plus :

Institut Pierre-Simon-Laplace (IPSL, CNRS/UPMC/UVSQ/CEA/IRD/Cnes/École polytechnique/ENS)Nouvelle fenêtre

 

L'IPSL est le portail national exposant les données hébergées sur le territoire national

http://esgf-node.ipsl.fr/esgf-web-fe/Nouvelle fenêtre

  

Infrastructure for the European Network for Earth (IS-ENES)Nouvelle fenêtre

 

Animation sur la modélisation climatiqueNouvelle fenêtre. © IPSL



23/07/13