Julia Kaltenborn, doctorante à Mila, a vu son article ClimateSet: A Large-Scale Climate Model Dataset for Machine Learning accepté à la conférence NeurIPS 2023. Son travail vise à mettre à la disposition de la communauté de recherche en IA un ensemble de données regroupant de nombreux modèles climatiques afin d'accélérer et d'améliorer les projections climatiques à long terme.
Julia Kaltenborn a une formation en sciences cognitives et son travail de recherche à Mila se situe à l'intersection de l'apprentissage automatique, son expertise technique, et de la science du climat, sa passion. Elle participe depuis des années à des groupes écologistes et a pris part cette année au programme de recherche sur le champ de glace Juneau.
« Je m'investis à la fois dans le travail pratique sur le terrain pour comprendre les données avec lesquelles nous travaillons et dans le développement de l'apprentissage automatique afin de pouvoir prédire et analyser les modèles que nous pouvons observer », explique-t-elle.
IA et science du climat
L'un des principaux problèmes liés à la science climatique actuelle est que l'exécution de simulations est chronophage et nécessite beaucoup de ressources informatiques. Les travaux de recherche de Julia Kaltenborn visent donc à améliorer et à faciliter les projections climatiques sur une longue période grâce à l'apprentissage automatique.
Les divers modèles dont dispose aujourd'hui la communauté de recherche comportent une part d'incertitude (deux modèles climatiques différents donnent deux prévisions différentes), compliquant ainsi le travail des scientifiques et des leaders politiques souhaitant se préparer à la crise climatique.
Pour la communauté de recherche en IA, les travaux actuels sur les projections climatiques sont contraints par l'accès limité à des données climatiques à grande échelle, robustes et cohérentes, a fait remarquer Julia Kaltenborn.
ClimateSet, créé par une équipe pluridisciplinaire, vise à faciliter des projections plus précises et plus localisées en incluant les données de 36 modèles climatiques du monde entier.
Avec cet article, « nous avons essayé d'obtenir un ensemble de données vaste et cohérent qui puisse être utilisé par les scientifiques spécialisés dans l'apprentissage automatique » pour établir des projections climatiques à long terme, a expliqué Julia Kaltenborn.
Il peut être utilisé pour obtenir différents scénarios climatiques et des données de modèles climatiques très spécifiques ou pour construire de grands modèles climatiques fondamentaux.
« J'espère sincèrement qu'il fournira les données dont notre communauté a besoin pour utiliser l'apprentissage automatique afin de répondre à des questions liées au climat », a souligné Julia Kaltenborn.
Aider les leaders politiques
Charlotte Lange, seconde auteure de l'article, a expliqué que ClimateSet vise à faciliter l'utilisation de l'IA pour faire face à la crise climatique.
« Les données des modèles climatiques sont en quelque sorte le terrain de jeu rêvé et l’épreuve ultime des chercheurs en IA en raison de leur grande dimensionnalité, de leur complexité et de leur impact », selon elle.
« Cependant, pour y parvenir, il a fallu naviguer dans un labyrinthe mondial d'incohérences, de distribution globale et de jargon climatique. ClimateSet se veut un raccourci pour la communauté de recherches en IA ou, en d'autres termes, un moyen rapide de se préparer à la crise climatique », a-t-elle ajouté.
L'ensemble de données a été élaboré en collaboration avec Intel.
Yaniv Gurwicz, chercheur scientifique à Intel Labs, a déclaré que « notre objectif est de fortement accélérer les projections climatiques afin de les rendre plus accessibles et plus pratiques pour les communautés de recherche en IA et en sciences du climat, et de permettre des projections climatiques pour de nouveaux scénarios d'émission qui n'avaient pas été pris en compte auparavant ».
« L'ouverture de ClimateSet, le plus grand agrégat de modèles climatiques, est une étape majeure vers la réalisation de prédictions rapides des changements climatiques et contribuera à la bonne prise en charge d’enjeux liés au climat », a-t-il ajouté.
« Prévoir le changement climatique pour les décennies à venir est une nécessité fondamentale pour les décideurs afin d'adopter la bonne politique climatique », a-t-il conclu.
Rendre les données climatiques plus accessibles à la communauté de recherche en IA débouchera sur de nouvelles applications et découvertes qui permettront de prendre de meilleures décisions au niveau politique, selon Julia Kaltenborn.
« L'apprentissage automatique peut permettre d'émuler davantage de scénarios de changements climatiques afin d'aider les leaders politiques à analyser un plus large éventail de résultats et à se concentrer sur des données régionales très spécifiques pour mieux comprendre la crise climatique et s'y préparer », a-t-elle conclu.