La prévision météo par intelligence artificielle est devenue, en trois ans, un terrain de compétition entre géants. Google DeepMind a lancé GraphCast en 2023, puis GenCast en 2025. Le Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT, basé à Bonn) fait tourner son modèle IFS ENS depuis des décennies. Pour rivaliser avec ces mastodontes, il faut en principe des fermes de GPU colossales et des budgets de recherche à sept chiffres. Une équipe de l’INRIA à Paris vient de démontrer le contraire. Leurs travaux, publiés le 22 avril dans Science Advances, présentent ArchesWeatherGen, un modèle probabiliste qui surpasse IFS ENS et NeuralGCM (l’approche hybride physique-IA) sur la quasi-totalité des variables météorologiques de référence, à l’exception du géopotentiel où NeuralGCM conserve l’avantage.
Comment faire mieux que Google avec une fraction de ses moyens
L’astuce tient en une idée simple, bien exécutée. Au lieu d’entraîner un modèle génératif directement sur les données brutes de l’atmosphère (ce qui coûte une fortune en calcul), l’équipe a procédé en deux étapes. La première consiste à entraîner un modèle déterministe classique, ArchesWeather, qui prédit l’état moyen de l’atmosphère 24 heures plus tard. La seconde utilise une technique appelée « flow matching » (une variante moderne des modèles de diffusion, ceux-là mêmes qui servent à générer des images) pour modéliser ce que le modèle déterministe ne capture pas : la part d’incertitude, les scénarios alternatifs, les trajectoires que l’atmosphère aurait pu suivre.
Sur le benchmark WeatherBench, un test qui mesure la précision des prédictions face aux données réelle d’une année (l’année 2020 en l’occurence), ArchesWeatherGen dépasse IFS ENS de 5,3 % en moyenne sur le score CRPS, la métrique de référence pour les prévisions probabilistes, sur l’ensemble des variables clés jusqu’à 10 jours de prévision. Face à GenCast de Google entraîné sur une grille de 111 km, le modèle français fait légèrement moins bien à court terme (1 à 3 jours) mais prend l’avantage à partir de 4 jours. Et face à la version haute définition de GenCast, qui découpe l’atmosphère en mailles de 28 km et coûte vingt fois plus cher à entraîner, ArchesWeatherGen converge vers des performances comparables à 9 et 10 jours de prévision.
Un modèle accessible qui ouvre la porte aux labos universitaires
Le budget total d’entraînement d’ArchesWeatherGen représente 45 jours de calcul sur GPU V100, soit environ 23 jours sur des cartes A100 plus récentes. Pour donner un ordre de grandeur, GenCast de Google nécessite plus de 1 000 jours-V100. Le jeu de données d’entraînement découpe le globe en mailles de 167 km et ne pèse qu’un téraoctet, contre 36 fois plus pour la grille fine de 28 km utilisée par la concurrence. L’ensemble du code, des modèles pré-entraînés et du pipeline de données est publié sur GitHub sous licence ouverte.
L’équipe derrière ces travaux est dirigée par Guillaume Couairon (passé depuis chez Google DeepMind Paris) et Claire Monteleoni, dans le cadre de la chaire « Choose France » en intelligence artificielle. Le calcul a été réalisé sur les infrastructures françaises de GENCI et de l’IDRIS, le centre de calcul du CNRS. Autant le dire clairement : c’est de la recherche publique française, financée par des fonds publics, qui produit un modèle compétitif avec ceux des laboratoires les mieux dotés de la planète.
ArchesWeatherGen ne remplacera pas demain les modèles opérationnels de Météo-France, qui tournent à des résolutions bien plus fines. Mais il prouve qu’un labo universitaire peut désormais produire des prévisions probabilistes de qualité mondiale avec un budget accessible.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source : Science Advances/INRIA

