Apprentissage profond et météo, une synergie en pleine évolution !

Publié par GEEKULTURA by Piumaginaire, le 12 mars 2025

Dr Roberta Baggio de l’UMR 6134 Sciences Pour l’Environnement a accepté de rédiger un article sur l’utilisation de cette technologie pour la climatologie. Cet article a été rédigé en anglais par l’auteure, puis traduit en français avec l’aide du modèle ChatGPT.

Dès l’aube de l’informatique moderne, la puissance de calcul en constante augmentation a radicalement transformé les prévisions météorologiques. Aujourd’hui, nous pourrions être à l’aube d’une nouvelle révolution ! Les prévisions météorologiques font partie intégrante de notre quotidien. Elles sont si facilement accessibles aujourd’hui que nous avons tendance à les tenir pour acquises, négligeant les défis inhérents qu’elles représentent. En effet, le système Terre est d’une grande complexité. Prédire les conditions météorologiques à n’importe quel endroit de sa surface n’est pas une tâche simple. En tant que système complexe, l’atmosphère est influencée par divers phénomènes qui interagissent à différentes échelles. De plus, elle est de nature chaotique : de très légères différences dans son état initial peuvent conduire à des résultats qui divergent considérablement avec le temps. Malgré ces défis, de nombreuses organisations météorologiques fournissent régulièrement des prévisions opérationnelles à l’échelle mondiale. Leur précision s’est considérablement améliorée au cours des dernières décennies. Comment est-ce possible ? Grâce aux ordinateurs, bien sûr !

Les prévisions météorologiques actuelles reposent sur des solutions numériques d’équations détaillant l’évolution atmosphérique. La Terre est segmentée en de nombreux petits volumes via une grille numérique, aidant à résoudre ces équations. L’état initial du système, qui initie les calculs, est obtenu par une savante recombinaison des prévisions précédentes et des observations (provenant de stations météorologiques et de satellites, entre autres). Ces calculs sont fréquemment mis à jour pour intégrer les dernières mesures. Pour estimer l’effet du chaos, de nombreux centres opérationnels offrent des prévisions d’ensemble. En d’autres termes, ils initient simultanément plusieurs simulations avec des condition initiales légèrement variées. Les résultats ne sont pas des valeurs fixes, mais une distribution de probabilité sur les valeurs possibles, ce qui donne une estimation de l’incertitude de la prévision elle-même. Pour donner un exemple concret, une prévision déterministe vous fournirait des informations sur la quantité de pluie à venir dans les heures suivantes, tandis qu’une prévision probabiliste vous donnerait une distribution de probabilité sur des valeurs, ce qui pourrait vous persuader ou non de prendre votre parapluie. Naturellement, tout ceci nécessite une puissance de calcul massive !

La procédure de calcul décrite ci-dessus est connue dans la littérature sous le nom de PNT (Prévision Numérique du Temps), or un nouveau type de prévision météorologique basée sur l’ordinateur émerge depuis peu grâce à l’Intelligence Artificielle ! Plus précisément, il s’agit de prévisions entièrement basées sur l’apprentissage profond (Deep Learning, DL, en anglais). Grossièrement parlant, alors que les PNT sont basées sur la connaissance physique des processus qui animent l’atmosphère, les techniques de DL n’ont aucune connaissance à priori de ce qu’elles sont censées apprendre, mais parviennent à extraire des informations en se formant sur une quantité massive de données. Pour ce faire, une phase d’ajustement, le training, est nécessaire et très gourmande en calcul, mais une fois qu’elle est terminée, les résultats peuvent être fournis assez rapidement et de manière très compétitive. Comme l’a reconnu le CEPMMT (Centre Européen pour les Prévisions Météorologiques à Moyen Terme) lui-même, les prévisions météorologiques entièrement basées sur le DL ont commencé à se rapprocher, et parfois même à dépasser, les performances des PNT de référence. Parmi ces modèles, tous ont plusieurs millions de paramètres et nécessitent une quantité considérable de ressources de calcul pour être entrainés.

Le fait que les prévisions basées sur le DL deviennent plus performantes ne signifie pas que la PNT cessera d’être importante, car la formation de ces réseaux dépend massivement des résultats de la PNT (qui ont été utilisés dans les phases de training et de validation). De plus, même si certaines mesures de performance spécifiques sont en effet aussi bonnes que les prévisions PNT, cela ne signifie pas nécessairement que les prévisions sont meilleures dans leur ensemble. Les réseaux de neurones sont spécifiquement formés pour minimiser ces mesures et peuvent avoir tendance à sous-estimer les événements extrêmes. Dans une époque où les dérèglements climatiques augmentent l’occurrence de phénomènes anormaux, cette sous-estimation n’est pas souhaitable. Néanmoins, d’énormes progrès ont été réalisés en très peu de temps !

À l’Université de Corse, nous étudions les applications des techniques de DL aux prévisions météorologiques en mettant l’accent sur des applications particulièrement importantes pour la région. En Corse, le terrain très escarpé et montagneux implique qu’une haute résolution est nécessaire pour prévoir avec précision la météo, en particulier lorsqu’il s’agit d’événements extrêmes. Nous prévoyons de combiner différents types de données météorologiques avec un modèle PNT à haute résolution pour former des architectures DL (Intelligence Artificielle), pour étudier les gains sur la prévision de variables météorologiques spécifiques, en mettant l’accent sur les événements extrêmes et les énergies renouvelables. Dans un travail récent (preprint), nous avons publié certains de nos premiers résultats où nous avons considéré les séries temporelles de plusieurs stations météorologiques en Corse et construit un outil DL capable de fournir des prévisions probabilistes de la vitesse du vent avec de très bonnes performances. Comme mentionné ci-dessus, une description probabiliste est préférable à une description déterministe, car elle contient une information concernant l’incertitude associée aux prévisions fournies. Nous allons étudier également comment optimiser la prévision des précipitations de pluie et de l’irradiance solaire. Les données d’entraînement combineront des observations (à la fois publiques et issues d’instruments de laboratoire) et des résultats PNT.

Il est certainement trop tôt pour déterminer dans quelle mesure l’Intelligence Artificielle révolutionnera les prévisions météorologiques. Voyons si en Corse, dans quelques années, nous serons en mesure de répondre plus assurément à cette question. Quoi qu’il en soit, les performances en rapide augmentation et les avancées à plein régime dans le domaine rendent ce sujet particulièrement excitant.

Article de :
Dr Roberta BAGGIO
Università di Corsica
29 octobre 2023