L’IA d’un jeu vidéo au service de l’écologie

Publié par GEEKULTURA by Piumaginaire, le 19 mars 2025   130

L’écologie est par essence la science des interactions et de la complexité, du désordre. Les jeux de données écologiques contiennent des paramètres qui subissent une multitude d’influences, et possèdent souvent des structures cachées ou des erreurs. Cette complexité rend leur analyse extrêmement difficile et l’écologie accueille volontiers les apports de l’intelligence artificielle, notamment pour « déchiffrer » les grands jeux de données - parfois croisés depuis de nombreuses sources plus ou moins cohérentes - et aider à formuler des scénarios prédictifs. L’application des derniers développements en Intelligence Artificielle, notamment l’apprentissage par réseaux de neurones (« deep learning »), reste cependant balbutiante ou marginale en écologie. Mais un coup de pouce est récemment venu de chercheurs et d’acteurs issus de disciplines très éloignées : des chercheurs en informatique et des joueurs de jeux vidéo ont en effet, tout à fait involontairement, développé un incroyable modèle écologique produit à l’aide d’apprentissage par réseau de neurones. Ce modèle, dans sa catégorie, serait d’ailleurs le plus perfectionné, le plus robuste et le plus flexible qui ait jamais été conçu.

L’évènement en question a eu lieu sur StarCraft II, haut lieu du monde des jeux vidéo, en lui-même jeu de stratégie en temps réel, à la popularité non démentie depuis plus de 20 ans et l’apparition du premier opus. Blizzard (créateur du jeu) et DeepMind (la filiale de Google pour la recherche en intelligence artificielle) ont annoncé avoir mis au point une IA, prénommée AlphaStar, qui a vaincu nombre de joueurs professionnels réputés et s’est classée au-dessus de 99,8% de tous les joueurs humains. Cette IA, un réseau de neurones fonctionnant par renforcement, c’est-à-dire démarrant son processus d’apprentissage à l’aide de données externes (ici des vidéos de parties entre joueurs humains) et s’étant ensuite entraînée contre différentes versions d’elle-même, a justifié tous les espoirs qui avait été placés en elle. StarCraft II était en effet connu pour sa très grande complexité et les joueurs professionnels y résistaient depuis toujours face à la machine. Cette complexité, raison de l’intérêt scientifique pour ce jeu vidéo, dépasse largement celle des échecs et du Go et prend sa source en plusieurs points : les parties se déroulent en temps réel, sur une carte hétérogène à haute résolution, les joueurs peuvent posséder plusieurs centaines d’unités aux capacités et aux rôles variés (en quelque sorte des pièces de jeu), et l’accès à l’information y est fortement limité, tout comme dans la réalité. Des dizaines de milliers de décisions sont ainsi à prendre à chaque partie, et elles doivent constamment être prises sous incertitude, en sachant qu’il existe environ 1026 actions possibles à chaque seconde !

Le succès d’AlphaStar, au-delà du brio de sa structure informatique, repose en grande partie sur son processus d’apprentissage, qui imite un processus évolutif de sélection naturelle : les versions initiales de lui-même se sont affrontées, puis les versions gagnantes ont été sélectionnées et « croisées » entre elles pour produire les versions suivantes, et ainsi de suite, tout en introduisant des petites variations dirigées ou aléatoires à chaque itération du processus. En accélérant les parties, les développeurs d’AlphaStar lui ont permis d’en jouer plusieurs millions, l’équivalent de 200 ans de jeu en continu, ce qui a permis d’exploiter massivement tout le potentiel de ce processus d’évolution artificiel. De l’aveu de tous les observateurs, cet apprentissage « hors » des humains s’est avéré brillant et extrêmement performant, aboutissant à de nombreuses stratégies nouvelles dont pour partie des stratégies qui étaient considérées comme non-optimales par les joueurs professionnels et qui se sont pourtant avérées plus efficaces. Diego « Kelazhur » Schwimmer, un joueur professionnel de top niveau, résume ses impressions : « AlphaStar est un joueur intriguant et non-conformiste – un joueur avec les réflexes et la vitesse des meilleurs joueurs humains, mais un style et des stratégies qui lui sont entièrement propres. La manière dont il s’est entraîné, jouant contre des versions de lui-même dans une ligue fermée aux joueurs humains, a résulté en un style de jeu incroyablement inhabituel. Cela nous interroge profondément sur le degré avec lequel les joueurs humains ont réellement exploré l’univers de possibilités de StarCraft II. »

Mais la suite n’est pas moins intéressante ! Dans ce jeu, tout est affaire de collecte et d’utilisation de ressources, qui sont limitées. Une partie de StarCraft II n’est en fait qu’un écosystème où deux (ou plusieurs) individus sont en compétition pour les ressources et pour l’espace, et doivent dominer l’autre. La problématique écologique, sous-jacente mais latente, détermine en permanence les grandes orientations des joueurs : compromis entre collecte de nouvelles ressources et défense face aux agressions, choix de la stratégie démographique, exploration et accès à l’information, changement de traits et de fonctionnement des unités, gestion d’un appauvrissement des ressources, d’un effondrement écologique, etc. À ce point que les joueurs jouent une race parmi trois (Terran, Zerg ou Protoss) qui ressemblent en fait à s’y méprendre aux trois stratégies écologiques des plantes énoncées par Grime : les espèces compétitives (Protoss), rudérales (Zerg) et stress-tolérantes (Terran). En résumé, les Zergs ont une croissance très rapide et sont peu résistants mais très résilients, ils peuvent remplacer extrêmement rapidement leurs unités perdues. Les Terrans ont une croissance beaucoup plus lente et sont très peu résilients, mais ils disposent de stratégies et de capacités défensives qui les rendent très résistants et capables d’être performants même lorsque les ressources sont limitées. Les Protoss sont un cas plutôt intermédiaire entre les deux races précédentes, à ceci près que leurs unités, bien que lentes et très coûteuses, sont les plus puissantes et compétitives du jeu et peuvent dominer plus facilement celles des deux autres races.

Comme l’on pouvait s’y attendre, AlphaStar s’est placé dans le cadre écologique de StarCraft II. Sa compréhension écologique s’est manifestée particulièrement clairement dans les confrontations dites « miroir », où deux joueurs jouant la même race doivent s’affronter. Dans cette configuration, la compétition est symétrique, c’est-à-dire que les individus qui s’affrontent possèdent exactement le même fonctionnement écologique, strictement les mêmes forces et les mêmes faiblesses. Tandis que les joueurs humains appréhendent ce type de confrontation avec des mentalités considérablement variables, dues en partie à leurs différentes cultures du jeu vidéo, AlphaStar a systématiquement utilisé la même stratégie, très simple et finalement expéditive : un investissement à court terme pour une collecte optimale de ressources, puis un investissement massif et total dans la confrontation directe avec l’adversaire. Le tout, en conséquence, presque sans développement technologique ni diversification des unités. En d’autres termes, son plan de jeu a été uniquement guidé par une recherche de quantité, et jamais de qualité. Il a écrasé à de nombreuses reprises et en quelques minutes seulement certains des meilleurs joueurs humains dans ce type de confrontation. L’écologue constatera alors que quelque chose de très similaire a déjà été mis en évidence dans la nature : quand des espèces sont en compétition, elles peuvent se différencier pour survivre à la compétition (théorie de la « limiting similarity »). En revanche, ce coût de différenciation devient trop élevé si les espèces sont initialement trop proches. Dans ce cas de figure, elles essayent alors juste de faire plus que les autres – plus de collecte des ressources, plus de croissance, plus de compétition (théorie de la « competitive hierarchy »). AlphaStar est parvenu tout seul aux mêmes conclusions, dépassant les idées préconçues des joueurs humains. Il nous témoigne ainsi de toute la pertinence et de la spontanéité de son approche écologique, ainsi que du réalisme, du mimétisme de StarCraft II pour reproduire les concepts et le fonctionnement d’un écosystème naturel, même simplifié.

StarCraft II pourrait être utilisé comme terrain de jeu et d’expérimentation pour les écologues, et AlphaStar comme organisme « contrôle », standard. L’on pourrait étudier son comportement durant les parties mais aussi les changements de son comportement d’une partie à l’autre, afin d’étudier son évolution. Les parties pourraient prendre une forme classique ou une forme modifiée avec des règles expérimentales définies pour tester spécifiquement une hypothèse. Dès lors, la question devient évidente : que pourraient apprendre les écologues en regardant jouer AlphaStar ? La question peut se poser de trois points de vue différents. D’un point de vue « botanique », nous pourrions étudier les changements de stratégies écologiques des plantes, par exemple les successions de stratégies en réponse à une modification des conditions environnementales comme l’apparition d’un déficit en ressources ou comme des perturbations directes. D’un point de vue « zoologique », nous pourrions étudier le rôle de la personnalité des organismes dans leurs interactions écologiques, le rôle de la peur dans le comportement écologique ou encore l’évolution de la culture écologique (par exemple l’émergence ou la dérive des approches écologiques). Enfin, d’un point de vue « anthropique », en faisant jouer AlphaStar contre des joueurs humains de différentes cultures, nous pourrions étudier le rôle de ces différentes cultures et de la personnalité humaine dans la résolution de problèmes écologiques complexes, comme la réaction à un changement environnemental ou à un effondrement écologique, ou l’anticipation des risques à long-terme. Le jeu en lui-même et le code d’AlphaStar étant en libre accès, l’imagination des écologues sera leur seule limite : en collaborant avec des informaticiens et des joueurs de StarCraft II, ils pourraient ainsi apporter de nouveaux éclairages à des questions fondamentales de la science écologique, dont la réponse demeure encore en suspens.


Article de :
Dr Lou BARBE
Conservatoire Botanique National de Corse
22 novembre 2023

Traduction et republication de l’article :
Artificial Intelligence Accidentally Learned Ecology through Video Games,
de Lou Barbe, Cendrine Mony, Benjamin W. Abbott (2020)
dans Trends in Ecology & Evolution