Le modèle d’IA de Google, Gemini 2.5 Pro, a récemment franchi une étape impressionnante en battant le jeu vidéo Pokémon Blue, un titre emblématique datant de 1996.
Annoncée par Sundar Pichai, le PDG de Google, cette victoire a suscité un grand enthousiasme. Cependant, cette performance n’est pas totalement due à l’IA seule. En effet, elle a bénéficié de l’aide d’un développeur externe.
Lire aussi :
- Comment l’intégration de Reddit Answers peut-elle transformer l’expérience des utilisateurs qui cherchent des réponses précises sur Reddit ?
- Comment la nouvelle solution de paiement de Stripe offre-t-elle une alternative plus économique aux développeurs iOS par rapport à la commission d’Apple ?
Une victoire soutenue par un ingénieur externe
La performance de Gemini a été rendue possible grâce à un projet lancé par Joel Z, un ingénieur logiciel de 30 ans qui n’est pas affilié à Google. Il a mis en place un livestream sous le nom “Gemini Plays Pokémon”, qui a permis à l’IA de jouer et de finir le jeu. Bien que le projet ait été encouragé par des responsables de Google, comme Logan Kilpatrick de Google AI Studio, il reste important de préciser que l’IA n’a pas agi seule. L’implication d’un tiers pour guider l’IA démontre que, même pour des tâches complexes comme celle-ci, l’IA nécessite encore une aide extérieure pour réussir.
Google fusionne ses modèles Gemini et Veo pour un assistant numérique universel
Pourquoi choisir Pokémon ?
Le choix de Pokémon Blue comme terrain de jeu pour Gemini n’est pas anodin. Des entreprises comme Anthropic ont précédemment utilisé des jeux vidéo classiques comme Pokémon Red pour tester les capacités d’IA dans des environnements plus ouverts et imprévisibles. Ces tests permettent de mesurer l’étendue des capacités d’un modèle d’IA à comprendre et résoudre des problèmes complexes. En sélectionnant Pokémon, Google montre que son IA peut non seulement résoudre des tâches simples mais aussi naviguer dans des scénarios plus nuancés et dynamiques, ce qui ouvre la voie à des applications plus sophistiquées dans le futur.
L’importance des outils externes pour l’IA
Cependant, Gemini n’a pas gagné seule. Le modèle a utilisé des “harnachements d’agents” qui lui ont permis de bénéficier de captures d’écran du jeu et d’informations supplémentaires. Ces aides ont fourni à l’IA des repères pour prendre des décisions plus précises, comme dans des cas où elle devait interagir avec des personnages ou résoudre des énigmes du jeu. Joel Z, bien qu’il n’ait pas donné de directives directes pour résoudre des puzzles spécifiques, a fourni des conseils généraux, comme l’indication d’une interaction avec un personnage clé, ce qui a permis à l’IA de continuer à progresser dans le jeu.
Google lance Gemini 2.5 : une nouvelle ère pour l’intelligence artificielle raisonnée
Une comparaison difficile : Gemini vs. Claude
Bien que Gemini ait atteint cet objectif, la comparaison avec d’autres modèles comme Claude d’Anthropic reste complexe. Chaque modèle utilise des approches et des outils différents, ce qui rend toute comparaison directe difficile. Les deux IA ont montré des progrès impressionnants dans des environnements ludiques, mais elles demeurent dépendantes de certaines interventions humaines pour atteindre leurs objectifs. Cependant, cette réussite démontre un grand potentiel pour l’avenir des IA dans des tâches de plus en plus complexes.