Google DeepMind vient de franchir une nouvelle étape dans le domaine de l’IA générative en ouvrant l’accès à Project Genie, un outil expérimental capable de créer des mondes interactifs à partir de simples descriptions textuelles ou d’images.
Réservé pour l’instant aux abonnés Google AI Ultra aux États-Unis, ce prototype s’inscrit dans une stratégie plus large visant à tester et affiner ce que l’on appelle des world models, considérés par de nombreux chercheurs comme une brique essentielle vers l’intelligence artificielle générale.
Contrairement aux générateurs d’images classiques, Project Genie ne se contente pas de produire un décor figé. Il génère un environnement explorable, dans lequel l’utilisateur peut se déplacer à la première ou à la troisième personne, interagir avec les éléments et observer la cohérence spatiale du monde créé.
Lire aussi :
- Google paie 68 millions de dollars pour régler les accusations d’espionnage via son assistant vocal
- Comment Ricursive a-t-elle atteint une valorisation de 4 milliards de dollars en seulement deux mois ?
Créer un univers jouable à partir d’un simple prompt
L’expérience débute par la création d’une “esquisse de monde”. L’utilisateur décrit l’environnement et un personnage principal, puis laisse l’IA produire une image de base servant de fondation au monde interactif. Cette image peut être modifiée avant la génération finale, même si certaines instructions visuelles sont parfois mal interprétées.
Une fois validée, l’IA transforme cette image en un espace navigable en quelques secondes. Il est également possible de s’appuyer sur des photos réelles ou de remixer des mondes existants pour explorer de nouvelles variations. En revanche, la durée d’exploration est volontairement limitée à 60 secondes, une contrainte liée aux coûts de calcul élevés nécessaires au fonctionnement du modèle.
Un terrain de jeu créatif… mais encore imparfait
Project Genie brille particulièrement lorsqu’il s’agit de créer des univers stylisés et artistiques. Les mondes inspirés de dessins animés, d’animations en pâte à modeler ou d’esthétiques fantaisistes sont souvent convaincants et immersifs. En revanche, dès que l’objectif devient le réalisme ou le rendu cinématographique, les limites du système apparaissent rapidement.
Les environnements photoréalistes manquent de naturel, et les interactions physiques restent parfois incohérentes, avec des personnages traversant des objets solides ou des espaces qui se réorganisent subtilement sans raison apparente. L’utilisation de photos réelles donne des résultats variables, parfois proches de l’original, parfois très éloignés.
Une technologie prometteuse tournée vers l’avenir
Malgré ses imperfections, Project Genie offre un aperçu fascinant de ce que pourraient devenir les mondes virtuels générés par IA. Pour DeepMind, l’objectif n’est pas encore de proposer un produit grand public abouti, mais de collecter des retours et d’améliorer progressivement la cohérence, le réalisme et l’interactivité.
À terme, ces technologies pourraient dépasser le cadre du jeu vidéo et servir à entraîner des agents autonomes, simuler des environnements complexes ou accompagner le développement de robots dans des mondes virtuels. Project Genie n’est donc pas une fin en soi, mais plutôt une démonstration concrète d’un futur où l’imagination humaine et l’IA construiront ensemble des univers entièrement explorables.

