DeepMind, la filiale d’IA de Google, a dévoilé Genie 2, un modèle capable de créer des mondes 3D interactifs à partir d’une simple image ou description textuelle.
Successeur de Genie, lancé plus tôt cette année, Genie 2 promet de générer une diversité infinie d’environnements où les utilisateurs peuvent interagir en temps réel. Que ce soit pour sauter, nager ou explorer un univers virtuel, Genie 2 simule des animations, des éclairages, des interactions physiques, et même le comportement de personnages non jouables (PNJ).
Le modèle se distingue par sa capacité à produire des scènes semblables à des jeux vidéo de qualité AAA. Cependant, DeepMind reste discret sur les données utilisées pour former ce modèle, bien que des indices laissent supposer l’utilisation de vidéos issues de plateformes comme YouTube.
Lire aussi :
- Comment Meta a-t-elle réussi à limiter l’impact de l’intelligence artificielle sur la désinformation liée aux élections ?
- Comment Google Veo transforme-t-il la création de contenus vidéo pour les entreprises et les créateurs ?
Des mondes immersifs, mais temporaires
Genie 2 se démarque de ses concurrents par sa capacité à rendre des mondes cohérents sous plusieurs angles de vue, comme la perspective à la première personne ou la vue isométrique. Ces simulations, bien qu’impressionnantes, restent limitées à une durée de 10 à 20 secondes en moyenne, rendant difficile leur utilisation dans des jeux complets.
Cependant, Genie 2 surpasse les modèles similaires en mémorisant les éléments hors champ, ce qui permet une restitution fidèle lorsque ces éléments reviennent dans le champ de vision. Cette fonctionnalité corrige les problèmes d’incohérence et de hallucination souvent rencontrés avec d’autres générateurs.
Comment YouTube se distingue-t-il de TikTok avec sa nouvelle fonctionnalité Dream Screen ?
Un outil pour les créatifs et les chercheurs
Plutôt que de viser le marché des jeux vidéo, DeepMind positionne Genie 2 comme un outil de recherche et de création. Le modèle pourrait transformer des concepts artistiques en environnements interactifs, offrant ainsi une nouvelle manière de prototyper des expériences immersives.
En recherche, Genie 2 permet de générer rapidement des tâches d’évaluation pour des agents d’IA dans des environnements diversifiés. Cela pourrait améliorer leur capacité à s’adapter à des situations inédites, un domaine clé pour l’IA.
Une avancée prometteuse malgré les critiques
Si Genie 2 ouvre des possibilités excitantes, il suscite aussi des inquiétudes dans l’industrie du jeu vidéo. Des acteurs majeurs comme Activision Blizzard utilisent déjà l’IA pour optimiser la productivité, parfois au détriment des employés. Cette technologie pourrait accentuer ces pratiques controversées.
Anterior lève 20 millions de dollars pour révolutionner les approbations d’assurance santé avec l’IA
Malgré cela, DeepMind continue d’investir dans la recherche sur les modèles générateurs de mondes. Avec des recrutements stratégiques, l’entreprise montre son ambition de rester en tête dans ce domaine émergent de l’IA. Genie 2, bien qu’imparfait, marque une avancée significative vers des mondes numériques plus interactifs et accessibles.