La majorité des tests actuels pour les modèles d’intelligence artificielle ne mesurent pas toujours efficacement leurs véritables capacités de raisonnement.
Les benchmarks classiques sont souvent limités par des questions basiques ou des exercices basés sur la mémorisation, ce qui ne reflète pas leur potentiel face aux problèmes du monde réel. Pour dépasser ces limites, des passionnés d’IA se tournent désormais vers les jeux pour tester les compétences de résolution de problèmes des IA. Paul Calcraft, développeur indépendant, a ainsi créé une application dans laquelle deux modèles d’IA jouent à un jeu semblable au Pictionary. Un modèle dessine un objet, et l’autre tente de deviner ce que l’image représente.
Lire aussi :
- Comment la proposition de Perplexity d’intervenir en période de grève pourrait-elle affecter les relations entre les travailleurs et les entreprises de technologie comme le New York Times ?
- Comment Bluesky se différencie-t-il des autres réseaux sociaux en matière de sécurité des informations électorales ?
Minecraft et la capacité des IA à résoudre des problèmes
Dans une démarche similaire, le jeune Adonis Singh a conçu un outil, mc-bench, qui donne à un modèle le contrôle d’un personnage dans le jeu Minecraft. Ce jeu place les IA dans un environnement où elles doivent faire preuve de créativité pour construire des structures ou accomplir des tâches. Selon Singh, Minecraft est un outil parfait pour tester la “ressource” des modèles en raison de ses possibilités illimitées. Contrairement aux benchmarks traditionnels, Minecraft offre un terrain d’entraînement sans réponse préenregistrée, nécessitant que l’IA s’adapte en temps réel aux défis imprévus.
Les limites et les perspectives de ces jeux pour l’IA
Malgré l’intérêt croissant pour ces nouveaux outils, certains chercheurs émettent des réserves. Mike Cook, spécialiste en IA, pense que Minecraft n’est pas un test particulièrement unique : pour lui, il pourrait être remplacé par d’autres jeux de résolution de problèmes comme Fortnite ou Stardew Valley. Cependant, l’usage de jeux comme Minecraft ou Pictionary montre une avancée intéressante dans l’approche de l’IA. Ces environnements stimulent les IA à penser au-delà des simples tâches répétitives, en leur imposant des défis créatifs.
Vers une IA plus intuitive et adaptable
Les jeux sont donc bien plus qu’un simple divertissement pour les chercheurs en IA. Ils représentent une opportunité de tester des capacités plus nuancées comme la créativité, la logique et l’adaptabilité. Selon Calcraft, ces approches ludiques pourraient constituer une étape vers le développement de modèles d’IA dotés de compréhension spatiale et de multimodalité, éléments essentiels pour des applications plus avancées. Ainsi, même si ces jeux ne sont pas des tests parfaits, ils offrent aux chercheurs un aperçu des potentiels futurs pour des IA plus ingénieuses et polyvalentes.