La majoritรฉ des tests actuels pour les modรจles d’intelligence artificielle ne mesurent pas toujours efficacement leurs vรฉritables capacitรฉs de raisonnement.
Les benchmarks classiques sont souvent limitรฉs par des questions basiques ou des exercices basรฉs sur la mรฉmorisation, ce qui ne reflรจte pas leur potentiel face aux problรจmes du monde rรฉel. Pour dรฉpasser ces limites, des passionnรฉs dโIA se tournent dรฉsormais vers les jeux pour tester les compรฉtences de rรฉsolution de problรจmes des IA. Paul Calcraft, dรฉveloppeur indรฉpendant, a ainsi crรฉรฉ une application dans laquelle deux modรจles d’IA jouent ร un jeu semblable au Pictionary. Un modรจle dessine un objet, et l’autre tente de deviner ce que lโimage reprรฉsente.
Lire aussi :
- Comment la proposition de Perplexity dโintervenir en pรฉriode de grรจve pourrait-elle affecter les relations entre les travailleurs et les entreprises de technologie comme le New York Times ?
- Comment Bluesky se diffรฉrencie-t-il des autres rรฉseaux sociaux en matiรจre de sรฉcuritรฉ des informations รฉlectorales ?
Minecraft et la capacitรฉ des IA ร rรฉsoudre des problรจmes
Dans une dรฉmarche similaire, le jeune Adonis Singh a conรงu un outil, mc-bench, qui donne ร un modรจle le contrรดle dโun personnage dans le jeu Minecraft. Ce jeu place les IA dans un environnement oรน elles doivent faire preuve de crรฉativitรฉ pour construire des structures ou accomplir des tรขches. Selon Singh, Minecraft est un outil parfait pour tester la “ressource” des modรจles en raison de ses possibilitรฉs illimitรฉes. Contrairement aux benchmarks traditionnels, Minecraft offre un terrain dโentraรฎnement sans rรฉponse prรฉenregistrรฉe, nรฉcessitant que lโIA sโadapte en temps rรฉel aux dรฉfis imprรฉvus.
Les limites et les perspectives de ces jeux pour lโIA
Malgrรฉ l’intรฉrรชt croissant pour ces nouveaux outils, certains chercheurs รฉmettent des rรฉserves. Mike Cook, spรฉcialiste en IA, pense que Minecraft nโest pas un test particuliรจrement unique : pour lui, il pourrait รชtre remplacรฉ par dโautres jeux de rรฉsolution de problรจmes comme Fortnite ou Stardew Valley. Cependant, l’usage de jeux comme Minecraft ou Pictionary montre une avancรฉe intรฉressante dans lโapproche de l’IA. Ces environnements stimulent les IA ร penser au-delร des simples tรขches rรฉpรฉtitives, en leur imposant des dรฉfis crรฉatifs.
Vers une IA plus intuitive et adaptable
Les jeux sont donc bien plus quโun simple divertissement pour les chercheurs en IA. Ils reprรฉsentent une opportunitรฉ de tester des capacitรฉs plus nuancรฉes comme la crรฉativitรฉ, la logique et l’adaptabilitรฉ. Selon Calcraft, ces approches ludiques pourraient constituer une รฉtape vers le dรฉveloppement de modรจles dโIA dotรฉs de comprรฉhension spatiale et de multimodalitรฉ, รฉlรฉments essentiels pour des applications plus avancรฉes. Ainsi, mรชme si ces jeux ne sont pas des tests parfaits, ils offrent aux chercheurs un aperรงu des potentiels futurs pour des IA plus ingรฉnieuses et polyvalentes.