Les chercheurs de plusieurs universités et entreprises technologiques ont mis au point un benchmark original pour tester les capacités de raisonnement des modèles d’intelligence artificielle. Plutôt que d’utiliser des questions complexes de mathématiques ou de sciences, ils se sont tournés vers les énigmes du Sunday Puzzle, un jeu radiophonique diffusé chaque semaine sur NPR. L’objectif … Lire la suite de Comment les chercheurs utilisent-ils les énigmes du Sunday Puzzle pour évaluer les capacités de raisonnement des modèles d’intelligence artificielle ?
Copiez-collez cette URL dans votre site WordPress pour l’inclure
Copiez-collez ce code sur votre site pour l’y intégrer