Thinking Machines Lab peut-il vraiment rendre les modèles d’IA plus cohérents et transformer la recherche en produits concrets ?

Fondé par Mira Murati, ancienne directrice technique d’OpenAI, Thinking Machines Lab intrigue depuis son lancement grâce à ses 2 milliards de dollars de financement et à son équipe composée d’anciens chercheurs de renom.

Mercredi, le laboratoire a publié son premier billet de recherche, offrant un aperçu de ses travaux. L’objectif annoncé : créer des modèles d’IA capables de générer des réponses reproductibles, et donc plus fiables.

Comprendre la source de l’aléatoire dans les réponses

Le billet, intitulé « Defeating Nondeterminism in LLM Inference », met en lumière une réalité bien connue : les grands modèles de langage actuels sont non déterministes. Autrement dit, poser plusieurs fois la même question à un outil comme ChatGPT peut donner des réponses différentes.
Pour Horace He, chercheur au sein du laboratoire, cette variabilité ne serait pas une fatalité. Il identifie la racine du problème dans la manière dont les kernels GPU — les petits programmes internes aux puces Nvidia — s’enchaînent lors du processus d’inférence. Selon lui, une orchestration plus stricte de cette étape permettrait de réduire fortement l’aléatoire et de tendre vers un comportement plus déterministe.

AGI, les LLM et les hallucinations en intelligence artificielle : Découvrez ces termes clés pour comprendre l’IA moderne

Des bénéfices pour la recherche et les entreprises

La reproductibilité des réponses d’un modèle ne relève pas uniquement d’un souci académique. Pour les entreprises et les scientifiques, disposer de résultats constants et vérifiables est crucial, que ce soit pour analyser des données sensibles ou pour automatiser des décisions. Horace He souligne également que cette cohérence améliorerait les méthodes d’apprentissage par renforcement (RL), largement utilisées pour perfectionner les modèles.
En effet, si les réponses varient trop, les signaux de récompense deviennent bruyants, ce qui ralentit ou perturbe l’entraînement. En rendant les sorties d’IA plus stables, Thinking Machines Lab espère accélérer le développement de modèles personnalisés pour les entreprises, un objectif déjà partagé avec ses investisseurs.

Une vision ouverte, mais un pari à confirmer

Mira Murati a indiqué que le premier produit du laboratoire serait dévoilé dans les prochains mois, et qu’il devrait se révéler particulièrement utile pour les chercheurs et les startups spécialisées dans la création de modèles sur mesure. Reste à savoir si les techniques explorées dans ce billet feront partie intégrante de cette première offre.
Thinking Machines Lab affirme également vouloir adopter une culture de recherche ouverte, en publiant régulièrement des billets, du code et d’autres ressources. Une approche qui rappelle les débuts d’OpenAI, avant que l’organisation ne devienne beaucoup plus fermée à mesure qu’elle gagnait en puissance.

Mistral AI : le rival français d’OpenAI qui veut s’imposer sur la scène mondiale

Ce premier billet de la série Connectionism offre un aperçu rare de l’intérieur de l’un des laboratoires les plus secrets de la Silicon Valley. En s’attaquant à la question de la cohérence et de la reproductibilité des modèles d’IA, Thinking Machines Lab touche à un défi fondamental du secteur. La vraie question est désormais de savoir si le laboratoire saura transformer ces avancées en produits concrets capables de justifier sa valorisation à 12 milliards de dollars.

Thinking Machines Lab peut-il vraiment rendre les modèles d’IA plus cohérents et transformer la recherche en produits concrets ?

Comprendre la source de l’aléatoire dans les réponses

Des bénéfices pour la recherche et les entreprises

Une vision ouverte, mais un pari à confirmer

Partager cet article

Actualités

GTA 6 Online pourrait arriver bien plus tôt que prévu : une fuite dévoile une fenêtre de sortie proche du lancement

GTA 6 : des détails sur une mission potentielle ont fuité et révèlent de nouvelles informations sur le jeu

Monopoly go : jalons de récompenses du tournoi « Tycoon Class », conseils et informations avant sa sortie

GTA 6 : un ancien développeur brise l’illusion et alerte sur des trailers “trop parfaits” qui pourraient tromper les joueurs

GTA 5 : une découverte inattendue révèle un personnage issu d’un jeu Rockstar oublié

LAISSER UN COMMENTAIRE Annuler la réponse