Lors du CES 2025 à Las Vegas, Nvidia a présenté Cosmos WFMs, une famille de modèles d’intelligence artificielle inspirés des modèles mentaux humains.
Ces modèles sont conçus pour prédire et générer des vidéos conscientes des lois physiques, avec des applications variées allant de la robotique à la génération de données synthétiques pour les véhicules autonomes. Disponibles via l’API de Nvidia, GitHub, et d’autres plateformes, ces modèles sont accessibles librement sous une licence permissive, autorisant leur usage commercial.
Cosmos WFMs se divise en trois catégories : Nano pour les applications en temps réel, Super pour des performances équilibrées, et Ultra pour des résultats de qualité maximale. Leur taille varie de 4 à 14 milliards de paramètres, offrant une adaptabilité en fonction des besoins.
Lire aussi :
- En quoi les innovations des processeurs Core Ultra 200 d’Intel peuvent-elles révolutionner les performances et la sécurité des appareils modernes ?
- Comment OpenAI peut-elle équilibrer innovation et rentabilité tout en répondant aux attentes des utilisateurs de ChatGPT Pro ?
Des outils pour une IA physique et responsable
En plus des modèles principaux, Nvidia inclut un modèle d’amélioration vidéo pour la réalité augmentée et des garde-fous pour un usage éthique. Cosmos WFMs a été entraîné sur une base massive de données, incluant 20 millions d’heures de vidéos et 9 000 trillions de tokens issus de divers secteurs : robotique, conduite autonome et interactions humaines. Ces outils permettent de générer des vidéos réalistes à partir de données variées, telles que des images, des textes ou des données sensorielles.
Des entreprises telles que Uber, Waabi, et Wayve testent déjà Cosmos WFMs pour améliorer la recherche vidéo, la formation de modèles IA et le développement de véhicules autonomes. Le PDG d’Uber, Dara Khosrowshahi, affirme que ces modèles pourraient accélérer le développement de solutions de conduite autonome sûres et évolutives.
Quels sont les enjeux économiques et technologiques de l’enquête antitrust de la Chine sur Nvidia ?
Des critiques sur l’éthique et la transparence
Malgré ses promesses, Cosmos WFMs soulève des préoccupations éthiques. Nvidia n’a pas publié tous les détails concernant l’origine des données d’entraînement, ce qui alimente les spéculations sur l’utilisation de contenus protégés par le droit d’auteur. Bien que l’entreprise affirme respecter les lois, certains experts remettent en question la légitimité de son approche, notamment en matière de fair use.
Par ailleurs, bien que Nvidia qualifie Cosmos de modèle ouvert, il ne répond pas aux critères stricts de l’open source. Tous les outils nécessaires pour recréer les modèles ne sont pas disponibles, et l’opacité concernant les données d’entraînement pourrait freiner l’adoption de ces modèles par certaines organisations.
Avec Cosmos WFMs, Nvidia ambitionne de redéfinir les standards de l’IA physique, tout en rendant ces outils accessibles à un large éventail d’utilisateurs. Si ces modèles tiennent leurs promesses, ils pourraient bien ouvrir une nouvelle ère pour la robotique et l’intelligence artificielle appliquée.