En marge de la conférence SIGGRAPH, Nvidia a présenté une série d’innovations destinées à révolutionner la robotique et les applications d’IA physique.
Au cœur de ces annonces, la société a levé le voile sur Cosmos Reason, un modèle vision-langage de 7 milliards de paramètres, spécialement conçu pour offrir aux robots la capacité de « raisonner » dans des environnements réels. L’objectif est clair : propulser la robotique vers une ère où les machines ne se contentent plus d’exécuter des commandes, mais peuvent anticiper, planifier et interagir intelligemment avec le monde physique.
Lire aussi :
- Nvidia et AMD : un accord inédit pour vendre des puces IA haut de gamme à la Chine
- Siri bientôt capable de contrôler toutes vos applications avec la voix : la grande révolution d’Apple en approche
Cosmos Reason : quand les robots apprennent à raisonner
Cosmos Reason se distingue par sa compréhension de la physique et sa mémoire interne, ce qui lui permet d’élaborer des plans d’action pour des agents incarnés, qu’il s’agisse de robots ou d’IA embarquées. Concrètement, il peut déterminer les étapes nécessaires pour accomplir une tâche complexe, analyser des vidéos ou encore organiser et filtrer des données pour améliorer l’apprentissage des machines.
À ses côtés, Nvidia a également présenté Cosmos Transfer-2, un modèle capable d’accélérer la génération de données synthétiques à partir de scènes 3D ou d’entrées de contrôle spatial. Une version allégée, optimisée pour la vitesse, permet aux développeurs de travailler plus efficacement, même dans des environnements où la puissance de calcul est limitée.
Des outils avancés pour la simulation et la reconstruction du monde réel
Nvidia ne s’arrête pas aux modèles IA : la firme a aussi dévoilé de nouvelles bibliothèques de reconstruction neuronale. Parmi elles, une technologie de rendu innovante permet de simuler un environnement 3D à partir de données issues de capteurs, offrant ainsi des mondes virtuels plus réalistes pour entraîner les robots.
Ces avancées sont directement intégrées dans CARLA, un simulateur open source largement utilisé par les développeurs pour tester et former des véhicules autonomes et autres systèmes robotiques. Par ailleurs, le kit de développement logiciel Omniverse bénéficie d’une mise à jour, renforçant les capacités de création et de simulation d’environnements complexes.
Une infrastructure puissante pour soutenir la robotique de demain
Pour accompagner ces innovations logicielles, Nvidia a présenté le RTX Pro Blackwell Server, une architecture serveur dédiée aux charges de travail robotiques, ainsi que le DGX Cloud, une plateforme de gestion cloud destinée à faciliter le développement et le déploiement de solutions robotiques à grande échelle.
Pourquoi Nvidia peut-elle de nouveau vendre ses puces H20 en Chine après des mois d’interdiction ?
Ces annonces traduisent une volonté stratégique : aller au-delà des centres de données d’IA, domaine où Nvidia est déjà leader, pour s’imposer sur le marché émergent de l’IA physique. La combinaison de modèles avancés comme Cosmos Reason, de puissants outils de simulation et d’une infrastructure robuste pourrait bien constituer la prochaine étape majeure dans la fusion entre intelligence artificielle et robotique.