Lors de son Dev Day, OpenAI a dévoilé une série d’innovations majeures destinées à séduire les développeurs.
Parmi elles : GPT-5 Pro, un modèle linguistique plus puissant, Sora 2, la nouvelle version de son générateur vidéo, et un modèle vocal réduit et moins coûteux. Ces nouveautés confirment la volonté de l’entreprise dirigée par Sam Altman de consolider sa position en tant que plateforme incontournable pour les créateurs d’applications basées sur l’intelligence artificielle.
Lire aussi :
- Anthropic nomme Rahul Patil au poste de CTO pour renforcer son infrastructure d’intelligence artificielle
- Adobe lance Premiere sur iPhone : un pas stratégique vers l’édition vidéo mobile
GPT-5 Pro : la nouvelle référence pour les applications exigeantes
OpenAI a présenté GPT-5 Pro, un modèle de langage conçu pour répondre aux besoins des secteurs où la précision et la logique sont essentielles, comme la finance, le droit ou la santé. Selon Altman, ce modèle offre une profondeur de raisonnement et une fiabilité accrues, ouvrant la voie à des outils professionnels capables de gérer des analyses complexes ou des recommandations juridiques automatisées.
Cette version plus performante s’intègre facilement à l’API OpenAI, permettant aux entreprises de profiter d’une IA hautement spécialisée tout en gardant la flexibilité d’adapter les paramètres à leurs propres cas d’usage.
Comment Sora d’OpenAI a-t-elle atteint la 3ᵉ place de l’App Store US en seulement deux jours ?
Une IA vocale plus rapide et plus économique
Autre annonce clé : le lancement de gpt-realtime mini, un nouveau modèle vocal capable de générer des réponses audio instantanées. Ce modèle, 70 % moins cher que la version précédente, conserve la même qualité et expressivité de voix tout en réduisant considérablement la latence.
OpenAI mise sur la voix comme principal mode d’interaction avec l’IA. Altman a souligné que l’avenir passera par des conversations fluides et naturelles entre humains et machines — un axe déjà visible dans ChatGPT et désormais disponible pour les développeurs via l’API. Cette innovation permettra notamment aux créateurs d’intégrer des assistants vocaux temps réel dans leurs applications sans coûts prohibitifs.
Sora 2 : la vidéo générative atteint un nouveau niveau
Enfin, OpenAI ouvre Sora 2 en avant-première dans son API. Ce modèle, également à la base de l’application Sora, concurrente directe de TikTok, permet de générer des vidéos courtes et réalistes à partir de simples descriptions textuelles.
Sora 2 améliore la cohérence physique et la synchronisation audio des scènes, tout en offrant un contrôle créatif accru : angles de caméra, styles visuels, ambiances sonores… Les développeurs peuvent ainsi créer des contenus immersifs ou prototyper des concepts visuels, que ce soit pour la publicité, le design produit ou la narration interactive.
Sam Altman a donné un exemple frappant : un concepteur peut partir d’une vue iPhone et demander à Sora 2 de la transformer en plan cinématique grand angle avec effets sonores synchronisés.
L’application sociale Sora d’OpenAI inondée de deepfakes troublants de Sam Altman
Avec ces annonces, OpenAI accélère son virage vers une plateforme complète pour développeurs, combinant langage, son et vidéo. GPT-5 Pro, gpt-realtime mini et Sora 2 illustrent une même ambition : rendre la création d’expériences intelligentes plus accessible, plus rapide et plus créative que jamais.