OpenAI continue de repousser les limites de l’intelligence artificielle en déployant le mode vocal avancé de ChatGPT sur les navigateurs web.
Cette fonctionnalité innovante, auparavant disponible sur les applications iOS et Android, permet désormais aux utilisateurs d’interagir vocalement avec ChatGPT directement depuis leur navigateur.
Lire aussi :
- Comment la fonctionnalité Call-out the Brand de Yuka pourrait-elle influencer les pratiques des grandes marques alimentaires et cosmétiques ?
- Quels sont les principaux risques identifiés par ServiceTitan concernant l’utilisation des modèles de langage large dans ses activités ?
Une innovation réservée aux abonnés payants
Le mode vocal avancé n’est actuellement accessible qu’aux utilisateurs abonnés aux plans Plus, Enterprise, Teams ou Edu. Cette stratégie d’OpenAI vise à offrir une valeur ajoutée aux abonnés payants tout en promettant une ouverture progressive aux utilisateurs gratuits dans les semaines à venir, avec des périodes d’essai mensuelles.
Pour utiliser cette fonctionnalité, les utilisateurs doivent sélectionner l’icône vocale en bas à droite de la fenêtre ChatGPT, autoriser l’accès au microphone de leur navigateur, puis interagir avec un écran animé par une orb bleue. Une fois activé, le chatbot devient capable de comprendre et de répondre en fonction de la vitesse de parole et des intonations, rendant les échanges plus fluides et personnalisés.
Pourquoi Elon Musk accuse-t-il OpenAI d’avoir trahi sa mission initiale et d’avantager Microsoft ?
Une personnalisation vocale au service de l’utilisateur
Une des grandes forces du mode vocal avancé réside dans sa capacité à personnaliser les interactions grâce à neuf voix distinctes. Chaque voix a un ton et un caractère uniques, comme “Arbor”, qui est décrite comme décontractée et polyvalente, ou “Ember”, qui inspire confiance et optimisme. Ce niveau de personnalisation permet aux utilisateurs de choisir une voix qui correspond à leur style et leurs préférences, rendant l’expérience encore plus immersive.
En plus de cette personnalisation, le chatbot utilise les capacités audio avancées de GPT-4o, ce qui permet non seulement de comprendre les mots prononcés, mais aussi de capter des indices non verbaux, comme le ton ou l’émotion. Cette technologie ouvre de nouvelles perspectives dans l’interaction homme-machine.
Des limitations pour un usage équilibré
Malgré ces avancées, OpenAI impose des limites d’utilisation au mode vocal avancé. Les abonnés aux plans Plus et Teams ont une durée d’utilisation quotidienne plafonnée, avec une notification envoyée lorsque 15 minutes d’utilisation restent disponibles. Ces restrictions, bien que temporaires, permettent de gérer les ressources tout en maintenant une qualité de service optimale.
OpenAI prévoit également d’étendre cette fonctionnalité aux utilisateurs gratuits, marquant ainsi une étape importante dans la démocratisation de cette innovation. À terme, l’entreprise espère transformer la manière dont les utilisateurs interagissent avec les IA, en rendant ces échanges plus intuitifs et naturels.