OpenAI continue de repousser les limites de l’intelligence artificielle en dรฉployant le mode vocal avancรฉ de ChatGPT sur les navigateurs web.
Cette fonctionnalitรฉ innovante, auparavant disponible sur les applications iOS et Android, permet dรฉsormais aux utilisateurs dโinteragir vocalement avec ChatGPT directement depuis leur navigateur.
Lire aussi :
- Comment la fonctionnalitรฉ Call-out the Brand de Yuka pourrait-elle influencer les pratiques des grandes marques alimentaires et cosmรฉtiques ?
- Quels sont les principaux risques identifiรฉs par ServiceTitan concernant lโutilisation des modรจles de langage large dans ses activitรฉs ?
Une innovation rรฉservรฉe aux abonnรฉs payants
Le mode vocal avancรฉ nโest actuellement accessible quโaux utilisateurs abonnรฉs aux plans Plus, Enterprise, Teams ou Edu. Cette stratรฉgie dโOpenAI vise ร offrir une valeur ajoutรฉe aux abonnรฉs payants tout en promettant une ouverture progressive aux utilisateurs gratuits dans les semaines ร venir, avec des pรฉriodes dโessai mensuelles.
Pour utiliser cette fonctionnalitรฉ, les utilisateurs doivent sรฉlectionner lโicรดne vocale en bas ร droite de la fenรชtre ChatGPT, autoriser lโaccรจs au microphone de leur navigateur, puis interagir avec un รฉcran animรฉ par une orb bleue. Une fois activรฉ, le chatbot devient capable de comprendre et de rรฉpondre en fonction de la vitesse de parole et des intonations, rendant les รฉchanges plus fluides et personnalisรฉs.
Une personnalisation vocale au service de lโutilisateur
Une des grandes forces du mode vocal avancรฉ rรฉside dans sa capacitรฉ ร personnaliser les interactions grรขce ร neuf voix distinctes. Chaque voix a un ton et un caractรจre uniques, comme “Arbor”, qui est dรฉcrite comme dรฉcontractรฉe et polyvalente, ou “Ember”, qui inspire confiance et optimisme. Ce niveau de personnalisation permet aux utilisateurs de choisir une voix qui correspond ร leur style et leurs prรฉfรฉrences, rendant lโexpรฉrience encore plus immersive.
En plus de cette personnalisation, le chatbot utilise les capacitรฉs audio avancรฉes de GPT-4o, ce qui permet non seulement de comprendre les mots prononcรฉs, mais aussi de capter des indices non verbaux, comme le ton ou lโรฉmotion. Cette technologie ouvre de nouvelles perspectives dans lโinteraction homme-machine.
Des limitations pour un usage รฉquilibrรฉ
Malgrรฉ ces avancรฉes, OpenAI impose des limites dโutilisation au mode vocal avancรฉ. Les abonnรฉs aux plans Plus et Teams ont une durรฉe dโutilisation quotidienne plafonnรฉe, avec une notification envoyรฉe lorsque 15 minutes dโutilisation restent disponibles. Ces restrictions, bien que temporaires, permettent de gรฉrer les ressources tout en maintenant une qualitรฉ de service optimale.
OpenAI prรฉvoit รฉgalement dโรฉtendre cette fonctionnalitรฉ aux utilisateurs gratuits, marquant ainsi une รฉtape importante dans la dรฉmocratisation de cette innovation. ร terme, lโentreprise espรจre transformer la maniรจre dont les utilisateurs interagissent avec les IA, en rendant ces รฉchanges plus intuitifs et naturels.