OpenAI a annoncé ce lundi une mise à jour majeure de sa fonctionnalité Advanced Voice Mode, l’assistant vocal intégré à ChatGPT, destiné à offrir une expérience conversationnelle plus fluide, plus naturelle et moins intrusive.
Ces changements visent à rendre les échanges avec l’IA plus proches d’une discussion humaine classique.
Lire aussi :
- Apple révolutionne les AirPods Max USB-C avec l’audio sans perte et une latence ultra-faible : de quoi faire basculer les utilisateurs Lightning vers AirPods Max USB-C?
- Nvidia et Google DeepMind aident Disney à créer des robots plus immersifs avec le moteur Newton : Cette intégration de l’IA peut-elle révolutionner l’expérience des parcs à thème ?
Moins d’interruptions, plus de fluidité
L’une des principales critiques formulées à l’encontre des assistants vocaux basés sur l’intelligence artificielle concerne leur tendance à interrompre prématurément les utilisateurs, notamment lorsqu’ils font une pause pour réfléchir ou reprendre leur souffle. OpenAI répond à ce problème en améliorant la gestion des silences dans son assistant vocal.
Désormais, les utilisateurs gratuits de ChatGPT bénéficieront d’une version d’Advanced Voice Mode qui reconnaît les pauses naturelles dans une conversation sans couper la parole. Pour les utilisateurs payants — abonnés aux offres Plus, Teams, Edu, Business et Pro — l’expérience est encore plus poussée avec des interruptions moins fréquentes et une meilleure compréhension des intentions du locuteur.
Une personnalité vocale plus engageante
Outre l’amélioration technique de la gestion des silences, OpenAI a également retravaillé la personnalité de l’assistant vocal. Selon un porte-parole de l’entreprise, le nouveau modèle vocal est plus direct, plus engageant, plus concis, tout en étant capable d’offrir des réponses plus créatives et précises.
L’objectif est clair : humaniser l’interaction, afin que les utilisateurs aient véritablement l’impression de discuter avec un assistant doté d’une réelle capacité d’écoute et d’adaptation. Ces ajustements visent à rendre le dialogue plus naturel, particulièrement dans un contexte d’utilisation prolongée ou professionnelle.
Une réponse à la concurrence qui se renforce
Cette annonce intervient dans un climat de concurrence croissante dans le domaine des assistants vocaux basés sur l’IA. La startup Sesame, soutenue par Andreessen Horowitz et cofondée par Brendan Iribe (ancien d’Oculus), a récemment fait sensation avec ses voix naturelles Maya et Miles. Amazon n’est pas en reste et prépare la sortie d’une version repensée d’Alexa, alimentée par un grand modèle de langage (LLM).
OpenAI semble donc déterminée à garder une longueur d’avance en affinant son offre vocale. Si la qualité des échanges vocaux devient un élément différenciateur majeur entre les outils d’IA, cette mise à jour pourrait consolider la position de ChatGPT dans ce marché en pleine ébullition.