Anthropic a commencé à déployer un nouveau mode vocal pour ses applications chatbot Claude.
Cette fonctionnalité, encore en phase bêta, permettra aux utilisateurs de discuter entièrement à l’oral avec Claude, facilitant ainsi l’interaction lorsque l’usage du clavier est difficile ou impossible.
Lire aussi :
- Samsung investit jusqu’à 100 millions de dollars dans la startup Exo pour révolutionner l’imagerie médicale portable
- Anthropic : Les IA hallucinent moins que les humains, une avancée vers l’intelligence artificielle générale ?
Une interaction vocale naturelle et intuitive
Le mode vocal utilise par défaut le modèle Claude Sonnet 4, la dernière version développée par Anthropic. Il permet aux utilisateurs d’échanger avec Claude non seulement par la voix, mais aussi de recevoir des réponses orales, avec la possibilité de voir simultanément les points clés affichés à l’écran. Cette approche transforme la façon dont les utilisateurs peuvent interagir avec l’intelligence artificielle, en rendant les échanges plus fluides et naturels.
En plus de pouvoir alterner à tout moment entre saisie textuelle et mode vocal, les utilisateurs peuvent également bénéficier d’une transcription automatique ainsi que d’un résumé à la fin de chaque conversation. Ces fonctions facilitent la relecture et la compréhension des échanges.
Une tendance partagée par les acteurs majeurs de l’IA
Le mode vocal n’est pas une exclusivité d’Anthropic : d’autres grandes entreprises de l’IA, telles qu’OpenAI avec ses chatbots et Google avec Gemini Live, proposent aussi des expériences conversationnelles basées sur la voix. De même, xAI propose un mode vocal pour son assistant Grok. Ces innovations montrent une volonté forte de rendre l’intelligence artificielle plus accessible et adaptée aux usages quotidiens.
Anthropic propose par ailleurs cinq voix différentes, permettant à chaque utilisateur de personnaliser son expérience selon ses préférences auditives. Le chatbot vocal peut également gérer des interactions complexes comme la lecture et la discussion autour de documents ou d’images.
Des fonctionnalités avancées pour les abonnés payants
Pour les utilisateurs gratuits, Anthropic limite le nombre de conversations vocales entre 20 et 30 par période, afin de maîtriser l’usage des ressources. Les abonnés payants, en revanche, bénéficient d’un accès à des fonctionnalités plus poussées, notamment un connecteur Google Workspace qui permet au mode vocal de consulter les rendez-vous du calendrier Google et les emails Gmail. Cette intégration avancée est cependant réservée aux utilisateurs des plans Enterprise pour Google Docs.
Des partenariats en discussion pour enrichir l’expérience
Mike Krieger, directeur produit chez Anthropic, avait annoncé début mars l’intention de développer ces capacités vocales, mentionnant des discussions en cours avec Amazon, principal investisseur d’Anthropic, ainsi qu’avec ElevenLabs, une startup spécialisée dans la synthèse vocale. Le résultat concret de ces partenariats n’est pas encore clair, mais ils laissent entrevoir un avenir où les échanges vocaux avec Claude pourraient s’enrichir considérablement.
En somme, ce nouveau mode vocal marque une étape importante dans l’évolution de Claude et d’Anthropic, répondant à un besoin croissant d’interactions plus humaines et accessibles avec les intelligences artificielles.