Speechify, connu jusqu’ici comme l’un des meilleurs outils pour écouter des articles, PDF et documents, vient de franchir une nouvelle étape dans son évolution.
L’entreprise enrichit désormais son extension Chrome avec des fonctionnalités basées sur la détection vocale : la saisie vocale (voice typing) et un assistant vocal intelligent capable d’interagir avec le contenu affiché sur l’écran. Cette mise à jour marque une transformation importante : Speechify n’est plus uniquement un outil de lecture, mais un véritable compagnon vocal assistant la productivité et la compréhension.
Lire aussi :
- Avec 15 millions de dollars levés, Momentic peut-elle devenir la référence de l’automatisation des tests logiciels ?
- ChatGPT devient-il trop influent au point de remplacer les relations humaines et mettre des vies en danger ?
Une fonction de dictée vocale encore en progrès
Grâce aux récents progrès des modèles de reconnaissance vocale, Speechify introduit une fonctionnalité de dictée vocale en anglais. Cette dernière corrige les erreurs automatiquement et supprime les mots parasites comme “uh” ou “hmm”.
Cependant, lors de premiers tests, l’outil montre encore certaines limites. Si la dictée fonctionne correctement sur des plateformes comme Gmail ou Google Docs, elle rencontre des difficultés sur d’autres sites, dont WordPress. Speechify précise que la compatibilité sera progressivement étendue, en se concentrant d’abord sur les sites les plus utilisés.
En termes d’exactitude, le taux d’erreur reste actuellement supérieur à celui d’outils concurrents tels que Wispr Flow, Willow ou Monologue. La startup assure néanmoins que son modèle s’améliore grâce à l’usage, son apprentissage étant continu.
Gemini Code Assist : Google améliore son assistant de programmation avec des capacités “agentiques”
Un assistant vocal intégré pour analyser et synthétiser le web
La seconde nouveauté majeure est l’ajout d’un assistant vocal conversationnel directement intégré dans la barre latérale du navigateur. Il peut répondre à des questions comme :
-
“Résume cette page en trois idées clés.”
-
“Explique ce texte plus simplement.”
Contrairement à ChatGPT ou Gemini, qui proposent la voix comme mode secondaire, Speechify place l’audio au cœur de l’expérience utilisateur. Selon Rohan Pavuluri, directeur commercial de Speechify, de nombreux utilisateurs souhaitent avant tout interagir avec une IA par la voix plutôt que par le clavier.
Cette philosophie pourrait séduire les profils cherchant une interaction plus naturelle avec l’IA, en particulier les personnes souffrant de dyslexie, celles souhaitant réduire leur temps d’écran ou encore les utilisateurs multitâches.
Déploiement futur et ambitions ambitieuses
Actuellement, l’assistant de Speechify n’est pas compatible avec certains navigateurs proposant déjà leur propre assistant latéral, comme OpenAI Atlas ou Perplexity Comet. L’entreprise affirme cependant que son extension vise principalement les utilisateurs Chrome — un marché colossal.
Speechify prévoit d’étendre ces fonctionnalités à toutes ses applications desktop et mobiles. À terme, l’objectif est d’aller encore plus loin : développer des agents automatisés capables d’effectuer des tâches à la place de l’utilisateur, comme appeler un service client ou prendre un rendez-vous.

