ElevenLabs, la société spécialisée dans l’intelligence artificielle vocale, a récemment dévoilé une application mobile autonome pour les utilisateurs iOS et Android, permettant de générer des clips vocaux à partir de texte.
Ce lancement marque une étape importante pour l’entreprise qui propose désormais à ses utilisateurs une solution de génération vocale plus accessible et pratique, en dehors de son application web.
Lire aussi :
- Comment Alexa+ pourrait-il révolutionner l’expérience des utilisateurs d’Amazon grâce à ses fonctionnalités basées sur l’IA générative ?
- OpenAI retire ses vidéos promotionnelles avec Jony Ive après une plainte sur la marque “io”
Une nouvelle expérience mobile pour les créateurs
Avant cette annonce, les utilisateurs d’ElevenLabs devaient passer par l’application web pour créer des échantillons vocaux. Avec la sortie de l’application mobile, la génération de voix devient plus fluide et peut être effectuée à tout moment, n’importe où. L’application permet aux utilisateurs de taper ou coller un texte, puis de choisir parmi une sélection de voix pour générer un clip audio. Cette fonctionnalité est idéale pour les créateurs de contenu, les marketeurs, les enseignants, et bien d’autres professionnels qui ont besoin de produire des voix de qualité rapidement. Le plan gratuit permet de générer environ 10 minutes de contenu audio, et des modèles différents sont proposés pour équilibrer le coût et la qualité des productions vocales.
Des modèles de synthèse vocale de nouvelle génération
ElevenLabs a intégré dans l’application mobile ses nouveaux modèles de synthèse vocale V3 alpha, permettant aux utilisateurs de contrôler les expressions vocales via des balises spéciales. Cette évolution des capacités de l’IA permet de personnaliser davantage la voix générée, donnant ainsi un contrôle précis sur l’émotion ou le ton des voix produites. Jack McDermott, responsable de la croissance mobile de la société, a mentionné que de nombreux créateurs de contenu utilisaient déjà le navigateur mobile pour générer des échantillons vocaux destinés à des vidéos sur des applications comme CapCut, Instagram ou InShot. Avec cette nouvelle application native, ElevenLabs répond à la demande croissante des créateurs, souhaitant une expérience plus rapide et intuitive directement sur mobile.
Une concurrence féroce dans l’édition vocale
Cette application mobile est la deuxième sortie grand public d’ElevenLabs, après le lancement de l’application Reader l’année dernière, qui permet d’écouter des articles, des blogs, des PDF et des livres électroniques. En plus de ses innovations dans la génération vocale, ElevenLabs prévoit de lancer de nouvelles fonctionnalités, comme des outils de transcription vocale et un agent AI conversationnel. Ces ajouts viendront enrichir l’application et permettront à l’entreprise de mieux rivaliser avec des acteurs établis dans le domaine de la génération vocale et de la synthèse, tels que Speechify et Captions. L’outil sera également enrichi d’expériences basées sur des modèles comme 11.ai, pour une utilisation plus approfondie de l’IA.
L’innovation auditive d’ElevenLabs : Un pas de géant dans la création de contenu IA
Avec cette application mobile, ElevenLabs poursuit son développement en rendant la génération vocale plus accessible, tout en cherchant à renforcer sa position dans le domaine très compétitif de l’intelligence artificielle vocale.