Lors de l’événement Made by Google, Google a dévoilé son dernier-né en matière d’intelligence artificielle : Gemini Live.
Cette nouvelle fonctionnalité permet aux utilisateurs de tenir des conversations vocales semi-naturelles avec un chatbot IA, sans avoir à taper le moindre mot. Propulsé par le dernier modèle de langage de Google, Gemini Live se positionne comme une alternative avancée aux assistants vocaux traditionnels tels que Siri ou Alexa, offrant une expérience d’utilisation plus fluide et intuitive.
Lire aussi :
- Quels changements cette décision pourrait-elle apporter à la manière dont Google gère son activité de recherche en ligne ?
- Quelles sont les principales améliorations apportées par l’intégration de Gemini dans Google Assistant ?
Une interaction plus naturelle, mais encore imparfaite
Contrairement aux assistants vocaux classiques, Gemini Live se distingue par sa capacité à répondre rapidement, en moins de deux secondes, et à s’adapter aux interruptions. Cette réactivité permet une interaction plus naturelle, rendant l’utilisation du smartphone en mode mains libres plus pratique. Lors d’une démonstration, Gemini Live a été capable de proposer des recommandations complexes, comme trouver des vignobles adaptés aux familles près de Mountain View. Cependant, il y a encore des imperfections, notamment lorsque l’IA a recommandé un parc éloigné de plusieurs heures de route, démontrant que la précision géographique peut encore être améliorée.
Une personnalisation vocale étendue
Gemini Live propose un choix de 10 voix différentes, créées en collaboration avec des acteurs vocaux. Cette variété est une amélioration notable par rapport à des services concurrents comme OpenAI, qui n’offre que trois voix. Ces voix sont conçues pour être très réalistes, rendant l’interaction avec l’IA encore plus immersive. Cependant, Google a pris la décision de ne pas permettre à Gemini Live de chanter ou d’imiter d’autres voix, probablement pour éviter des problèmes juridiques liés aux droits d’auteur.
Des limites à franchir
Gemini Live s’inscrit dans une démarche plus large de Google visant à intégrer l’intelligence artificielle de manière plus intuitive dans la vie quotidienne des utilisateurs. Bien que certaines limitations existent encore, notamment en ce qui concerne la gestion des interruptions et la compréhension des émotions, cette nouvelle fonctionnalité représente un pas en avant significatif dans le domaine de l’interaction homme-machine.
Avec Gemini Live, Google ne se contente pas de suivre la tendance, mais cherche à redéfinir ce que peut être un assistant vocal à l’ère de l’intelligence artificielle. En offrant une interaction plus naturelle et personnalisée, cette innovation pourrait bien devenir un élément clé de l’écosystème Google dans les années à venir, ouvrant la voie à des usages encore plus poussés de l’IA dans notre quotidien.