Google a récemment annoncé la réintroduction de la fonctionnalité de génération de personnes dans son chatbot alimenté par l’intelligence artificielle, Gemini.
Cette fonctionnalité, qui avait été suspendue en février suite à des plaintes concernant des inexactitudes historiques, revient avec des améliorations significatives. Bien que l’attente ait été longue, seuls certains utilisateurs auront accès à cette fonctionnalité dans un premier temps.
Lire aussi :
- Google accusé de tromper les consommateurs pour collecter des données publicitaires
- Quelles sont les principales améliorations apportées par l’intégration de Gemini dans Google Assistant ?
Les défis de la génération d’images de personnes
En février dernier, Google avait mis en pause la capacité de Gemini à générer des images de personnes après que des utilisateurs eurent signalé des erreurs historiques dans les représentations. Par exemple, lorsqu’on demandait à Gemini de représenter une légion romaine, l’IA produisait une image anachronique d’une légion diversifiée racialement. De même, les guerriers Zoulous étaient souvent représentés de manière stéréotypée, ce qui a suscité des critiques. Face à ces problèmes, Sundar Pichai, PDG de Google, s’était excusé publiquement et avait promis une solution rapide. Cependant, il a fallu bien plus de temps que prévu pour que Google puisse résoudre ces problèmes, malgré les efforts intensifs de ses équipes.
Un accès limité pour les utilisateurs premium
La fonctionnalité de génération de personnes dans Gemini n’est pas encore disponible pour tous. Google a choisi de la rendre accessible uniquement à certains utilisateurs inscrits à ses plans payants Gemini Advanced, Business ou Enterprise. Ces utilisateurs bénéficieront d’un accès anticipé à la fonctionnalité dans le cadre d’un test limité, uniquement en anglais pour le moment. Google n’a pas précisé quand cette fonctionnalité serait étendue aux utilisateurs du plan gratuit ou à d’autres langues, préférant se concentrer sur la collecte de retours d’expérience auprès de ses abonnés premium.
Les améliorations apportées par Google
Pour surmonter les défis rencontrés, Google a introduit Imagen 3, le dernier modèle de génération d’images intégré à Gemini. Ce modèle a été formé avec des légendes générées par IA, visant à améliorer la diversité et la variété des concepts associés aux images dans ses données d’entraînement. Google affirme également avoir filtré ces données en tenant compte des questions de sécurité et d’équité. De plus, des tests rigoureux, tant internes qu’externes, ont été effectués pour réduire les réponses indésirables.
En parallèle de cette mise à jour, Google a lancé les Gems pour les utilisateurs premium de Gemini. Ces Gems sont des versions personnalisées de Gemini, capables d’agir en tant qu’experts sur des sujets spécifiques. Bien que ces innovations soient prometteuses, elles restent pour l’instant limitées à une audience restreinte.
Google Gemini : Tout ce que vous devez savoir sur la nouvelle plateforme d’IA générative
Avec la réintroduction de la fonctionnalité de génération de personnes dans Gemini, Google montre son engagement à améliorer ses produits IA en réponse aux retours des utilisateurs. Bien que l’accès à cette fonctionnalité soit encore limité, les améliorations apportées par le modèle Imagen 3 et l’introduction des Gems indiquent une volonté de fournir des outils plus précis et plus adaptés aux besoins des utilisateurs.