Après des débuts prometteurs, mais décevants, Rabbit s’apprête à déployer une mise à jour majeure pour son modèle d’agent d’action web.
Jesse Lyu, le PDG de Rabbit, a admis que les attentes initiales étaient trop élevées, mais avec l’arrivée du « Large Action Model » (LAM) générique le 1er octobre, la société espère offrir une véritable révolution dans la manière d’interagir avec les sites web.
Lire aussi :
- Comment Letta pourrait-elle transformer le marché de l’intelligence artificielle avec sa solution de mémoire IA, MemGPT ?
- Quelles sont les principales nouveautés apportées par la mise à jour de Google TV avant l’arrivée de son nouveau boîtier de streaming ?
Une promesse ambitieuse : un agent web universel
Le modèle LAM que Rabbit s’apprête à lancer est conçu pour accomplir des tâches complexes sur le web, sans être limité à une application ou un service spécifique. Lyu a montré une démonstration du modèle, capable de réaliser des actions comme acheter des billets de concert ou enregistrer un nom de domaine, tout cela en interagissant directement avec les éléments visuels d’un site web. L’agent fonctionne en « analysant » les boutons, champs et images affichés à l’écran, puis en exécutant les actions nécessaires.
L’objectif est d’offrir aux utilisateurs du r1 la possibilité d’effectuer presque toutes les tâches possibles sur n’importe quel site web. Cependant, Lyu a précisé que cette version est encore une étape préliminaire, bien qu’elle représente une avancée majeure dans l’automatisation des tâches web pour les consommateurs.
Un processus encore perfectible
Malgré cette avancée, l’utilisation du LAM nécessite encore des ajustements de « prompt engineering », c’est-à-dire que la manière dont une tâche est formulée influence grandement le succès ou l’échec de l’opération. Par exemple, lors de la démonstration, la demande de rechercher un r1 a conduit l’agent à trouver des offres sur eBay, ce qui n’était pas le résultat escompté. Ce type d’ajustement est encore nécessaire pour affiner l’utilisation de l’agent et le rendre plus fluide pour le grand public.
Lyu a également souligné que l’agent ne collecte pas les données des utilisateurs pour améliorer son modèle, car il n’existe pas encore de méthode d’évaluation claire pour mesurer les progrès de ce type de système. Néanmoins, une fonctionnalité de « mode d’apprentissage » est en développement, permettant aux utilisateurs de montrer à l’agent comment effectuer des tâches spécifiques.
Des défis à venir
Bien que la mise à jour promette d’élargir considérablement les capacités du r1, le modèle d’agent générique soulève encore des questions quant à son utilité pratique pour les utilisateurs quotidiens. Si l’idée d’un agent universel qui peut tout accomplir sur le web est séduisante, il reste à voir si cette technologie trouvera son « killer app » qui la rendra indispensable pour le grand public.
1 an d’assistance IA avancée offerte avec Rabbit R1, l’IA qui met Google et ChaGPT par terre
Rabbit continue d’explorer la possibilité de rendre cet agent accessible à d’autres plateformes, y compris les ordinateurs et les téléphones, avec l’ambition de créer un système capable de contrôler chaque interface utilisateur.