OpenAI a récemment lancé un nouveau modèle d’IA, le ChatGPT Agent, conçu pour effectuer une variété de tâches informatiques pour ses utilisateurs.
Ce modèle va au-delà des simples réponses aux questions, en permettant une interaction active avec des applications tierces et en prenant en charge des actions complexes comme la gestion de calendrier, la création de présentations et même l’exécution de code.
Lire aussi :
- Google Discover introduit des résumés IA : un coup dur pour les éditeurs de contenu et le trafic web
- Pourquoi les outils de codage alimentés par l’IA abandonnent les éditeurs classiques pour revenir au terminal, un espace oublié mais puissant
Un agent polyvalent pour automatiser les tâches
Le ChatGPT Agent représente la dernière évolution de l’IA générative de OpenAI. Ce modèle permet aux utilisateurs d’interagir avec l’IA en langage naturel pour qu’elle accomplisse des tâches de manière autonome. Par exemple, l’agent peut planifier un repas, analyser des concurrents, ou encore générer des diaporamas sans intervention manuelle.
OpenAI combine plusieurs des capacités des outils précédents, comme la possibilité de naviguer sur des sites web via Operator et d’effectuer des recherches de manière approfondie grâce à Deep Research. Ce mélange permet à l’agent de mener des actions plus complexes, telles que la planification d’activités ou la gestion de projets.
Performances impressionnantes et résultats sur les benchmarks
Le ChatGPT Agent a également montré des résultats impressionnants sur plusieurs benchmarks. Par exemple, il a obtenu 41,6% sur le test Humanity’s Last Exam, un défi constitué de milliers de questions couvrant plus de cent sujets. Cela représente environ le double des performances des modèles précédents comme o3 et o4-mini.
Lors de tests sur le FrontierMath, un benchmark de mathématiques difficile, l’agent a obtenu 27,4% en utilisant des outils comme un terminal pour l’exécution de code, ce qui est bien supérieur au 6,3% des précédents modèles.
Ces résultats montrent que le ChatGPT Agent est bien plus performant que les précédents outils d’OpenAI, bien qu’il reste à voir comment il se comportera dans des situations réelles.
Sécurité et précautions face aux nouveaux risques
Avec ses nouvelles capacités, le ChatGPT Agent présente des risques de sécurité importants. OpenAI a pris des mesures de précaution pour limiter ces dangers potentiels. Par exemple, l’agent a été désactivé de la fonction de mémoire de ChatGPT pour éviter des attaques de vol de données ou des injections de requêtes malveillantes.
De plus, OpenAI a ajouté des moniteurs en temps réel pour détecter des requêtes liées à des menaces biologiques ou chimiques, garantissant que l’agent ne fournisse pas de contenu pouvant être utilisé de manière nuisible. Bien que ces précautions aient été mises en place, OpenAI a souligné que des risques subsistent avec les agents IA, notamment dans les domaines de la biologie et des armes chimiques.