La concurrence s’intensifie dans le domaine des modèles d’intelligence artificielle spécialisés dans le développement logiciel.
Ce lundi, Anthropic a présenté Claude Sonnet 4.5, une nouvelle génération de modèle qu’elle qualifie de véritable avancée pour la programmation. Contrairement aux versions précédentes, souvent limitées à des prototypes, ce modèle serait capable de créer des applications prêtes pour la production, marquant un bond en fiabilité et en autonomie.
Lire aussi :
- L’IA de Maximor peut-elle vraiment mettre fin à la dépendance d’Excel en comptabilité ?
- Comment Paid veut-elle révolutionner la facturation des agents IA avec un modèle basé sur les résultats ?
Des performances de pointe sur les benchmarks de code
Selon Anthropic, Claude Sonnet 4.5 affiche des résultats de niveau industriel sur plusieurs benchmarks, dont SWE-Bench Verified, une référence dans l’évaluation des compétences de codage. Mais pour les chercheurs de l’entreprise, ces scores ne suffisent pas à refléter le véritable potentiel du modèle.
David Hershey, chercheur chez Anthropic, explique que lors des premiers essais avec des clients entreprises, Claude Sonnet 4.5 a pu coder de manière autonome pendant plus de 30 heures consécutives. Durant cette période, l’IA a non seulement conçu une application complète, mais a aussi mis en place des services de base de données, acheté des noms de domaine et même effectué un audit de sécurité SOC 2. Des tâches normalement réservées à des équipes entières de développeurs.
Des témoignages extérieurs confirment cette avancée. Michael Truell, PDG de Cursor, affirme que ce modèle représente l’état de l’art pour les tâches complexes et de longue durée. De son côté, Jeff Wang, fondateur de Windsurf, parle d’une « nouvelle génération de modèles de codage ».
Microsoft diversifie ses partenariats IA en intégrant Anthropic dans Office 365
Une IA plus alignée et plus robuste
Au-delà de ses compétences en développement, Claude Sonnet 4.5 se veut aussi plus fiable sur le plan éthique et sécuritaire. Anthropic affirme avoir réduit les problèmes de complaisance excessive (sycophancy) et de déception observés dans certaines versions antérieures. Le modèle aurait également gagné en résistance face aux attaques par injection de prompts, une faille qui consistait à détourner l’IA de son comportement prévu.
Cette combinaison de puissance technique et de garde-fous éthiques pourrait consolider la position de Claude face à une concurrence toujours plus pressante. En effet, OpenAI avec GPT-5 est récemment venu défier la suprématie d’Anthropic sur les benchmarks de programmation, obligeant l’entreprise à accélérer son rythme d’innovation.
De nouveaux outils pour les développeurs
En parallèle du lancement du modèle, Anthropic met à disposition le Claude Agent SDK, un kit permettant aux développeurs de créer leurs propres agents en utilisant la même infrastructure que celle derrière Claude Code. L’entreprise propose aussi un aperçu expérimental baptisé « Imagine with Claude », réservé aux abonnés Max, où l’IA génère du code en temps réel sans fonctionnalité prédéfinie.
Anthropic lève 13 milliards de dollars et franchit une étape clé dans le domaine de l’IA
Avec ce lancement, moins de deux mois après celui de Claude Opus 4.1, Anthropic démontre sa volonté de maintenir une cadence rapide dans un secteur où l’avance technologique est souvent de courte durée.