DeepMind, le laboratoire de recherche en IA de Google, a récemment dévoilé son dernier système, AlphaEvolve, conçu pour résoudre des problèmes complexes dans les domaines des mathématiques et des sciences, en particulier ceux qui ont des solutions « machine-gradiables ».
Ce système innovant pourrait également contribuer à optimiser l’infrastructure de Google pour entraîner ses modèles d’IA.
Lire aussi :
- AllTrails dévoile son abonnement Peak avec des fonctionnalités IA : itinéraires intelligents, prévisions en temps réel et identification de la flore
- Quelles annonces majeures Microsoft prévoit-il pour Build 2025 entre Copilot, Azure et nouveaux modèles d’intelligence artificielle ?
AlphaEvolve : une avancée dans la réduction des hallucinations de l’IA
Une des difficultés majeures avec les modèles d’IA actuels est leur tendance à « halluciner », c’est-à-dire à générer des informations incorrectes avec une grande confiance, en raison de leur architecture probabilistique. AlphaEvolve tente de résoudre ce problème en intégrant un système d’évaluation automatique. Ce mécanisme permet au système de générer des réponses, puis de les évaluer et de les noter en fonction de leur exactitude. Cela réduit ainsi les erreurs et augmente la fiabilité des solutions proposées.
DeepMind affirme que cette approche rend AlphaEvolve bien plus performant que les systèmes précédents, en particulier dans les domaines mathématiques où des erreurs de calcul peuvent avoir un impact considérable. Ce système utilise les modèles Gemini, réputés pour leurs capacités avancées, ce qui le rend nettement plus puissant que les modèles d’IA qui l’ont précédé.
AlphaEvolve : une solution spécialisée dans les problèmes numériques et algorithmiques
Le fonctionnement d’AlphaEvolve est assez simple : les utilisateurs introduisent un problème, en ajoutant des détails comme des instructions, des équations, des extraits de code, ou de la documentation pertinente. Le système génère alors des réponses possibles et les évalue automatiquement. Toutefois, cette capacité d’auto-évaluation implique une limitation importante : AlphaEvolve ne peut résoudre que des problèmes qu’il peut évaluer lui-même, ce qui le restreint aux domaines des sciences informatiques et de l’optimisation des systèmes.
De plus, AlphaEvolve ne fournit des solutions qu’en termes d’algorithmes, ce qui le rend moins adapté pour les problèmes non numériques ou les domaines moins orientés vers les calculs.
Des résultats impressionnants sur des problèmes pratiques
DeepMind a testé AlphaEvolve sur une série de 50 problèmes de mathématiques allant de la géométrie à la combinatoire. Les résultats sont impressionnants : AlphaEvolve a « redécouvert » les meilleures solutions pour ces problèmes dans 75% des cas et a trouvé des améliorations dans 20% des cas.
En plus des tests théoriques, AlphaEvolve a été évalué sur des problèmes pratiques, comme l’optimisation de l’efficacité des centres de données de Google et l’accélération des processus de formation des modèles. Dans ces cas, le système a proposé un algorithme permettant de récupérer 0,7% des ressources informatiques mondiales de Google et d’optimiser les temps de formation des modèles Gemini de 1%.
Bien que ces découvertes ne soient pas des percées révolutionnaires, elles montrent qu’AlphaEvolve peut contribuer de manière significative à l’optimisation des processus de Google.