Mistral, une startup parisienne spécialisée dans l’intelligence artificielle, a dévoilé mercredi son dernier modèle phare, le Large 2.
Ce modèle, selon l’entreprise, rivalise avec les plus récents et performants modèles d’OpenAI et de Meta en matière de génération de code, de mathématiques et de raisonnement.
Lire aussi :
- Mistral AI : voici la fortune que peuvent toucher les fondateurs français en cas de vente
- Google accusé de tromper les consommateurs pour collecter des données publicitaires
Une nouvelle référence pour les modèles ouverts
La sortie du modèle Large 2 de Mistral intervient juste un jour après le lancement par Meta de son modèle open source, Llama 3.1 405B. Mistral affirme que Large 2 établit de nouvelles normes en matière de performance et de coût pour les modèles ouverts, et appuie ces déclarations avec plusieurs benchmarks. Le Large 2 semble surpasser le Llama 3.1 405B en termes de génération de code et de performance mathématique, tout en utilisant moins d’un tiers des paramètres : 123 milliards, pour être précis.
L’un des principaux axes de formation du modèle Large 2 était de minimiser les problèmes de hallucinations du modèle. Mistral affirme que Large 2 a été formé pour être plus critique dans ses réponses, reconnaissant quand il ne sait pas quelque chose au lieu d’inventer une réponse plausible.
Un soutien financier et une ambition internationale
La startup basée à Paris a récemment levé 640 millions de dollars lors d’un tour de financement de série B, dirigé par General Catalyst, atteignant une valorisation de 6 milliards de dollars. Bien que Mistral soit l’un des nouveaux entrants dans le domaine de l’intelligence artificielle, l’entreprise expédie rapidement des modèles d’IA à la pointe de la technologie.
Cependant, il est important de noter que les modèles de Mistral, comme la plupart des autres, ne sont pas open source au sens traditionnel du terme. Toute application commerciale du modèle nécessite une licence payante. Et bien que ce modèle soit plus ouvert que, par exemple, le GPT-4o, peu de personnes dans le monde possèdent l’expertise et l’infrastructure nécessaires pour mettre en œuvre un modèle aussi grand.
Performances et disponibilité
Le modèle Large 2 ne possède pas de capacités multimodales, une fonctionnalité dans laquelle OpenAI est actuellement très en avance sur la concurrence. Le modèle dispose d’une fenêtre de 128 000 tokens, ce qui signifie que Large 2 peut traiter une grande quantité de données en une seule requête (128 000 tokens équivalent à environ un livre de 300 pages). Le nouveau modèle de Mistral inclut également un support multilingue amélioré, comprenant l’anglais, le français, l’allemand, l’espagnol, l’italien, le portugais, l’arabe, l’hindi, le russe, le chinois, le japonais et le coréen, ainsi que 80 langages de programmation.
Notamment, Mistral affirme que Large 2 produit des réponses plus concises que les modèles d’IA leaders, qui ont tendance à s’étendre en longueur. Le modèle Large 2 de Mistral est disponible sur Google Vertex AI, Amazon Bedrock, Azure AI Studio et IBM watsonx.ai. Vous pouvez également utiliser le nouveau modèle sur la plateforme de Mistral sous le nom mistral-large-2407 et l’essayer gratuitement sur le concurrent de ChatGPT de la startup, le Chat.