Comment Mistral Large 2 se compare-t-il réellement aux modèles d'IA de Meta et OpenAI en termes de performance et de coût ?

Mistral, une startup parisienne spécialisée dans l’intelligence artificielle, a dévoilé mercredi son dernier modèle phare, le Large 2.

Ce modèle, selon l’entreprise, rivalise avec les plus récents et performants modèles d’OpenAI et de Meta en matière de génération de code, de mathématiques et de raisonnement.

Une nouvelle référence pour les modèles ouverts

La sortie du modèle Large 2 de Mistral intervient juste un jour après le lancement par Meta de son modèle open source, Llama 3.1 405B. Mistral affirme que Large 2 établit de nouvelles normes en matière de performance et de coût pour les modèles ouverts, et appuie ces déclarations avec plusieurs benchmarks. Le Large 2 semble surpasser le Llama 3.1 405B en termes de génération de code et de performance mathématique, tout en utilisant moins d’un tiers des paramètres : 123 milliards, pour être précis.

L’un des principaux axes de formation du modèle Large 2 était de minimiser les problèmes de hallucinations du modèle. Mistral affirme que Large 2 a été formé pour être plus critique dans ses réponses, reconnaissant quand il ne sait pas quelque chose au lieu d’inventer une réponse plausible.

Comment les investissements massifs dans les startups d’IA générative en France influencent-ils le paysage technologique européen ?

Un soutien financier et une ambition internationale

La startup basée à Paris a récemment levé 640 millions de dollars lors d’un tour de financement de série B, dirigé par General Catalyst, atteignant une valorisation de 6 milliards de dollars. Bien que Mistral soit l’un des nouveaux entrants dans le domaine de l’intelligence artificielle, l’entreprise expédie rapidement des modèles d’IA à la pointe de la technologie.

Cependant, il est important de noter que les modèles de Mistral, comme la plupart des autres, ne sont pas open source au sens traditionnel du terme. Toute application commerciale du modèle nécessite une licence payante. Et bien que ce modèle soit plus ouvert que, par exemple, le GPT-4o, peu de personnes dans le monde possèdent l’expertise et l’infrastructure nécessaires pour mettre en œuvre un modèle aussi grand.

Performances et disponibilité

Le modèle Large 2 ne possède pas de capacités multimodales, une fonctionnalité dans laquelle OpenAI est actuellement très en avance sur la concurrence. Le modèle dispose d’une fenêtre de 128 000 tokens, ce qui signifie que Large 2 peut traiter une grande quantité de données en une seule requête (128 000 tokens équivalent à environ un livre de 300 pages). Le nouveau modèle de Mistral inclut également un support multilingue amélioré, comprenant l’anglais, le français, l’allemand, l’espagnol, l’italien, le portugais, l’arabe, l’hindi, le russe, le chinois, le japonais et le coréen, ainsi que 80 langages de programmation.

Quand est-ce que Meta prévoit de lancer Llama 3, son modèle de langage machine (LLM) open source, pour révolutionner l’IA générative ?

Notamment, Mistral affirme que Large 2 produit des réponses plus concises que les modèles d’IA leaders, qui ont tendance à s’étendre en longueur. Le modèle Large 2 de Mistral est disponible sur Google Vertex AI, Amazon Bedrock, Azure AI Studio et IBM watsonx.ai. Vous pouvez également utiliser le nouveau modèle sur la plateforme de Mistral sous le nom mistral-large-2407 et l’essayer gratuitement sur le concurrent de ChatGPT de la startup, le Chat.

Comment Mistral Large 2 se compare-t-il réellement aux modèles d’IA de Meta et OpenAI en termes de performance et de coût ?

Une nouvelle référence pour les modèles ouverts

Un soutien financier et une ambition internationale

Performances et disponibilité

Partager cet article

Actualités

GTA 6 Online pourrait arriver bien plus tôt que prévu : une fuite dévoile une fenêtre de sortie proche du lancement

GTA 6 : des détails sur une mission potentielle ont fuité et révèlent de nouvelles informations sur le jeu

Monopoly go : jalons de récompenses du tournoi « Tycoon Class », conseils et informations avant sa sortie

GTA 6 : un ancien développeur brise l’illusion et alerte sur des trailers “trop parfaits” qui pourraient tromper les joueurs

GTA 5 : une découverte inattendue révèle un personnage issu d’un jeu Rockstar oublié

LAISSER UN COMMENTAIRE Annuler la réponse