Alibaba vient de dévoiler QwQ-32B-Preview, un nouveau modèle d’intelligence artificielle conçu pour rivaliser avec les modèles de raisonnement d’OpenAI, notamment o1.
Ce modèle, développé par l’équipe Qwen d’Alibaba, se distingue par ses 32,5 milliards de paramètres et sa capacité à traiter des contextes allant jusqu’à 32 000 mots.
Lire aussi :
- Quels sont les moments musicaux les plus mémorables de votre année 2024 selon le récapitulatif de YouTube Music ?
- Comment la nouvelle fonctionnalité de partage de localisation d’Instagram améliore-t-elle la coordination entre amis tout en garantissant la confidentialité ?
Un modèle performant et ouvert
QwQ-32B-Preview surpasse les modèles o1-preview et o1-mini d’OpenAI dans plusieurs benchmarks, tels que les tests AIME et MATH. Ces derniers évaluent les capacités logiques et mathématiques des modèles d’IA. Selon Alibaba, ce modèle excelle dans la résolution de puzzles logiques et de problèmes mathématiques complexes. Cependant, il présente des limites, comme des erreurs dans le raisonnement “de bon sens”, des boucles infinies ou des changements de langue imprévus.
Distribué sous une licence Apache 2.0, QwQ-32B-Preview est accessible aux développeurs via la plateforme Hugging Face. Bien que partiellement ouvert, il offre une flexibilité pour les applications commerciales, tout en limitant les informations disponibles sur ses mécanismes internes.
Une IA orientée raisonnement
Ce modèle de raisonnement intègre une capacité d’auto-vérification, permettant de minimiser les erreurs habituelles des modèles d’IA. Inspiré des approches de planification, QwQ-32B-Preview analyse les tâches de manière séquentielle pour en extraire des solutions précises. Cependant, cette méthode nécessite un temps de calcul plus élevé, un compromis entre précision et rapidité.
Cette approche illustre une tendance croissante dans le domaine de l’IA : l’adoption de techniques de calcul lors de l’inférence, comme le test-time compute. Cette stratégie, utilisée par OpenAI et d’autres grands laboratoires, consiste à allouer davantage de ressources aux modèles pendant leur utilisation, ce qui améliore leur performance sur des tâches complexes.
Une IA sous contraintes réglementaires
En tant que modèle développé en Chine, QwQ-32B-Preview est soumis aux régulations locales. Il évite les sujets politiques sensibles, comme les événements de la place Tiananmen, et adopte des positions conformes aux valeurs prônées par le gouvernement chinois. Par exemple, en réponse à des questions sur Taïwan, le modèle réaffirme la position officielle du pays.
L’avenir des modèles de raisonnement
Le lancement de QwQ-32B-Preview intervient dans un contexte où les théories de “scaling laws”, basées sur l’idée que l’augmentation des données et de la puissance de calcul améliore continuellement les modèles, sont remises en question. Les grands acteurs de l’IA, tels que Google, explorent de nouvelles approches pour repousser les limites actuelles, comme les modèles de raisonnement et les architectures innovantes.
Avec QwQ-32B-Preview, Alibaba affirme sa position dans la compétition mondiale de l’IA. Bien qu’imparfait, ce modèle marque une avancée significative dans l’utilisation d’IA raisonnée et pourrait inspirer de futures innovations dans ce domaine.