Alibaba vient de dรฉvoiler QwQ-32B-Preview, un nouveau modรจle d’intelligence artificielle conรงu pour rivaliser avec les modรจles de raisonnement d’OpenAI, notamment o1.
Ce modรจle, dรฉveloppรฉ par l’รฉquipe Qwen d’Alibaba, se distingue par ses 32,5 milliards de paramรจtres et sa capacitรฉ ร traiter des contextes allant jusqu’ร 32 000 mots.
Lire aussi :
- Quels sont les moments musicaux les plus mรฉmorables de votre annรฉe 2024 selon le rรฉcapitulatif de YouTube Music ?
- Comment la nouvelle fonctionnalitรฉ de partage de localisation dโInstagram amรฉliore-t-elle la coordination entre amis tout en garantissant la confidentialitรฉ ?
Un modรจle performant et ouvert
QwQ-32B-Preview surpasse les modรจles o1-preview et o1-mini d’OpenAI dans plusieurs benchmarks, tels que les tests AIME et MATH. Ces derniers รฉvaluent les capacitรฉs logiques et mathรฉmatiques des modรจles d’IA. Selon Alibaba, ce modรจle excelle dans la rรฉsolution de puzzles logiques et de problรจmes mathรฉmatiques complexes. Cependant, il prรฉsente des limites, comme des erreurs dans le raisonnement “de bon sens”, des boucles infinies ou des changements de langue imprรฉvus.
Distribuรฉ sous une licence Apache 2.0, QwQ-32B-Preview est accessible aux dรฉveloppeurs via la plateforme Hugging Face. Bien que partiellement ouvert, il offre une flexibilitรฉ pour les applications commerciales, tout en limitant les informations disponibles sur ses mรฉcanismes internes.
Une IA orientรฉe raisonnement
Ce modรจle de raisonnement intรจgre une capacitรฉ dโauto-vรฉrification, permettant de minimiser les erreurs habituelles des modรจles d’IA. Inspirรฉ des approches de planification, QwQ-32B-Preview analyse les tรขches de maniรจre sรฉquentielle pour en extraire des solutions prรฉcises. Cependant, cette mรฉthode nรฉcessite un temps de calcul plus รฉlevรฉ, un compromis entre prรฉcision et rapiditรฉ.
Cette approche illustre une tendance croissante dans le domaine de l’IA : lโadoption de techniques de calcul lors de lโinfรฉrence, comme le test-time compute. Cette stratรฉgie, utilisรฉe par OpenAI et dโautres grands laboratoires, consiste ร allouer davantage de ressources aux modรจles pendant leur utilisation, ce qui amรฉliore leur performance sur des tรขches complexes.
Une IA sous contraintes rรฉglementaires
En tant que modรจle dรฉveloppรฉ en Chine, QwQ-32B-Preview est soumis aux rรฉgulations locales. Il รฉvite les sujets politiques sensibles, comme les รฉvรฉnements de la place Tiananmen, et adopte des positions conformes aux valeurs prรดnรฉes par le gouvernement chinois. Par exemple, en rรฉponse ร des questions sur Taรฏwan, le modรจle rรฉaffirme la position officielle du pays.
L’avenir des modรจles de raisonnement
Le lancement de QwQ-32B-Preview intervient dans un contexte oรน les thรฉories de “scaling laws”, basรฉes sur lโidรฉe que lโaugmentation des donnรฉes et de la puissance de calcul amรฉliore continuellement les modรจles, sont remises en question. Les grands acteurs de l’IA, tels que Google, explorent de nouvelles approches pour repousser les limites actuelles, comme les modรจles de raisonnement et les architectures innovantes.
Avec QwQ-32B-Preview, Alibaba affirme sa position dans la compรฉtition mondiale de lโIA. Bien quโimparfait, ce modรจle marque une avancรฉe significative dans lโutilisation dโIA raisonnรฉe et pourrait inspirer de futures innovations dans ce domaine.