En quelques mois à peine, DeepSeek est devenu l’un des noms les plus commentés dans le monde de l’intelligence artificielle.
Son application de chatbot a grimpé en tête des classements de l’App Store et de Google Play, alimentant à la fois l’enthousiasme des développeurs et les inquiétudes géopolitiques. Derrière ce succès se cache une stratégie originale, alliant innovations techniques, coûts ultra-compétitifs et positionnement audacieux face aux géants américains de l’IA.
Lire aussi :
- L’IA de Maximor peut-elle vraiment mettre fin à la dépendance d’Excel en comptabilité ?
- Comment Paid veut-elle révolutionner la facturation des agents IA avec un modèle basé sur les résultats ?
Des origines financières à l’essor mondial
DeepSeek est né en 2023 d’une initiative du fonds spéculatif chinois High-Flyer Capital Management, fondé par Liang Wenfeng, passionné de trading et d’IA. Initialement créé pour optimiser les stratégies financières, le laboratoire d’IA s’est rapidement émancipé pour devenir une société indépendante. Dès ses débuts, DeepSeek a investi dans ses propres centres de données, tout en subissant les contraintes liées aux restrictions américaines sur les exportations de puces.
Pour contourner ces limites, la société a dû entraîner certains modèles avec des puces Nvidia H800, moins puissantes que les H100 utilisées aux États-Unis. Malgré ces obstacles, l’équipe — jeune et composée de chercheurs issus des meilleures universités chinoises — a réussi à produire des modèles compétitifs, capables de rivaliser avec ceux d’OpenAI ou de Meta.
Des modèles puissants et accessibles
Le tournant s’est produit avec le lancement de DeepSeek-V2, puis de DeepSeek-V3 fin 2024. Ces modèles ont impressionné par leurs performances sur les benchmarks tout en étant beaucoup moins coûteux à utiliser que leurs équivalents américains. Leur arrivée a même poussé des acteurs chinois comme ByteDance et Alibaba à revoir à la baisse leurs propres tarifs.
Parallèlement, le modèle R1, spécialisé dans le raisonnement, a retenu l’attention. Contrairement aux modèles classiques qui répondent rapidement mais peuvent commettre des erreurs, R1 prend plus de temps pour analyser et vérifier ses réponses. Cette approche plus lente mais plus fiable séduit particulièrement dans les domaines scientifiques et techniques. Cependant, comme tout produit d’IA développé en Chine, DeepSeek reste soumis à la réglementation locale, ce qui limite les sujets sur lesquels le chatbot peut s’exprimer librement.
Une stratégie disruptive mais controversée
L’un des aspects les plus surprenants de DeepSeek est son modèle économique flou. L’entreprise propose une grande partie de ses services à des prix très bas, voire gratuitement, ce qui a contribué à son adoption massive par les développeurs. Sur Hugging Face, plus de 500 modèles dérivés de R1 ont déjà été créés, cumulant plusieurs millions de téléchargements.
Mais ce succès n’est pas sans conséquences. Les percées de DeepSeek ont contribué à la chute du cours de l’action Nvidia en janvier et ont suscité la réaction d’OpenAI, qui a accusé la société d’être « subventionnée et contrôlée par l’État ». Certains pays, dont la Corée du Sud et certains États américains, ont d’ailleurs interdit son usage sur les appareils gouvernementaux, invoquant des risques liés à la sécurité des données et à la propagande.