OpenAI a récemment lancé une nouvelle fonctionnalité baptisée “Flex processing”, une option API qui permet aux utilisateurs de bénéficier de tarifs plus bas pour l’utilisation de modèles d’IA en échange de réponses plus lentes et d’une disponibilité des ressources parfois limitée.
Cette initiative vise à rendre l’IA plus accessible tout en répondant à la concurrence croissante des entreprises telles que Google.
Lire aussi :
- En quoi OpenAI modifie-t-elle ses protocoles de sécurité face à l’émergence de modèles concurrents à haut risque ?
- Anthropic renforce son partenariat avec Amazon : un partenariat qui pourrait transformer l’écosystème de l’intelligence artificielle sur AWS
Qu’est-ce que le Flex processing ?
Le Flex processing est conçu pour les tâches d’IA à faible priorité et les charges de travail dites “non-production”, telles que les évaluations de modèles, l’enrichissement de données ou les tâches asynchrones. Ce mode de traitement est disponible en version bêta pour les modèles récents d’openai, o3 et o4-mini, qui sont principalement utilisés pour des tâches de raisonnement.
L’un des principaux attraits du Flex processing est sa capacité à réduire les coûts d’utilisation de l’API de manière significative. Par exemple, pour le modèle o3, Flex permet de réduire les coûts de moitié par rapport aux tarifs standards : 5 $ par million de tokens d’entrée et 20 $ par million de tokens de sortie, contre 10 $ et 40 $ pour les tarifs classiques. Le modèle o4-mini bénéficie également d’une réduction similaire, passant de 1,10 $ à 0,55 $ par million de tokens d’entrée, et de 4,40 $ à 2,20 $ pour les tokens de sortie.
Une réponse à la concurrence
L’initiative Flex processing survient dans un contexte où le coût des modèles d’IA de pointe ne cesse d’augmenter, tandis que des concurrents comme Google cherchent à offrir des modèles plus accessibles financièrement. En avril 2025, Google a lancé Gemini 2.5 Flash, un modèle de raisonnement qui rivalise ou surpasse les performances de DeepSeek R1 tout en offrant un coût d’entrée plus bas. Face à cette concurrence, OpenAI souhaite offrir une option plus économique pour les utilisateurs moins exigeants en termes de rapidité et de ressources.
L’impact sur l’accès et la sécurité
OpenAI a également introduit une nouvelle procédure de vérification d’identité pour les développeurs dans les niveaux 1 à 3 de sa hiérarchie de tarification, afin de garantir un accès sécurisé aux modèles comme o3. Cette mesure vise à limiter les comportements malveillants et à s’assurer que les utilisateurs respectent les politiques d’utilisation d’OpenAI.
En dépit des avantages du Flex processing, certains utilisateurs pourraient être réticents face aux limitations de temps de réponse et à l’incertitude concernant la disponibilité des ressources. Cependant, pour les tâches moins urgentes ou pour ceux qui ont besoin de tarifs plus abordables, cette option pourrait s’avérer être une solution idéale pour maximiser l’efficacité tout en réduisant les coûts.
Flex processing représente donc une réponse stratégique d’OpenAI face aux défis actuels du marché de l’IA, en offrant des tarifs plus accessibles tout en répondant aux besoins d’une grande variété de développeurs.