L’intelligence artificielle (IA) est là pour rester, depuis plus d’une décennie, elle a changé les industries à un rythme très accéléré et malgré que beaucoup de gens, même dans le domaine technologique, soient toujours sceptiques à ce sujet et certains n’aiment tout simplement pas ça, il n’y a pas il y a longtemps et il est maintenant temps de le maîtriser et d’exploiter l’IA / ML avec le même niveau de maturité que l’industrie a pour le développement logiciel, l’automatiser et l’intégrer à tous les éco-systèmes informatiques – c’est le tour de MLOps
MLOps (Machine Learning Operations) a attiré l’attention sur le célèbre article de Google de 2015, où ils ont brossé un tableau généralement bien connu des professionnels travaillant sur des activités d’apprentissage automatique (ML), mais qui effraie ceux qui entrent dans la région.
Comme vous pouvez le voir ci-dessus, les activités de création et de formation de modèles de ML sont très petites si on les compare aux autres activités environnantes nécessaires pour préparer ces modèles à être utilisés en production et pour évoluer de manière durable et réagir aux changements sur le contexte commercial et sur le scénarios macro qui ont un impact sur le comportement des gens (voir COVID-19).
Le concept de MLOps est une adaptation du DevOps pour inclure des nuances et des étapes d’apprentissage automatique. Il utilise des pipelines d’intégration continue (CI) et de livraison continue (CD) similaires et introduit un tout nouveau concept, la formation continue (CT).
Les logiciels ML sont plus complexes que le codage traditionnel, c’est pourquoi les pipelines CI / CD diffèrent des DevOps traditionnels en ayant d’autres éléments à prendre en compte.
Dans MLOps, CI est plus que tester et valider le code et les composants, comment ils fonctionnent ensemble et les performances en termes de vitesse, il doit inclure la validation du profil de données, la précision du modèle, ses performances par rapport aux problèmes commerciaux qu’il tente de résoudre. résoudre.
De la même manière, le CD ne concerne pas seulement l’empaquetage et le déploiement du package pour un service / microservice, il s’agit en fait de comprendre quel modèle entraîné a le plus de sens à déployer, en fonction du concept ou de la dérive des données, et d’exécuter le pipeline pour déployer automatiquement le meilleur service de prédiction du modèle.
CT est nouveau, et il s’agit d’avoir la capacité de former continuellement des modèles, d’ajuster des hyperparamètres, d’orchestrer l’expérimentation et de stocker des métadonnées qui peuvent fournir des informations aux scientifiques des données sur d’éventuels modèles améliorés, ou même déclencher automatiquement de nouveaux pipelines de CD pour déployer les plus récents. des modèles.
Ci-dessous, vous pouvez voir ces étapes en orange, ainsi que les étapes d’ingénierie des données et DevOps pour un cycle de vie complet du machine learning.
En 2021, la plupart des plates-formes cloud sont encore sur les versions initiales de leurs offres MLOps, mais en discutant avec les équipes produit des grands acteurs et en fonction de ce qu’elles ont présenté lors des événements de 2020, c’est un domaine très chaud, avec de gros investissements sur à la fois sur les services gérés et sur les produits open source pour prendre en charge les MLOps, ce qui signifie que cela va évoluer et mûrir radicalement au cours des deux prochaines années, permettant aux entreprises d’intégrer l’IA dans tous les aspects de l’entreprise, augmentant et étendant la capacité humaine à des niveaux inimaginables à grande échelle .