Stability AI, startup spécialisée dans l’intelligence artificielle, a récemment dévoilé sa dernière série de modèles de génération d’images, Stable Diffusion 3.5.
Après des controverses liées à des problèmes techniques et à des changements de licences, l’entreprise annonce des modèles plus polyvalents, personnalisables et performants, promettant des images plus diversifiées et de meilleure qualité.
Lire aussi :
- Comment DataCrunch compte-t-il se démarquer dans le secteur compétitif des hyperscalers AI en Europe tout en promouvant des pratiques durables ?
- Quels sont les risques potentiels des IA capables de tromper les utilisateurs et de contourner les systèmes de sécurité selon les chercheurs d’Anthropic ?
Une série de trois modèles innovants
La série Stable Diffusion 3.5 comprend trois modèles distincts :
- Stable Diffusion 3.5 Large : Ce modèle, le plus puissant de la série, contient 8 milliards de paramètres et génère des images d’une résolution pouvant atteindre 1 mégapixel. Les paramètres représentent la capacité d’un modèle à résoudre des problèmes ; ainsi, plus il y en a, plus le modèle est performant.
- Stable Diffusion 3.5 Large Turbo : Version allégée du modèle Large, ce modèle privilégie la rapidité de génération d’images au détriment d’une légère baisse de qualité.
- Stable Diffusion 3.5 Medium : Optimisé pour fonctionner sur des appareils comme les smartphones et ordinateurs portables, il est capable de générer des images avec une résolution allant de 0,25 à 2 mégapixels.
Bien que les modèles Large et Large Turbo soient déjà disponibles, le modèle Medium ne sera lancé que le 29 octobre.
Des images plus diversifiées sans effort
Stability AI promet une plus grande diversité dans les images générées avec cette nouvelle série de modèles. En effet, les nouveaux modèles devraient être capables de produire des images représentant des personnes aux traits et aux tons de peau variés, sans avoir besoin de formulations complexes dans les prompts. Selon Hanno Basse, directeur technique de Stability, le processus de formation des modèles inclut la création de plusieurs versions de prompts pour chaque image, permettant ainsi une distribution plus large des concepts d’image.
Cette approche s’inspire des erreurs passées d’autres entreprises, telles que Google, dont un chatbot avait généré des images historiques incohérentes. Stability espère éviter de tels problèmes en proposant une solution plus réfléchie, bien que des erreurs de génération liées aux prompts puissent encore survenir.
Libre utilisation avec des restrictions commerciales
Comme pour les versions précédentes, les modèles Stable Diffusion 3.5 sont disponibles gratuitement pour une utilisation non commerciale. Les entreprises générant moins de 1 million de dollars de revenus annuels peuvent les utiliser sans frais, tandis que celles dépassant ce seuil doivent obtenir une licence d’entreprise. Stability reste ferme sur le fait que les utilisateurs possèdent les droits sur les images qu’ils créent, tant qu’ils mentionnent l’utilisation des modèles et respectent les termes de la licence communautaire.
En conclusion, Stability AI, avec cette nouvelle série de modèles Stable Diffusion 3.5, semble vouloir offrir plus de diversité, de personnalisation, et de performance, tout en restant vigilante sur l’utilisation éthique de ses outils.