La célèbre plateforme de génération d’images par intelligence artificielle Midjourney vient de dévoiler V7, sa première mise à jour majeure en près d’un an.
Ce nouveau modèle, actuellement en phase alpha, promet une qualité visuelle renforcée, une meilleure compréhension des instructions textuelles et des rendus encore plus cohérents, notamment pour les éléments complexes comme les mains, les corps ou les textures.
Lire aussi :
- https://www.2051.fr/actualite/claude-debarque-a-luniversite-anthropic-lance-un-plan-dabonnement-pour-lenseignement-superieur/
- https://www.2051.fr/actualite/contenus-voles-scandale-ai-openai-accusee-davoir-exploite-des-livres-oreilly-pour-entrainer-gpt-4o-sans-autorisation/
Une architecture totalement repensée
Selon David Holz, fondateur de Midjourney, V7 repose sur une “architecture totalement différente” des versions précédentes. Cette évolution technique permet au modèle de mieux interpréter les instructions textuelles, mais également de produire des images avec un niveau de détail plus abouti. Bois, peaux, tissus, ombres… V7 semble mieux maîtriser l’esthétique et la cohérence des rendus visuels, selon les premières expérimentations des utilisateurs.
Pour utiliser V7, les utilisateurs doivent d’abord générer un profil de personnalisation en notant environ 200 images. Cette nouveauté, propre à V7, permet à l’IA d’ajuster ses rendus selon les préférences visuelles de chaque utilisateur. Le modèle est ensuite activable via la plateforme web ou le serveur Discord de Midjourney.
Un mode Draft plus rapide et économique
Midjourney V7 est proposé en deux versions : Turbo (plus coûteux mais plus rapide) et Relax (moins exigeant en ressources). L’un des ajouts les plus remarqués est le Draft Mode, qui permet de générer des images dix fois plus rapidement et à moitié prix par rapport au mode standard. Bien que ces ébauches soient de qualité légèrement inférieure, elles peuvent être affinées et améliorées en un clic.
À ce stade, certaines fonctionnalités historiques de Midjourney comme le redimensionnement ou le retexturage ne sont pas encore compatibles avec V7, mais devraient être ajoutées dans les deux mois à venir.
Une entreprise atypique en pleine croissance
Fondée en 2022 par David Holz, également à l’origine de Leap Motion, Midjourney reste un acteur unique dans l’univers de l’IA générative : elle n’a jamais levé de fonds extérieurs. En 2023, l’entreprise aurait approché les 200 millions de dollars de revenus. Elle a récemment annoncé le développement d’une équipe dédiée au hardware, sans toutefois détailler les projets en cours.
Midjourney continue également de travailler sur des modèles pour la génération de vidéos et d’objets 3D, consolidant sa position dans le secteur de la création par IA.
Malgré son succès, Midjourney fait face à plusieurs poursuites judiciaires, accusée d’avoir entraîné ses modèles sur des images protégées par droits d’auteur sans consentement. La question de l’usage des œuvres d’art en ligne reste centrale dans le débat autour de l’IA générative, mais cela ne semble pas freiner l’élan de la plateforme, dont le modèle V7 est déjà salué pour ses capacités créatives exceptionnelles.