Flux, un nouveau générateur d'images IA open-source développé par Black Forest Labs, défie le leader du marché Midjourney avec des performances impressionnantes en termes de réalisme, de compréhension des prompts et de rapidité. Selon des rapports récents, cette comparaison soulève des questions sur l'avenir de la génération d'images par IA et les avantages respectifs de chaque plateforme.
Midjourney est un générateur d'images par intelligence artificielle développé par Midjourney, Inc., une entreprise indépendante basée à San Francisco1. Lancé en 2022, Midjourney se distingue par sa capacité à produire des images de haute qualité à partir de descriptions textuelles, couvrant un large éventail de styles artistiques2.
Accessible principalement via Discord, avec une interface web en développement
Utilise un modèle d'IA propriétaire, régulièrement mis à jour pour améliorer la qualité et les fonctionnalités
Propose différents plans d'abonnement, avec un nombre limité de générations gratuites pour les nouveaux utilisateurs3
Particulièrement apprécié pour son rendu artistique et sa capacité à interpréter des concepts abstraits
Midjourney a rapidement gagné en popularité auprès des artistes, designers et créatifs pour sa facilité d'utilisation et la qualité impressionnante de ses générations, devenant ainsi l'un des acteurs majeurs du marché de la génération d'images par IA13.
Flux est une suite innovante de modèles de génération d'images développée par Black Forest Labs, une entreprise fondée par les créateurs de Stable Diffusion1. Cette technologie d'IA se décline en trois versions principales :
FLUX.1 [pro] : La version la plus performante, réservée aux clients professionnels via API1.
FLUX.1 [dev] : Une version open-source destinée aux développeurs et chercheurs pour l'expérimentation et la personnalisation1.
FLUX.1 [schnell] : Une version gratuite et open-source, idéale pour les projets personnels et les prototypes1.
Flux se distingue par sa capacité à produire rapidement des images de haute qualité, que ce soit pour le photoréalisme ou l'illustration graphique1. Son architecture repose sur un modèle de transformateur de flux rectifié de 12 milliards de paramètres, considéré comme le plus grand modèle texte-en-image open-source à ce jour2.
Des tests comparatifs récents entre Flux et Midjourney ont révélé des forces et des faiblesses distinctes pour chaque générateur d'images IA12.
Midjourney s'est démarqué dans la génération de visages et de textures de peau réalistes, particulièrement pour les personnages plus âgés1. Ses images présentaient généralement une meilleure qualité de texture et un réalisme accru dans la représentation des traits humains2. Par exemple, dans la génération d'une cheffe cuisinière d'âge mûr, Midjourney a produit une image plus convaincante en termes de détails du visage et de texture de la peau1.
Cependant, Flux a démontré des capacités impressionnantes dans certains domaines. Les images générées par Flux présentaient souvent une meilleure structure globale et des arrière-plans plus détaillés et cohérents2. Dans le cas d'une scène représentant un astronaute retraité donnant une présentation, Flux a produit une image avec une meilleure composition générale et des détails d'arrière-plan plus riches1.
Les deux modèles ont montré des forces différentes selon les types de scènes. Midjourney excellait dans les portraits et les scènes centrées sur les personnages, tandis que Flux se distinguait dans les scènes plus complexes avec de multiples éléments12.
Un domaine où Flux a particulièrement brillé est la génération de texte dans les images. Contrairement à Midjourney, qui produit souvent du texte illisible ou incohérent, Flux a démontré une capacité supérieure à générer du texte lisible et pertinent dans les images13.
Les deux modèles ont rencontré des difficultés similaires dans certains scénarios, comme la génération d'images dans des conditions d'éclairage faible ou complexe. Par exemple, une scène représentant un ambulancier dans un environnement pluvieux et sombre a posé des défis aux deux générateurs, produisant des résultats moins convaincants1.
En résumé, bien que Midjourney conserve un avantage global en termes de réalisme des visages et des textures, Flux se révèle être un concurrent sérieux, offrant des forces complémentaires en termes de composition, de détails d'arrière-plan et de génération de texte123.
Flux se distingue de Midjourney par sa nature open source, offrant aux développeurs et chercheurs une flexibilité et une personnalisation accrues1. La version FLUX.1 [dev] est particulièrement intéressante pour ceux qui souhaitent expérimenter et adapter le modèle à leurs besoins spécifiques2.
L'approche open source de Flux permet aux utilisateurs de :
Exécuter le modèle localement : Contrairement à Midjourney qui nécessite une connexion internet constante, Flux peut fonctionner sur des ordinateurs portables performants, élargissant ainsi son accessibilité3.
Personnaliser le modèle : Les développeurs peuvent ajuster les paramètres, affiner le modèle sur des ensembles de données spécifiques, ou même créer des versions spécialisées pour des cas d'utilisation particuliers3.
Créer des adaptations à faible rang (LoRA) : Ces adaptations permettent d'optimiser Flux pour des styles ou des sujets spécifiques, comme l'a démontré Matt Wolfe en créant une LoRA personnalisée avec ses propres photos3.
Intégrer Flux dans des applications personnalisées : Les développeurs peuvent incorporer Flux dans leurs propres projets, offrant ainsi des possibilités d'innovation dans divers domaines4.
La communauté autour de Flux contribue activement à son développement, créant des outils et des ressources pour faciliter son utilisation et son amélioration. Par exemple, des projets comme Simple Tuner et xLux offrent des interfaces conviviales pour l'entraînement de LoRAs personnalisées3.
De plus, la licence Apache 2.0 de la version FLUX.1 [schnell] permet son utilisation dans des projets commerciaux, offrant ainsi une alternative viable pour les entreprises cherchant à intégrer la génération d'images IA dans leurs produits2.
Cette ouverture et cette flexibilité contrastent avec l'approche plus fermée de Midjourney, positionnant Flux comme une option attrayante pour ceux qui cherchent à pousser les limites de la génération d'images par IA et à l'adapter à des besoins spécifiques.