Aller mieux: Avec toutes les nouvelles récentes concernant ChatGPT et d’autres grands modèles de langage, il est facile d’oublier que leurs cousins, les générateurs d’images IA, continuent de s’améliorer. On a peut-être trouvé comment rendre les yeux et les mains sans que le sujet ressemble à quelque chose d’un cauchemar. cependant, les résultats effraient encore certaines personnes.
Plus tôt cette semaine, le laboratoire de recherche À mi-parcours a publié une version bêta de la version 5 de son logiciel d’imagerie AI. Selon son annonce via Twitter, la dernière version ajoute une meilleure qualité d’image, des résultats plus “diversifiés”, une gamme de styles plus étendue, des textures homogènes et bien plus encore.
A partir d’aujourd’hui notre communauté peut tester Midjourney V5. Il a une qualité d’image beaucoup plus élevée, des sorties plus diversifiées, une gamme stylistique plus large, une prise en charge des textures homogènes, des rapports d’aspect plus larges, une meilleure invite d’image, une plage dynamique plus large et plus encore. Explorons!
– Mi-journée (@midjourney) 15 mars 2023
Les utilisateurs ont déjà publié des centaines de résultats époustouflants et les sentiments concernant les améliorations sont mitigés. La plupart sont impressionnés car l’IA d’imagerie a eu du mal à produire des aspects tels que les ombres, les reflets, les yeux et les mains. Vous trouverez ci-dessous une image que nous avons créée avec Dall-E d’OpenAI comme exemple d’endroit où la machine a des problèmes.
La composition est quelque peu décalée et l’ambiance générale est caricaturale. L’éclairage est tout faux. Les yeux et les mains sont très déformés. Les jambes sont encrassées d’artefacts, tout comme le récipient de pop-corn et le siège à côté du sujet. Ce résultat est l’un des quatre avec des problèmes similaires à des degrés divers.
La version 5 de Midjourney semble s’être améliorée à cet égard, du moins d’après les exemples que d’autres ont partagés. Les résultats de simples invites frôlent l’étrange vallée – suffisamment réalistes pour passer pour des photos professionnelles dans de nombreux cas, mais toujours avec cette qualité étrange que vous ne pouvez pas tout à fait situer. Bien qu’incroyablement réalistes, beaucoup ont décrit les images comme effrayantes.
Midjourney v5 est là ! (pour de vrai cette fois, lol)
Voici quelques côte à côte de mes invites, v4 vs v5, ainsi que de nouvelles invites et photos de foule. J’en rajouterai au fur et à mesure de mes expériences.
𧵠pic.twitter.com/qSEZWQBXou
– Nick Saint-Pierre (@nickfloats) 15 mars 2023
Notre propre Kishalaya Kundu a déclaré : “Je suis plus effrayé qu’impressionné, pour être honnête”, après avoir visionné une série de photos presque parfaites de Midjourney V5. La crainte étant que l’on puisse assez facilement créer une fausse image et la faire passer pour authentique.
Mis à part le facteur de fluage, par rapport à V4, Midjourney V5 a considérablement amélioré la qualité. Designer graphique Julie Wieland a utilisé Midjourney V4 (sorti en novembre dernier) pendant un certain temps et dit que la version 5 a “incroyablement réaliste” textures de la peau. Les effets d’éclairage sont également bien meilleurs, y compris les reflets, les reflets et les ombres. Peut-être plus important encore, l’IA génère des mains et des yeux qui semblent naturels la plupart du temps.
�”� Conseil MJ : les prises de vue à travers une fenêtre sont enfin possibles avec le V5 !
J’ai eu envie de l’esthétique “My Blueberry Nights” depuis que j’ai essayé Dalle2 pour la première fois (et ça s’est bien passé), mais la v5 est époustouflante !
�’ trouvez l’invite dans le texte ALT des images #synthographie #midjourneyv5 pic.twitter.com/kAOagopucG
– Julie W. Design (@juliewdesign_) 17 mars 2023
“Les yeux sont presque parfaits et ne sont plus bancaux”, a déclaré Wieland à Ars Technica. “Les mains sont correctes la plupart du temps, avec cinq doigts au lieu de 7-10 sur une main. MJ v5 me donne actuellement l’impression d’avoir enfin des lunettes après avoir ignoré la mauvaise vue pendant un peu trop longtemps. Soudain, vous voyez tout en 4k ; c’est se sent étrangement écrasant mais aussi incroyable.”
Photo de rue des années 1960 d’une jeune femme, assise, voilier, robe dior verte, robe verte en soie, robe verte, soie, collier de perles, perles tiffany, collier de perles tiffany, coucher de soleil, océan, photo sur Agfa Vista 200, 4k –ar 16:9
v4 (gauche) v5 (droite) pic.twitter.com/wz7GbI3fvA
– Nick Saint-Pierre (@nickfloats) 15 mars 2023
Midjourney a également amélioré la résolution native de 512x512px à 1024x1024px. L’augmentation l’aligne sur Dall-E. Cependant, la version 4 pourrait suréchantillonner pour doubler la résolution native. Il n’est pas déraisonnable de s’attendre à ce que la V5 utilise la même technique pour produire des images 2048×2048, mais c’est pour une mise à jour plus tard.
En fin de compte, MidJourney n’est arrivé sur la scène de l’IA qu’il y a un an. Beaucoup (pas toutes) de ces images inondant les flux Twitter cette semaine sont intactes. Auparavant, Weiland utilisait une combinaison de techniques pour améliorer la qualité visuelle de Midjourney 4, y compris la “surpeinture” avec Dall-E et les retouches dans Photoshop. La version 5 promet moins d’édition post-génération et peut-être des images parfaites pour la photo plus tôt que nous ne pouvons l’imaginer. Cette perspective est en effet à la fois excitante et effrayante.