Aller mieux: Avec toutes les nouvelles récentes concernant ChatGPT et d’autres grands modèles de langage, il est facile d’oublier que leurs cousins, les générateurs d’images IA, continuent de s’améliorer. On a peut-être trouvé comment rendre les yeux et les mains sans que le sujet ressemble à quelque chose d’un cauchemar. cependant, les résultats effraient encore certaines personnes.

Plus tôt cette semaine, le laboratoire de recherche À mi-parcours a publié une version bêta de la version 5 de son logiciel d’imagerie AI. Selon son annonce via Twitter, la dernière version ajoute une meilleure qualité d’image, des résultats plus “diversifiés”, une gamme de styles plus étendue, des textures homogènes et bien plus encore.

Les utilisateurs ont déjà publié des centaines de résultats époustouflants et les sentiments concernant les améliorations sont mitigés. La plupart sont impressionnés car l’IA d’imagerie a eu du mal à produire des aspects tels que les ombres, les reflets, les yeux et les mains. Vous trouverez ci-dessous une image que nous avons créée avec Dall-E d’OpenAI comme exemple d’endroit où la machine a des problèmes.

2023 03 17 image 16

La composition est quelque peu décalée et l’ambiance générale est caricaturale. L’éclairage est tout faux. Les yeux et les mains sont très déformés. Les jambes sont encrassées d’artefacts, tout comme le récipient de pop-corn et le siège à côté du sujet. Ce résultat est l’un des quatre avec des problèmes similaires à des degrés divers.

2023 03 17 image 17

La version 5 de Midjourney semble s’être améliorée à cet égard, du moins d’après les exemples que d’autres ont partagés. Les résultats de simples invites frôlent l’étrange vallée – suffisamment réalistes pour passer pour des photos professionnelles dans de nombreux cas, mais toujours avec cette qualité étrange que vous ne pouvez pas tout à fait situer. Bien qu’incroyablement réalistes, beaucoup ont décrit les images comme effrayantes.

Notre propre Kishalaya Kundu a déclaré : “Je suis plus effrayé qu’impressionné, pour être honnête”, après avoir visionné une série de photos presque parfaites de Midjourney V5. La crainte étant que l’on puisse assez facilement créer une fausse image et la faire passer pour authentique.

2023 03 17 image 18

Mis à part le facteur de fluage, par rapport à V4, Midjourney V5 a considérablement amélioré la qualité. Designer graphique Julie Wieland a utilisé Midjourney V4 (sorti en novembre dernier) pendant un certain temps et dit que la version 5 a “incroyablement réaliste” textures de la peau. Les effets d’éclairage sont également bien meilleurs, y compris les reflets, les reflets et les ombres. Peut-être plus important encore, l’IA génère des mains et des yeux qui semblent naturels la plupart du temps.

“Les yeux sont presque parfaits et ne sont plus bancaux”, a déclaré Wieland à Ars Technica. “Les mains sont correctes la plupart du temps, avec cinq doigts au lieu de 7-10 sur une main. MJ v5 me donne actuellement l’impression d’avoir enfin des lunettes après avoir ignoré la mauvaise vue pendant un peu trop longtemps. Soudain, vous voyez tout en 4k ; c’est se sent étrangement écrasant mais aussi incroyable.”

Midjourney a également amélioré la résolution native de 512x512px à 1024x1024px. L’augmentation l’aligne sur Dall-E. Cependant, la version 4 pourrait suréchantillonner pour doubler la résolution native. Il n’est pas déraisonnable de s’attendre à ce que la V5 utilise la même technique pour produire des images 2048×2048, mais c’est pour une mise à jour plus tard.

2023 03 17 image 19

En fin de compte, MidJourney n’est arrivé sur la scène de l’IA qu’il y a un an. Beaucoup (pas toutes) de ces images inondant les flux Twitter cette semaine sont intactes. Auparavant, Weiland utilisait une combinaison de techniques pour améliorer la qualité visuelle de Midjourney 4, y compris la “surpeinture” avec Dall-E et les retouches dans Photoshop. La version 5 promet moins d’édition post-génération et peut-être des images parfaites pour la photo plus tôt que nous ne pouvons l’imaginer. Cette perspective est en effet à la fois excitante et effrayante.