Dans le contexte: Malgré les réserves de certains groupes voulant que les développeurs freinent l’IA générative, la technologie continue de s’améliorer à un rythme effréné. Cette avancée est sans doute plus évidente dans le sous-secteur de la génération d’images, car il a eu le temps de brasser et de mijoter certaines des premières controverses auxquelles il a été confronté, auxquelles les grands modèles linguistiques sont actuellement confrontés.
Récemment, Adobe a publié une fonctionnalité Photoshop appelée « Remplissage génératif », permettant aux créateurs de contenu d’étendre une image au-delà de ses frontières initiales. En un mot, l’outil fait partie du modèle de synthèse d’images Firefly d’Adobe. Les utilisateurs peuvent étendre les bords d’une image dans n’importe quelle direction, et Generative Fill produira un contenu cohérent avec ou sans invites contextuelles.
Les gens ont déjà commencé à se déchaîner avec la fonctionnalité sur les réseaux sociaux, avec de nombreux exemples devenus viraux. Un ensemble impressionnant d’images provient d’un utilisateur de Twitter passant par « Dobrokotov » (AI Molodca sur Télégramme). L’artiste multimédia russe autoproclamé a utilisé Generative Fill pour développer certaines couvertures d’albums emblématiques. Son interprétation de Nevermind de Nirvana (ci-dessus) a accumulé plus de 2,3 millions vues en quelques jours seulement.
Alors que l’album Nirvana ressemblait à un travail rapide – il suffit d’élargir les frontières et de laisser ensuite Generative Fill faire son travail – certaines des autres couvertures ont été incitées et ont essayé quelques éléments générés avant d’atterrir sur quelque chose d’époustouflant. Le point de vue de Dobrokotov sur l’album Abbey Road en est un excellent exemple (ci-dessous).
Bien que les Beatles aient sorti Yellow Submarine trois ans avant Abbey Road, Dobrokotov a ajouté un sous-marin jaune sur le côté en guise de petit hommage. Un autre effet qu’il a probablement suscité de l’IA est le thème spatial surréaliste en haut de l’image. De plus, les bandes de passage pour piétons super étendues et l’effet fish-eye sur les côtés permettent à l’image de s’adapter parfaitement à l’ère des années 1960. pochette d’album psychédélique. En parlant de cela: l’extension de Dobrokotov de Black Holes & Revelations de Muse est également assez trippante (ci-dessous).
Bien que Dobrokotov n’ait pas partagé son processus de création de ses superbes extensions, d’autres l’ont fait. Comme vous pouvez le voir dans la vidéo ci-dessous, pour que l’image finale soit belle, il ne suffit généralement pas d’étirer les frontières et de l’appeler un jour. Obtenir une belle pièce accrocheuse nécessite une bonne compréhension de la composition de l’image, un peu d’essais et d’erreurs et quelques retouches finales. L’IA d’image générative a parcouru un long chemin, mais elle a encore du mal avec quelques éléments, comme les yeux et les doigts.
ãªãÂÂã»ã©ãÂÂPhotoshopã® »Remplissage Génératif(ã¸ã§ãÂã¬ã¼ãÂã£�-�-ãÂã¤ã¶�-)ã«ã¯� »ãÂãÂÂãÂ使ãÂ�-ï ¿½ãÂÂãÂãÂÂã®ãÂÂ… pic.twitter.com/Z24quNgDVJ
– æ¨�…� »å¤§ï½ÂAIæÂä »£ã«�-ãÂÂ�…ãÂãªãÂÂçºã®�…è¦Â�…å ±ï ¿½’æ¯Â�-��…�信� »ï¿½ (@shota7180) 25 mai 2023
Cependant, avec quelques modifications créatives et des retouches post-génération, les artistes peuvent masquer suffisamment ces défauts pour faire passer le travail comme entièrement créé par l’homme. L’industrie a déjà exprimé cette inquiétude dans le sous-genre de la génération d’images d’IA, et cela fait toujours l’objet de débats à plusieurs niveaux, mais en attendant, c’est amusant de voir ce que les gens peuvent trouver avec un peu (ou beaucoup) d’aide de une machine (ci-dessous, crédit image : fangming.li).