Ho ho ho, Aube Nature souhaite à toutes et tous les amoureux de la nature et de la photographie, un Joyeux Noël ! Mais qu’est-ce donc cette photo de Père Noël, drôlement habillé, avec cet appareil photo ?… Et bien il s’agit d’une image générée par Intelligence artificielle, spécialement pour l’occasion !
Pour réaliser cette image, j’ai utilisé le désormais célèbre MidJourney. Cet incroyable outil fait partie des désormais nombreuses IA (intelligences artificielles) capables de générer des images à partir de « prompts » (ordres) où l’on exprime ce que l’on veut simplement avec un texte. Incroyable non ?…
À CONSULTER ÉGALEMENT : Pour en savoir plus sur le métier de photographe…
La génération d’images par IA en bref
Bien que je travaille professionnellement avec l’IA quotidiennement (ou presque) depuis déjà plusieurs mois, je me suis jusqu’alors assez peu intéressé à la partie médias. Pour autant, cela fait déjà un petit moment que Dall-E (le premier du nom) a pointé le bout de son nez sur la scène des créateurs, offrant moyennant des sommes dérisoires, la possibilité de générer des images à partir de texte.
Ont vite suivi d’autres outils plus ou moins faciles à utiliser, parfois gratuits dans une certaine mesure : NightCafe, PhotoSonic, Crayion, Jasper Art (une extension de l’excellent Jasper, basé sur GPT-3 d’Open AI) mais aussi et surtout Stable Diffusion, MidJourney, et Dall-E 2 bien entendu. Chaque outil a ses particularités, certains étant gratuits mais plus simplistes, d’autres beaucoup plus complexes mais puissants.
S’il en est un qui se démarque, c’est bien MidJourney, qui est depuis quelque temps déjà utilisé par des artistes, et qui est capable (moyennant le bon « prompt ») de générer des images extraordinaires !
Le prompt, la base de la génération d’image
Un prompt est une description ou un guide utilisé pour orienter la génération d’images par le moteur d’intelligence artificielle (IA). Il peut être réalisé sous forme de texte, mais aussi parfois de code informatique, et doit décrire ce que l’outil doit générer, incluant des éléments tels que les couleurs, les formes, les textures et les détails de l’image : on peut notamment y préciser la lumière, l’ambiance, le style, et tout un tas d’éléments quipourront guider le moteur de rendu dans sa réalisation. Un prompt bien formulé peut aider à obtenir une image générée par IA qui correspond précisément à ce que vous souhaitez !
Voici le prompt que j’ai utilisé pour l’image de mon article (je suis encore néophyte avec MidJourney) : « Generate a high resolution, photorealistic image of Santa Claus dressed as a wildlife photographer, taking a picture of wild reindeer in their natural habitat. The image should capture the beauty and majesty of the reindeer, as well as the excitement and enthusiasm of Santa as he captures the perfect shot. The background should be a stunning, snowy landscape, with the sunlight filtering through the trees and casting a warm glow on the scene. The image should be visually appealing and evocative, capturing the magic and wonder of the holiday season. »
Comme vous le voyez, la précision est de mise, et j’ai omis (malheureusement) d’autres critères inhérents à la qualité technique de l’image, son format notamment (ce qui explique que par défaut, il m’ait généré une image carrée en 1024 pixels de côté…)
Spoiler : j’ai utilisé… une IA, en l’occurrence ChatGPT, pour m’aider à générer le prompt !
Au-delà de l’exploit technique (car je considère que c’en est véritablement un !), se pose la question évidente de l’impact de ce genre d’outils.
Si parfait que cela, l’image générée par IA ?…
Et bien si aujourd’hui, il faut avouer que les résultats sont assez bluffants, les premières applications avaient beaucoup fait rire sur le web. On trouve encore aujourd’hui de très nombreux exemples d’images ratées générées par IA. Bien souvent, il s’agissait pour le moteur de rendu, de représenter des visages ou même des corps humains, chose qu’il était incapable de faire sans produire des horreurs !
Plutôt que de vous inonder d’images affreuses, voici un meme qui a fait le tour du web, et qui résume tout-à-fait la réalité actuelle (enfin… oui et non !) :
En réalité, en ce 24 décembre 2022, on peut considérer que ce genre d’image relève (presque) de l’histoire ancienne : l’IA a fait de tels progrès, et les développeurs ont tellement amélioré les modèles, qu’aujourd’hui, les images générées sont assez incroyables de qualité !
Alors évidemment, tout n’est pas parfait, mais il faut admettre que les résultats sont assez bluffant. Je vous ai mis ci-après quelques générations d’images (variations brutes, ou résultats finaux) issues de MidJourney (nb : je ne suis pas l’auteur des prompts).
Quels dangers pour les photographes professionnels ?
On peut très légitimement se poser la question du danger de l’IA et de la génération d’images pour le métier de photographe professionnel. Si les prestataires de service (artisans photographes) ne seront évidemment pas directement impactés, les photographes d’illustration – dont le métier a déjà été largement sinistré par l’essor des microstocks – peuvent effectivement se poser de sérieuses questions.
En réalité, pour le photographe d’illustration, le principal danger réside dans les possibilités de modification des images existantes : un sérieux problème pour les questions de copyright et de droits d’auteur !!!
À mon sens, il existe 3 principales questions à soulever :
L’impact sur la créativité et la valeur des photos
S’il est un domaine où l’IA excelle (et les graphistes et designers devront effectivement « faire avec », tout comme les photographes ont du en leur temps faire avec l’essor du numérique !) c’est bien le côté créatif : pour ainsi dire, il n’y a aucune limites !!!
On peut donc se poser légitimement la question de l’impact de l’IA sur la valeur créative de certaines photographies. En animalier et en photo nature, la lumière, l’exclusivité, le point de vue (et la chance) sont les principaux critères qui font d’une photo d’animaux, une photo exceptionnelle.
Avec l’IA, il est désormais possible de faire tout ou presque !!! Et la seule chose qui nous sauve (pour le moment…) c’est qu’elle n’est pas encore capable de représenter précisément les animaux. Mais en photo d’architecture ou en création graphique, le problème est réel !
La difficulté pour les photographes de se démarquer
Dans le prolongement de la créativité, va très vite se poser celui de la difficulté de faire sa place dans le monde de l’image. Aujourd’hui déjà, avec la démultiplication exponentielle des photos sur les innombrables réseaux sociaux, seuls quelques photographes tirent leur épingle du jeu, les autres étant littéralement noyés dans la masse.
Ce qui est vrai aujourd’hui le sera plus encore demain, quand les smartphones et appareils photos intègreront nativement les extraordinaires possibilités des outils de génération IA actuels. Les outils aidant, la masse d’information disponible en ligne progresse de manière incroyable (que ce soient les textes générés par IA ou les images), nous écrasant sous une masse difficile à imaginer d’information, qu’il est désormais impossible de trier ou de classer.
La facilitation des violations de copyright
Bien que je ne l’aie pas montré, il est tout-à-fait possible, avec MidJourney, de se baser sur une photo existante pour générer d’autres images. Dans ce cas, la différenciation du résultat final permet juridiquement de s’éloigner suffisamment de l’image de départ pour ne pas « risquer » une attaque en règle pour plagiat.
Pire encore, MidJourney permet de créer des images « à la façon de » grands photographes ! Et les résultats sont clairement bluffant (même si l’on voit que ce ne sont pas des photos dans 99% des cas) ; voici un petit exemple généré pour cet article : une image du Père Noël sur les plages de Normandie durant le débarquement, à la manière de Robert Cappa.
Évidemment on est loin des images originelles du photographe : mais le résultat reste extraordinaire !
Le test : une photo animalière « impossible »
Pour finir, j’ai désiré tester la capacité de MidJourney à générer une image photoréaliste, sur une espèce animale. Pour mon test, j’ai choisi l’un de mes oiseaux préférés, le geai des chênes (Garrulus glandarius).
Voici le prompt utilisé : « Generate a 4K high resolution, photorealistic image of a European jay opening a red gift box with a golden ribbon, set against the backdrop of a stunning winter sunset. The light should be warm and golden, casting a magical glow over the scene. The jay should be depicted with a sense of excitement and curiosity, as it investigates the contents of the gift box. The image should be visually appealing and beautifully detailed, with a focus on the bird and the gift box. The background should be a winter landscape, with snow-covered trees and a tranquil atmosphere.«
En clair, je lui ai demandé de générer une image de geai en train d’ouvrir un cadeau de Noël rouge avec un ruban doré, sur paysage neigeux (je résume !!!)
Voici sa première proposition :
Comme on peut le constater, on est loin du geai des chênes : ici, nous avons un joyeux mélange entre le geai européen, le mésangeai (canadien) et peut-être même le jaseur boréal !
En d’autres termes, l’IA est encore assez loin de pouvoir nous créer de toutes pièces des photographies animalières réalistes. Mais le résultat est vraiment intéressant d’un point de vue purement créatif !
Histoire de pousser mon test, j’ai choisi la 4ème variation (en bas à droite) pour pousser la machine un peu plus loin. Il m’a donc, à partir de cette version, proposé 4 nouvelles variantes :
Le résultat est très intéressant, car on décèle des défauts notamment au niveau du bec, ou du nœud du cadeau. À contrario, le paysage et la lumière sont assez impressionnants et répondent parfaitement à ce que j’en avais demandé !
Et voici donc ma version finale :
Si la pseudo photographie qui résulte de mon test ne fait aucune ambiguïté quant à sa nature totalement artificielle, il faut saluer la performance de ce qu’est capable aujourd’hui de réaliser un outil comme MidJourney.
Conclusion : le photographe doit-il avoir peur d’ IA ?…
Si les photographes ne doivent pas outre mesure s’inquiéter (pour le moment…), les illustrateurs et graphistes, eux, ont peut-être un peu de soucis à se faire. Les possibilités offertes par ces nouveaux outils (car ce sont avant tout des outils) sont immenses, et ouvrent des portes qui étaient jusqu’alors réservées aux… « vrais » artistes (il faut le dire)
Actuellement, il est possible à un néophyte de créer des images spectaculaires : c’est désormais une vérité.
Alors, qu’en est-il des photographes ?… Je pense que nous avons globalement encore un peu de temps devant nous, et que cela n’enlèvera en rien le plaisir des réaliser des images sur le terrain. On peut à contrario imaginer que les outils utilisés pour la retouche et le développement de nos images, intégreront progressivement de nouvelles possibilités, qui donneront aux images une nouvelle dimension (au risque de dénaturer la réalité ?…)
Photoshop et Lightroom n’intègrent-ils pas déjà, dans leurs dernières versions, les outils basés sur l’IA pour modifier un ciel ou détourer en deux clics un sujet ? C’est une évidence : il faudra désormais composer avec !
Mon conseil ?… Garder un œil attentif sur ces outils de nouvelle génération, et surtout, ne pas « rater le coche » pour celles et ceux qui vivent de leurs images. Je connais quelques photographes qui ont « refusé » l’arrivée du numérique voici quelques années, et qui ont disparu. Ne faites pas la même erreur avec l’intelligence artificielle !
En conclusion, voici une dernière image : un portrait de photographe animalier, dans le style de Robert Frank (le prompt était « légèrement » plus évolué, mais l’intention était celle-ci). Vous remarquerez que l’IA et les doigts de la main, c’est pas encore ça !!!
Une intelligence artificielle qui pond une main à 6 doigts montre les limites de son pouvoir. Mais il ne faut pas se leurrer, l’IA va enterrer progressivement tous les professionnels de l’art visuel.
Je pense surtout que les professionnels de l’art visuel devront s’adapter, comme les photographes ont du s’adapter à l’arrivée du numérique : ceux qui ne l’ont pas fait ont disparu (en tant que professionnels).
passer de l’argentique au numérique n’a rien a voir avec l’arrivé de l’IA , on est dans un discours des débuts du numérique … oui l’IA va mettre fin à la photographie et bien plus vite que le numérique à mis fin à l’argentique ….
Je ne suis pas d’accord Simon.
Si cela va clairement révolutionner la création d’images (voire très rapidement de vidéos), la photographie demeurera présente, ne serait-ce que pour la photo sociale.
Ce ne sont pas les IA qui feront les photos de mariage ou de baptême, ou les portraits corporate 😉
Sur la photographie d’illustration, le débat est un peu différent. Certaines thématiques risquent rapidement de tomber en désuétude (par exemple la photo culinaire… où les photographes spécialistes qui resteront en place seront ceux qui travaillent pour des clients « haut de gamme ») mais d’autres garderont tout leur intérêt.
Le mode d’apprentissage de l’IA « image » par diffusion (« Stable diffusion » n’est pas un nom venu par hasard !) est assez facile à comprendre (vidéo explicative de l’excellent Sylvain Peyronnet ici : https://youtu.be/kkQbhIsInWc?list=LL&t=8695 )
Ce mode d’apprentissage, qui se base sur une base de données d’images colossale, fait que les sujets trop peu documentés ne PEUVENT PAS être générés par l’IA. C’est aussi simple que cela.
L’IA peut faire des choses absolument incroyables (comme « mélanger » les styles de plusieurs artistes – j’ai personnellement fait des tests entre photographes et peintres !) mais en aucun cas ne pourra produire des choses dont elle ignore l’existence d’un point de vue data.
La seule méthode pour produire des images à partir de sujets inconnus est d’alimenter l’IA avec de vraies images. J’avoue ne pas avoir testé sur de l’animalier, mais de ce que j’ai vu, je mets ma main à couper qu’elle est par exemple incapable de reproduire avec précision une photo d’oiseau « rare »…
J’ai adoré l’article. Merci
J’ai appris la photo sur argentique. 2 ans après la fin de mes études le numérique avait tout envahi. D’ailleurs en classe Photoshop avait déjà son heure de cour rien que pour lui.
Le photographe qui a voulu s’adapter existe toujours. Il n’ y a jamais eu autant de photographe de nos jours. L’ ia va permettre d ouvrir de nouveaux horizons. D être encore plus créatif. Il va juste falloir à apprendre à doser et mélanger les techniques 🥰
( ps respect pour le résultat j en suis encore à comprendre comment ça fonctionne 😂😂👌)
Et l’utilisation frauduleuse dans tout çà ??? Personne ne se pose la question ??????
L’utilisation frauduleuse existe malheureusement depuis des années et n’est pas cantonnée à une seule technologie (car l’IA est une technologie parmi tant d’autres, un outil)