Génération d’images par IA : comment ça marche ?
Aujourd’hui, les outils d‘intelligence artificielle sont capables de créer des images originales à partir de simples descriptions textuelles, ouvrant des perspectives inédites pour le marketing, la communication et les médias.
Ces images sont générées au moyen de 2 technologies : les GANs (Generative Adversarial Networks) et les modèles de diffusion.
- Les GANs (en français réseaux antagonistes génératifs)
Les GANs ont été inventés en 2014 par Ian Goodfellow actuellement chez DeepMind la filiale de Google spécialisée dans l’intelligence artificielle. Leur principe repose sur un duo d’algorithmes qui travaillent en opposition :
- Le générateur (Generator) crée des images à partir de données aléatoires.
- Le discriminateur (Discriminator) évalue si l’image produite est « réelle » (c’est-à-dire similaire à des images issues de vraies données) ou « fausse ».
Imaginez un faussaire (le générateur) essayant de créer des œuvres d’art convaincantes, et un expert en art (le discriminateur) chargé de détecter les contrefaçons.
À chaque itération :
Le faussaire améliore ses techniques pour tromper l’expert et l’expert affine son œil critique pour démasquer les faux.
Ces itérations poussent le générateur à produire des images de plus en plus réalistes. Les GANs sont à l’origine de nombreuses innovations, notamment dans la création de portraits hyperréalistes ou la génération de visages fictifs utilisés en marketing digital.
2. Les Modèles de Diffusion :
Les modèles de diffusion, qui sont aujourd’hui les plus répandus et se sont presque totalement substitués aux GANs, ont été popularisés récemment par des outils comme DALL·E 2, Stable Diffusion ou Midjourney et bien d’autres. Ils fonctionnent sur un principe totalement différent qui consiste à partir du chaos pour créer de l’ordre.
- Le modèle prend une image et y ajoute du bruit aléatoire (comme du « grain » sur une vieille photo) jusqu’à ce que l’image soit totalement méconnaissable.
- Le modèle apprend ensuite à faire le chemin inverse : enlever le bruit progressivement pour « reconstruire » l’image d’origine.
- Une fois entraîné, le modèle peut partir d’une image totalement bruitée et générer une nouvelle image à partir d’une simple description textuelle.
C’est un peu comme si vous aviez une feuille brouillée de taches d’encre, et que l’IA savait comment révéler un dessin précis en effaçant progressivement les tâches.
Aujourd’hui, les modèles de diffusion dominent la scène de la création d’images génératives grâce à leur flexibilité et leur capacité à produire des œuvres complexes à partir de simples prompts textuels.
Quels usages pour le marketing, la communication et les médias ?
Ces technologies offrent des multiples opportunités
- création rapide de visuels publicitaires, d’illustrations sur mesure, de concepts créatifs.
- génération d’images d’illustration pour des articles, de miniatures YouTube attractives ou même de vidéos automatisées.
- personnalisation de contenus graphiques pour les réseaux sociaux sans dépendre systématiquement de banques d’images classiques.
Questions éthiques
Néanmoins ces outils ne remplacent pas la créativité humaine, ils permettent d’aller plus vite et répondre avec une précision d’autant plus grande que l’utilisateur aura su préciser sa demande.
Si l’IA permet des gains de productivité et une créativité augmentée, elle pose aussi des questions éthiques autour de l’usage qui pourrait être fait en matière de désinformation (deepfakes) et questionne également toute la jurisprudence en matière de propriété intellectuelle des œuvres générées par IA.
En aout dernier, un ensemble d’organisations de créateurs et de titulaires de droits d’auteurs en Europe, ont publié une lettre ouverte à l’adresse de la Commission européenne « l’appelant à une mise en œuvre efficace et significative » de la loi sur l’intelligence artificielle (AI Act), entrée en vigueur le premier Aout dernier
De leur côté, devant les incertitudes juridiques, de nombreux annonceurs sont réticents a utiliser ces modèles même s’ils autorisent leur utilisation par leurs agences sous certaines conditions.