Cette décision de la Haute Cour britannique par l'honorable Juge Mrs Justice Joanna Smith DBE est remarquable par l'analyse de l'architecture technique de Stable Diffusion et par sa solution.
C'est l'une des premières décisions judiciaires majeures sur la responsabilité des développeurs d'intelligence artificielle générative face aux titulaires de droits de propriété intellectuelle.
La structure technique en cause en limiterait-elle la portée de cette décision ou au contraire le soin apporté à la décrire montrerait-il la voie à suivre pour les opérateurs de l'IA ? Cette décision souligne aussi la fragilité des actions fondées sur le droit d'auteur au regard des conditions posées à la recevabilité de telles actions.
Points juridiques essentiels
i) Définition de "copie" à l'ère de l'IA
Principe : Une transformation algorithmique compressant des données en weights statistiques n'est pas une copie au sens du droit d'auteur, même si elle résulte d'un processus de copie.
Portée : Ce raisonnement pourrait s'appliquer à d'autres technologies d'apprentissage automatique (LLMs, modèles audio, etc.).
ii) Approche contextuelle pour les marques
Cette décision adopte une analyse hautement factuelle pour les atteintes aux marques :
- Chaque image générée doit être analysée individuellement
- Le contexte technique (version du modèle, prompt, filtrage) est déterminant
- Les généralisations statistiques sont insuffisantes
iii) Responsabilité limitée du fournisseur de technologie, transfert de la charge à l'utilisateur
- La responsabilité du développeur (Stability AI) : limitée aux actes dont il a le contrôle direct
- La responsabilité des utilisateurs : actes de génération d'images
1. Les parties
Demandeurs : Getty Images (groupe multinational) et cinq de ses entités, dont Getty Images (US) Inc., ainsi que le photographe Thomas M. Barwick, Inc.
Défendeur : Stability AI Limited, société britannique développant Stable Diffusion, un modèle d'IA text-to-image open source.
Enjeu stratégique : La décision devait trancher l'équilibre entre la protection des industries créatives (photographie, contenu visuel) et le développement de l'innovation technologique (IA générative).
2. L'évolution procédurale qui tempère son impact
Au cours de la procédure, Getty Images a abandonné plusieurs chefs de demande majeurs :
- La demande principale de contrefaçon pour l'entraînement du modèle au Royaume-Uni (Training and Development Claim)
- La demande de contrefaçon primaire pour les outputs générés (Outputs Claim)
- La demande relative aux droits sur les bases de données (Database Rights Infringement Claim)
Ne subsistaient au procès que :
- La demande de contrefaçon secondaire (Secondary Infringement - sections 22 et 23 CDPA)
- Les demandes de contrefaçon de marques (sections 10(1), 10(2), 10(3) TMA)
- La demande pour passing off
- Des questions d'interprétation contractuelle sur les licences exclusives
3. Les aspects techniques déterminants
3.1. Architecture de Stable Diffusion
La Décision a soigneusement analysé le fonctionnement technique du modèle :
Structure du modèle :
- Architecture de réseau de neurones profonds (deep learning) multi-couches
- Modèle de diffusion latente (latent diffusion model) transformant un prompt textuel en image synthétique
- Processus itératif : partir d'un bruit aléatoire et le débruiter progressivement jusqu'à obtenir une image cohérente avec le prompt
Processus d'entraînement :
- Entraînement sur des sous-ensembles du dataset LAION-5B (environ 3 milliards de paires URL-texte)
- Téléchargement temporaire d'images depuis ces URLs sur les serveurs AWS (hors UK)
- Ajustement itératif des model weights (poids/paramètres) par exposition répétée aux données
Deux éléments essentiels à cette décision : les « weights » et les « biases »
Pour faire simple à propos des « weights » et les « biases », l'exemple de l'image du chat mille fois citée avec l'IA.
Regardez une photo et cherchez ce qui vous rappelle un chat. À chaque indice (les moustaches, les oreilles, la couleur), vous donnez un « score » à ces éléments : certains sont plus importants que d'autres pour pouvoir dire « oui, c'est vraiment un chat ». Ce score, c'est ce qu'on appelle le "poids" : plus le score est élevé, plus l'indice compte pour la réponse. L'IA ajuste ces poids tout au long de son apprentissage, pour mieux reconnaître les choses.
Si l'IA n'a vu que des images de chats gris, quand le chat qui lui est soumis, n'est pas gris, l'IA n'identifie pas un chat, ces biais dans son entraînement ont faussé son jugement.
Que nous dit cette décision des "weights" et des « biais » pour écarter l'atteinte au droit d'auteur.
Introduction aux weights : "Les paramètres du modèle (les « weights » ou « biais ») définissent les connexions du réseau dans le modèle et sont des paramètres apprenables qui contrôlent la fonctionnalité du réseau. Avant le début de l'entraînement, les poids du réseau sont initialisés avec des valeurs aléatoires. Pendant que le réseau est exposé aux données d'entraînement, les poids sont mis à jour de manière itérative pour mieux satisfaire un critère d'optimisation spécifié par les ingénieurs." (Section (A) INTRODUCTION, paragraphe 5).
Fonctionnement des weights : "Les weights du modèle ne stockent pas directement les données d'entraînement, mais une grande partie de leur fonctionnalité est indirectement contrôlée via les données d'entraînement. En d'autres termes, la manière dont le réseau utilise ses multiples couches est le résultat du processus d'entraînement." (Section (A) INTRODUCTION, paragraphe 7).
Taille des weights : "Les weights du modèle Stable Diffusion v1.x peuvent être téléchargés sous forme de fichier binaire de 3,44 Go, ce qui est beaucoup plus petit que le dataset d'entraînement LAION-5B, qui fait environ 220 To. Cela montre que les weights ne contiennent pas directement les images d'entraînement, mais seulement les informations nécessaires pour générer de nouvelles images." (Section (B) FACTUAL BACKGROUND, paragraphe 46).
Processus d'entraînement : "Pendant l'entraînement, chaque image est encodée dans une représentation latente à laquelle une quantité aléatoire de bruit est ajoutée. Les weights du réseau sont optimisés pour prédire ce bruit afin que le réseau puisse recréer le contenu détruit par le bruit ajouté." (Section (A) INTRODUCTION, paragraphe 5 et Section (B) FACTUAL BACKGROUND, paragraphe 48).
Impact des données d'entraînement sur les weights : "Les Experts conviennent que les weights du modèle ne stockent pas directement les valeurs de pixels des images d'entraînement, mais ils peuvent mémoriser des motifs ou des caractéristiques des données d'entraînement. Cela peut inclure des éléments comme des filigranes (watermarks) si ces derniers apparaissent fréquemment dans les données d'entraînement." (Section (D) THE WITNESSES AND EVIDENCE, paragraphe 91 et Section (E) LEGAL RESPONSIBILITY FOR STABLE DIFFUSION v1.X, paragraphe 48).
- Les weights capturent des patterns statistiques, mais ne stockent pas les images d'origine
Processus d'inférence :
- L'utilisateur fournit un prompt textuel
- Le modèle génère une nouvelle image en échantillonnant la distribution de probabilité apprise
- Aucune donnée d'entraînement n'est utilisée ou stockée lors de l'inférence
3.2. Versions du modèle
- v1.x (août 2022) : versions initiales (v1.1 à v1.4), entraînées sur LAION-Subsets, publiées en open source
- v2.x (novembre-décembre 2022) : entraînées from scratch avec filtrage NSFW renforcé
- SD XL (2023) : capacité de génération d'images haute résolution (1024x1024)
- v1.6 (novembre 2023) : version optimisée, non publiée en open source
4. La décision sur les réclamations
4.1. Contrefaçon secondaire (Secondary Infringement) - REJET TOTAL
Fondement juridique
Getty Images invoquait les sections 22 et 23 du CDPA (Copyright, Designs and Patents Act 1988), qui interdisent d'importer, posséder dans le cadre commercial, ou distribuer un "article" constituant une "infringing copy" d'œuvres protégées.
Selon la section 27(3) CDPA, un article est une "infringing copy" si sa fabrication aurait constitué une contrefaçon si elle avait eu lieu au Royaume-Uni.
Argumentation de Getty Images
Les model « weights » de Stable Diffusion constituent des "infringing copies" car :
- Leur création a nécessité la reproduction massive d'œuvres protégées (Copyright Works)
- Les weights "résultent" de ce processus de reproduction
- Ils sont ensuite distribués au Royaume-Uni via téléchargement ou API
Décision : REJET complet de la demande avec un raisonnement juridique majeur :
"Although an 'article' may be an intangible object for the purposes of the CDPA, an AI model such as Stable Diffusion which does not store or reproduce any Copyright Works (and has never done so) is not an 'infringing copy' such that there is no infringement under sections 22 and 23 CDPA." (§758(viii))
Raisonnement détaillé :
Sur la notion d'"article" :
- La Décision accepte qu'un objet intangible (fichier électronique) peut être un "article" au sens du CDPA.
- Refuser cette interprétation priverait les auteurs de protection dans l'environnement numérique
Sur la notion d'"infringing copy" :
- Une "copie" nécessite une reproduction effective de l'œuvre (section 17 CDPA)
- Les model weights ne stockent ni ne reproduisent aucune œuvre protégée
- Ils représentent des patterns statistiques compressés issus du processus d'apprentissage
- Le simple fait que des copies aient été créées pendant l'entraînement ne rend pas le produit final (les weights) une "copie contrefaisante"
"The model weights are not themselves an infringing copy and they do not store an infringing copy. They are purely the product of the patterns and features which they have learnt over time during the training process." (§600)
Importance systémique :
- La Décision refuse d'étendre la notion de "copie contrefaisante" aux objets qui dérivent d'un processus de copie mais ne contiennent pas de copie
- Cette interprétation évite une extension territoriale excessive du droit d'auteur britannique
4.2. Contrefaçon de marques (Trade Mark Infringement) - SUCCÈS PARTIEL ET LIMITÉ
4.2.1. Contexte factuel : les filigranes synthétiques
Getty Images appose des watermarks (filigranes) visibles sur toutes les images prévisualisées sur ses sites web :
- Bannière translucide grise contenant les marques GETTY IMAGES ou ISTOCK
- Nom du photographe sous la marque
Phénomène constaté : Stable Diffusion peut générer des images synthétiques portant des filigranes ressemblant à ceux de Getty Images.
4.2.2. Question de seuil : incidence réelle des filigranes synthétiques
La décision examine quatre catégories de preuves :
- Témoignages d'experts
- Expérimentations de Getty Images
- Preuves "in the wild" (utilisations réelles)
- Annexes aux écritures
Conclusions factuelles essentielles :
Pour les versions anciennes (v1.x et v2.x) :
- Génération effective de filigranes synthétiques avec certains prompts ("news photo", "vector art")
- Fréquence variable selon le prompt et la version du modèle
- Preuves d'occurrences réelles "in the wild" (notamment sur Reddit)
Pour les versions récentes (SD XL, v1.6) :
- Aucune génération de filigrane constatée malgré 2 600 tentatives expérimentales
- Aucune preuve d'occurrence "in the wild"
- Amélioration substantielle du filtrage des données d'entraînement
"I do not consider there to be any evidence that one real life user in the UK has generated a watermark using either SD XL or v1.6." (§242)
4.2.3. Section 10(1) TMA - Double identité
Fondement : Usage d'un signe identique pour des produits/services identiques.
Décision : SUCCÈS LIMITÉ pour les marques ISTOCK uniquement
- Contrefaçon établie pour les filigranes iStock générés par v1.x (accès via DreamStudio et Developer Platform)
- Basé sur deux images spécifiques : Spaceships Image (v1.2) et Dreaming Image
- Aucune contrefaçon établie pour les marques GETTY IMAGES sous section 10(1)
- Aucune contrefaçon pour SD XL ou v1.6
Limitation majeure : La Décision souligne qu'il est impossible de quantifier l'ampleur réelle du phénomène dans l'utilisation ordinaire.
4.2.4. Section 10(2) TMA - Risque de confusion
Fondement : Signe identique ou similaire créant un risque de confusion dans l'esprit du public.
Décision : SUCCÈS LIMITÉ
- Contrefaçon établie pour les filigranes ISTOCK (v1.x via DreamStudio/Developer Platform)
- Contrefaçon établie pour les filigranes GETTY IMAGES générés par v2.1 (basé sur la First Japanese Temple Garden Image)
- Aucune contrefaçon pour SD XL ou v1.6
Analyse du "consommateur moyen" :
- La Décision a analysé le contexte d'utilisation : professionnel ou particulier
- Les filigranes, même déformés, peuvent créer un lien mental avec Getty Images
- Analyse hautement dépendante des faits concrets de chaque image générée
4.2.5. Section 10(3) TMA - Atteinte à la réputation
Fondement : Usage sans juste motif tirant indûment profit de la réputation, ou portant préjudice au caractère distinctif ou à la réputation.
Décision : REJET COMPLET
La Décision a rejeté tous les chefs :
- Dilution du caractère distinctif : non établie
- Atteinte à la réputation (tarnishment) : non établie
- Parasitisme (unfair advantage) : non établi
Raison principale : Getty Images n'a pas démontré de changement de comportement économique du public pertinent résultant de la génération de filigranes synthétiques.
4.3. Passing Off - NON TRAITÉ
La Décision a refusé de statuer sur cette demande :
- Getty Images n'a présenté aucune argumentation spécifique
- La Décision estime que cette demande n'ajoute rien aux conclusions sur les marques
- Possibilité laissée ouverte de revenir sur ce point ultérieurement
4.4. Licensing Issue - SUCCÈS PARTIEL POUR STABILITY AI
Question juridique
Getty Images revendique la titularité de droits exclusifs sur des milliers d'œuvres via des accords de licence exclusive. Pour agir en contrefaçon, ces licences doivent satisfaire aux exigences de la section 92 CDPA qui définit une "exclusive licence".
Critère essentiel : La licence doit conférer l'exclusivité à un seul licencié (ou groupe identifiable), excluant tous les autres, y compris le cédant.
Accords en cause
Deux types principaux :
- Contributor Agreements (anciennes versions)
- iStock ASA (Artist Supply Agreements)
Analyse contractuelle
Point de litige : La définition de "Getty Images" dans ces contrats vise-t-elle uniquement Getty Images (US), Inc., ou l'ensemble des entités du groupe ?
Décision :
Pour les licences anciennes (#2, 3, 10, 11, 13, 30, 32) :
- NON exclusives au sens de la section 92 CDPA
- La définition de "Getty Images" englobe plusieurs entités du groupe
- Il y a donc pluralité de licenciés, incompatible avec l'exclusivité exigée par le CDPA
- Ces licences ne confèrent pas de droit d'action autonome
Pour les licences récentes (#17, 19, 34-38) :
- Exclusives au sens de la section 92 CDPA
- Rédaction précise identifiant un licencié unique
- Droit d'action concurrent reconnu
Conséquence pratique : Getty Images ne peut agir pour contrefaçon qu'au titre des œuvres couvertes par les licences reconnues comme exclusives.
Deux constats essentiels bien que provisoires
Pour l'industrie de l'IA : cette décision apporte une clarification juridique importante créant un espace de sécurité pour le développement de modèles génératifs, sous réserve de bonnes pratiques (sources pour l'entraînement, filtrage, transparence).
Pour les créateurs : c'est un signal d'alerte nécessitant une adaptation stratégique.