TDM & Droit d'auteur à l'ère de l'IA générative
Analyse comparative : Rapport PE A10-0019/2026 · Directive DSM 2019/790 · AI Act 2024/1689
Introduction
IA et droit d'auteur, parmi les confrontations avec les outils d'IA, celle avec ou contre les droits d'auteur mobilise les attentions.
Trois instruments normatifs de portée et de nature différentes interagissent aujourd'hui pour réguler — ou tenter de réguler — les pratiques d'exploration de textes et de données (Text and Data Mining, TDM) dans le contexte de l'entraînement des grands modèles de langage (LLM) et des modèles à usage général (GPAI) :
- la directive DSM 2019/790,
- le règlement IA (AI Act) 2024/1689,
- et le rapport du Parlement européen A10-0019/2026 sur le droit d'auteur et l'IA générative, adopté sous la conduite du rapporteur Axel Voss.
Ces trois textes ne se situent pas sur le même plan normatif : la directive DSM est contraignante pour les États membres via transposition nationale ; l'AI Act est un règlement d'applicabilité directe dans l'ensemble de l'Union ; le rapport du PE constitue un acte de soft law — une résolution d'initiative parlementaire qui préfigure probablement les orientations législatives à venir.
Leur articulation dessine un cadre en construction, dont les lacunes et les tensions sont précisément au cœur des revendications exprimées par le Parlement européen.
Vue d'ensemble des trois instruments
| Instrument | Nature juridique | Champ d'application principal | Portée TDM/IA |
|---|---|---|---|
| Rapport PE A10-0019/2026 | Résolution (soft law / initiative législative) | Réforme du droit d'auteur UE dans le contexte GenAI | Propose clarifications, opt-out centralisé, transparence renforcée, licences, rémunération |
| Directive DSM 2019/790 | Directive contraignante (transposition nationale) | Droit d'auteur et droits voisins dans le marché unique numérique | Crée les exceptions TDM (art. 3 recherche ; art. 4 général + opt-out) |
| AI Act 2024/1689 | Règlement contraignant | Systèmes d'IA mis sur le marché | Obligations conformité (applicabilité directe UE, dont modèles GPAI copyright + résumé données d'entraînement (art. 53(1)) |
Sources : Rapport PE A10-0019/2026 · Directive DSM 2019/790 · AI Act 2024/1689
1°) Le régime TDM : une architecture à deux étages fragilisée par l'IA générative
La directive DSM a organisé le TDM en deux strates distinctes.
- L'article 3 réserve une exception spécifique aux organismes de recherche et aux institutions du patrimoine culturel opérant à des fins non commerciales, sans possibilité d'opt-out pour les titulaires.
- L'article 4, en revanche, ouvre une exception générale — incluant les usages commerciaux — mais subordonnée à l'absence de réserve expresse des droits par les titulaires, en format machine-readable pour les contenus en ligne.
Deux constats au rapport PE A10-0019/2026 :
- Cette architecture n'était pas conçue pour l'entraînement massif de modèles génératifs aboutissant à des produits directement concurrentiels des œuvres originales.
- Il stigmatise l'ambiguïté persistante de l'application de l'article 4 dans ce contexte (points 1-2) et appelle à compléter le dispositif par un cadre de licences opérationnel restaurant le pouvoir de négociation des créateurs. Rappelons que l'AI Act, pour sa part, ne modifie pas l'architecture DSM mais rend la conformité à celle-ci obligatoire pour les fournisseurs de GPAI (article 53(1), considérant 106).
2°) L'opt-out : ne peut se limiter à une réserve formelle mais doit devenir un mécanisme effectif
Le mécanisme de réserve de droits prévu à l'article 4(3) DSM constitue la pierre angulaire du dispositif de protection des titulaires dans le contexte du TDM commercial. Son efficacité pratique est cependant largement contestée : le rapport PE qualifie les systèmes actuels d'opt-out de « peu pratiques », insuffisants dans leur couverture des actes de TDM et dépourvus de la transparence requise (considérant K).
Que propose ce rapport ? La réponse proposée est structurelle : création de formats standardisés lisibles par machine et d'un registre européen géré par l'EUIPO comme intermédiaire de confiance (point 10, considérant X). L'EUIPO se verrait ainsi confier un triple rôle : gestionnaire du registre des opt-out, interface entre titulaires de droits et opérateurs IA, et évaluateur de conformité. L'AI Act s'aligne partiellement sur cette logique en imposant aux fournisseurs GPAI de disposer d'une politique permettant d'identifier et de respecter les réserves, y compris via des technologies « state-of-the-art » (article 53(1)©, considérant 106) — ce qui crée une incitation économique forte à l'adoption de solutions techniques interopérables.
Attention pour les refus antérieurs : le rapport PE précise expressément que tout nouveau mécanisme d'exclusion ne doit pas invalider les refus antérieurement exprimés (point 12). Cette précision vise à éviter que la mise en place d'un registre centralisé soit interprétée comme une remise à zéro des réserves existantes.
3°) La transparence des données d'entraînement : du résumé à la présomption
L'AI Act impose aux fournisseurs de modèles GPAI de mettre à disposition un résumé public suffisamment détaillé des contenus utilisés pour l'entraînement, selon un modèle établi par l'AI Office (article 53(1)(d)). Cette obligation est significative mais reste en deçà des exigences formulées par le Parlement européen.
Le rapport A10-0019/2026 pousse vers une transparence exhaustive :
- documentation source par source de tous les contenus protégés utilisés ;
- extension de l'obligation à l'inférence, au RAG (Retrieval-Augmented Generation) et au réglage fin ;
- identification des robots d'indexation auprès des opérateurs web ;
- tenue de registres détaillés (point 12, considérant Y).
Le rapport propose également le watermarking numérique — marquage cryptographique des œuvres — comme outil de traçabilité, dont il appelle à normaliser les standards (considérant AA).
La disposition la plus innovante — et la plus contraignante — est la présomption réfragable d'utilisation d'une œuvre protégée en cas de non-respect des obligations de transparence (point 24, considérant AB). En cas de succès d'un titulaire en justice, les dépens et frais seraient mis à la charge du fournisseur IA. Ce mécanisme inverserait partiellement la charge de la preuve dans les litiges en contrefaçon liés à l'entraînement — enjeu procédural majeur, notamment dans le contentieux avec les grands modèles américains.
4°) Faire sauter le verrou de l'extraterritorialité
L'un des points les plus importants tant en opportunité des décisions politiques à venir, que dans le mécanisme juridique à mettre en place : l'application du droit d'auteur à l'IA générative est la question de la territorialité des actes d'entraînement. La majorité des grands modèles (GPT, Gemini, Claude, Llama...) ont été entraînés hors de l'Union européenne, souvent avec des contenus européens, puis commercialisés sur le marché UE.
Le considérant 106 de l'AI Act rend applicable l'obligation de respecter la politique copyright/opt-out DSM à tout fournisseur qui met un modèle GPAI sur le marché UE, quel que soit le lieu des actes d'entraînement sous-jacents.
Le rapport PE va plus loin en proposant d'interpréter le principe de territorialité de sorte que le droit d'auteur UE s'applique dès lors que le modèle ou le système est mis sur le marché de l'Union, sous peine d'interdiction de commercialisation (point 16, considérant P). Cette position, si elle était consacrée, constituerait un mécanisme d'accès sous condition au marché comparable à celui utilisé dans d'autres régulations (RGPD, DSA, DMA).
5°) Vers un marché de licences : la rémunération en filigrane
Ni la directive DSM ni l'AI Act n'instituent de mécanisme de rémunération automatique au bénéfice des titulaires de droits pour l'utilisation de leurs œuvres à des fins de TDM ou d'entraînement.
Le rapport du Parlement européen entend combler cette lacune en orientant résolument le cadre vers un marché de licences opérationnel.
Plusieurs mécanismes sont envisagés :
- licences collectives volontaires sectorielles organisées via les sociétés de gestion collective (point 9) ;
- licences individuelles volontaires (point 19) ;
- extension du droit voisin de la presse aux détournements d'audience et de recettes générés par les systèmes d'IA (points 6-7) ;
- et, de manière particulièrement significative, une rémunération pour les utilisations passées depuis fin 2022 (point 21), avec une proposition de taux forfaitaire provisoire de 5 à 7% du chiffre d'affaires mondial en attendant la mise en place d'un système pérenne.
L'EUIPO jouerait également un rôle de facilitateur : soutien aux processus sectoriels de licences volontaires, gestion d'un guichet unique associant registre opt-out et octroi de licences (points 11, 22-23).
Tableau comparatif thématique
| Thème | Rapport PE A10-0019/2026 | Directive DSM 2019/790 | AI Act 2024/1689 |
|---|---|---|---|
| TDM – finalité recherche | Préserve recherche/enseignement ; exploitation commerciale des résultats exige autorisations adéquates (pt. 4). | Art. 3 : exception TDM pour la recherche scientifique (organismes de recherche + patrimoine culturel) sur accès licite. Pas d'opt-out. | Renvoie à la conformité au droit d'auteur (DSM) ; ne crée pas d'exception autonome. |
| TDM – finalité générale / commerciale | Juge l'art. 4 DSM inadapté à l'entraînement GenAI massif ; appelle à un cadre de licences complémentaire (pts. 1-2). | Art. 4 : exception/limitation TDM générale sous réserve de réserve de droits machine-readable (opt-out). | Oblige les fournisseurs GPAI à identifier et respecter les réserves art. 4(3) DSM (art. 53(1)©, cons. 106). |
| Accès licite / contenus illicites | Rappelle que « accès licite » exclut les copies piratées/contrefaisantes (pt. 3) ; dénonce l'usage de sources piratées. | Condition de « lawful access » dans les art. 3 et 4. | Exige la conformité au droit d'auteur (donc respect du lawful access et des opt-out DSM). |
| Opt-out / réserve de droits | Juge l'opt-out actuel « peu pratique » ; propose formats standardisés + registre EUIPO (cons. K ; pt. 10). | Art. 4(3) : exception non applicable si droits réservés « de manière appropriée », notamment en machine-readable pour les contenus en ligne. | Obligation de politique de conformité pour identifier et respecter les réserves art. 4(3) DSM via technologies « state-of-the-art » (art. 53(1)©, cons. 106). |
| Standardisation / registre opt-out | Propose un registre européen : formats standardisés lisibles par machine, géré par l'EUIPO comme intermédiaire de confiance (pt. 10). | N'organise pas de registre central : seulement la condition de réserve « appropriée ». | Ne crée pas de registre ; incite aux solutions techniques/organisationnelles pour identifier les réserves. |
| Mesures techniques des ayants droit | Accent sur l'effectivité de l'opt-out ; propose le watermarking/marquage numérique comme outil de traçabilité (pt. 12). | Art. 3(3) : titulaires peuvent appliquer des mesures de sécurité/intégrité des réseaux/bases, sans excéder le nécessaire. | Ne traite pas des mesures techniques copyright ; vise conformité et transparence côté fournisseurs GPAI. |
| Transparence données d'entraînement | Demande une transparence très élevée : documentation exhaustive des sources, extension à inférence/RAG, identification des crawlers, tenue de logs (pt. 12 ; cons. Y). | Ne pose pas de devoir général de transparence dataset envers les titulaires ; organise l'exception et l'opt-out. | Impose un résumé public suffisamment détaillé des contenus d'entraînement (template AI Office) (art. 53(1)(d)). |
| Présomptions probatoires / enforcement | Propose une présomption réfragable d'utilisation d'œuvres en cas de non-transparence ; frais à la charge du fournisseur si succès du titulaire (pt. 24 ; cons. AB). | N'établit pas de présomption probatoire équivalente ; renvoie aux mécanismes nationaux. | Prévoit des mécanismes de conformité/contrôle IA ; les obligations (politique + résumé) sont utilisables indirectement comme éléments de preuve. |
| Territorialité / modèles hors UE | Veut que le droit d'auteur UE s'applique à tout système mis sur le marché UE, quel que soit le lieu d'entraînement (pt. 16 ; cons. P). | Application via le droit national (territorialité classique). | Cons. 106 : obligation pour tout fournisseur GPAI sur le marché UE de respecter la politique copyright/opt-out DSM, indépendamment du lieu d'entraînement. |
| Rémunération / licences | Oriente vers un marché de licences (collectif volontaire sectoriel + individuel) ; explore la rémunération pour usages passés (5-7% CA) ; focale presse (pts. 6-7, 9, 21). | Encadre la TDM par exceptions/opt-out, sans mécanisme de rémunération automatique dédié. | N'institue pas de rémunération ; la conformité et la transparence imposées peuvent faciliter la négociation de licences. |
Sources : Rapport PE A10-0019/2026 · Directive DSM 2019/790 (EUR-Lex) · AI Act 2024/1689 (EUR-Lex)
Synthèse ponctuelle et provisoire sur ce conflit IA et droits d'auteur
L'analyse croisée de ces trois instruments montre trois dynamiques distinctes :
Une tension des mécanismes actuels : exception et/ou licence.
La directive DSM a fait le choix de l'exception (TDM libre sous conditions),
l'AI Act perpétue ce choix en rendant sa conformité obligatoire,
mais le rapport PE remet fondamentalement en cause l'adéquation de ce modèle à l'IA générative et ouvre la voie à un système hybride exception/licence.
Une tension entre transparence insuffisante et présomption d'atteinte aux droits.
L'AI Act impose un premier niveau de transparence (résumé des données d'entraînement),
mais le Parlement européen considère ce niveau insuffisant et propose de le sanctionner par une présomption réfragable d'utilisation — mécanisme de droit processuel qui pourrait transformer radicalement le contentieux de la contrefaçon dans le domaine de l'IA.
Une tension géographique ou l'ambition de souveraineté : abandon de la territorialité classique vs. applicabilité aux acteurs mondiaux.
Le droit international privé classique peine à appréhender des actes d'entraînement réalisés hors UE sur des contenus européens (voir sur ce point les développements au rapport du CSPLA).
Le considérant 106 de l'AI Act et le point 16 du rapport PE convergent vers une solution d'accès au marché conditionné : tout modèle mis sur le marché UE doit respecter les règles UE, quel que soit le lieu d'entraînement.
Ce rapport A10-0019/2026 dessine les contours d'un nouveau paradigme dans lequel le TDM pour l'entraînement de l'IA générative ne serait plus couvert par une simple exception mais soumis à un régime de licence obligatoire ou de gestion collective étendue, assorti d'une rémunération équitable des créateurs.
Cette orientation, si elle se concrétise dans une proposition législative de la Commission, marquerait une rupture significative avec l'équilibre de 2019 et redéfinirait les relations entre l'industrie de l'IA et les secteurs culturels et créatifs européens.
Se mesure ici l'ampleur pour les praticiens du droit de la propriété intellectuelle/industrielle : l'enjeu immédiat est double : comprendre la hiérarchisation des textes pour conseiller les titulaires de droits sur l'effectivité de leur opt-out actuel (formats, référencement, robots.txt, métadonnées machine-readable) et suivre de près l'évolution du cadre de licences sectorielles que l'EUIPO est appelé à faciliter.