L’IA ingurgite des œuvres : heurte-t-elle les droits d'auteur ?
Etienne Papin,
11 mars 2024
#juridique
#ia
#support
| | |
L’IA, tel un ogre, est un cerveau vide si elle n’ingurgite pas, en entrée du processus de génération, une quantité phénoménale d’œuvres préexistantes sous forme numérique, afin « d’entraîner » ses mystérieux algorithmes et en apprendre des choses qu’elle seule connaîtra et comprendra. Cette ingurgitation boulimique heurte-t-elle le droit de tiers et particulièrement les droits d’auteur des créateurs des œuvres ainsi digérées à leur insu ?

Le droit qui ne change pas la réalité

La fonction première du droit d’auteur est de protéger l’auteur contre une exploitation de son œuvre « en tant que telle » : personne ne peut reproduire l’œuvre et commercialiser ces reproductions, personne ne peut diffuser l’œuvre par et sur n’importe quel réseau sans l’autorisation du titulaire des droits sur cette œuvre. C’est la base des droits patrimoniaux de l’auteur qui sont posés par l’article L122-1 du code de la propriété intellectuelle.

Mais dans la plupart des cas, et c’est là son utilité, il ne fait pas de doute que l’IA ne va pas rediffuser l’œuvre sous sa forme d’origine.

Le traitement algorithmique d’apprentissage produira-t-il une adaptation de l’œuvre « apprise » ? Nous ne le pensons pas car le résultat de l’apprentissage n’est pas une nouvelle œuvre dans laquelle on reconnaîtrait des traces de l’œuvre initiale mais des données mathématiques qui serviront plus tard à l’IA pour produire de nouvelles œuvres. Il est plus que probable cependant que l’action d’apprentissage que réalise l’IA sur une œuvre va impliquer, au moins, une reproduction de celle-ci en entrée du processus, ce qui conduit à invoquer le droit de reproduction et donc à requérir l’accord préalable de l’auteur.

Pour autant, les plus anciens juristes du droit de l’internet se souviendront peut-être de la décision « Brel et Sardou »[1] qui fut la première décision d’une juridiction civile se prononçant sur l’atteinte au droit d’auteur que constituait la reproduction des paroles de chansons de Jacques Brel et Michel Sardou sur le site internet de leur école par deux étudiants. Nous étions en 1996. Le juge saisi avait fait une application rigoureusement exacte du code de la propriété intellectuelle en condamnant l’éditeur du site en question et en lui enjoignant le retrait des textes. Las. Le rouleau compresseur de l’internet est passé par là et le droit n’a pas changé la réalité.

Les œuvres de l’esprit, quelles qu’elles soient, sont aujourd’hui reproduites à l’infini sur internet sans autorisation des titulaires de droits et cela sans qu’ils puissent réellement infléchir cet état de fait. C’est de ces milliards de contrefaçons que les IA génératives se nourrissent pour apprendre. Seront-elles plus condamnables ou condamnées que les autres ? 

Ce n’est pas ce que l’histoire de l’internet nous enseigne. L’ingurgitation s’opérant de manière automatisée et occulte, quel auteur saura réellement que ses œuvres ont été apprises par l’IA ?

La première ingurgitation automatique et algorithmique d’œuvres fut celle de l’algorithme « PageRank » de Google. Parmi les premiers, les algorithmes de Google ont « scrawlé » automatiquement les contenus en ligne pour en générer des résultats mathématiques. Il s’agissait alors d’un classement de pages web. L’activité de calcul de Google permettant l’indexation n’a pas été considérée comme une contrefaçon des œuvres par le moteur de recherche. Elle nous semble, sur le plan factuel et sur le plan des concepts de droits d’auteur, très similaire au « scrawling » des moteurs d’IA à la recherche de données d’apprentissage.

Sur ce scrawling de Google, après avoir longuement analysé la situation et pesé chacun des arguments pour ou contre, dans son rapport de 2013 « Le référencement des œuvres sur Internet »[2], le Conseil Supérieur de la Propriété Littéraire et Artistique remarquait : « La définition très large du droit de reproduction, tant dans le code de la propriété intellectuelle français que dans la directive du 22 mai 2001 en son article 2 incite à considérer qu’en principe tout acte de reproduction d’une œuvre ou d’un objet protégé doit faire l’objet d’une autorisation préalable. 

Ainsi, théoriquement, et à moins de bénéficier d’une exception, le principe demeure celui d’application du monopole d’exploitation dès lors que les éléments repris s’apparentent à des objets protégés par le code de la propriété intellectuelle. Pour les actes qui nous occupent, la commission s’est essentiellement demandé s’ils étaient susceptibles de bénéficier d’une des exceptions prévues par la loi. » Inutile recherche dans les faits car, au final, il faut constater que l’intérêt d’avoir un point d’entrée unique à l’internet, capable de nous guider dans un contenu qui serait autrement largement inaccessible, supplanta l’interrogation de savoir si l’indexation pouvait bénéficier d’une exception au droit d’auteur.

De manière générale, la régulation est devenue sectorielle : ce référencement posait des problèmes économiques graves aux éditeurs de presse. Plutôt que d’appliquer un droit qui existait déjà, on préféra en créer un de toutes pièces : le droit voisin des éditeurs et agences de presse, afin d’obtenir un transfert économique de Google vers ces éditeurs (Cf. art. L218-1 et suivants du code de la propriété intellectuelle[3]).

D’une approche individuelle basée sur l’exercice d’un droit de propriété et sa capacité à le monnayer, on passe à une approche collective dans laquelle une perception par une société de gestion collective, sur Google, Facebook et autres, alimente une profession selon des règles de répartition à convenir (ce qui n’est jamais simple).

On connaissait déjà cela avec la rémunération pour copie privée, devenue une ressource économique pour les auteurs/compositeurs/artistes (alors qu’il n’y a plus, dans les faits, de copie privée...)

Donc, posons cette prédiction : les moteurs d’IA continueront d’ingurgiter des œuvres sans que le droit d’auteur – individuel – des créateurs des œuvres ingurgitées ne puisse s’y opposer. Dans quelque temps viendra la revendication – sectorielle – des photographes, des illustrateurs, des écrivains, des compositeurs, etc., pour qu’une perception sur les exploitants de ces moteurs d’IA générative soit instituée et vienne ainsi créer une source de revenus collectifs pour ces auteurs, à redistribuer par une société de gestion ad hoc.

La réalité qui change le droit

De l’épure du droit d’auteur, nous nous sommes éloignés avec internet.

Premier hold-up de l’histoire du réseau, ceux qui bénéficiaient de la réalisation de contrefaçons (les réseaux sociaux et sites de partage de contenus) ont aussi bénéficié des largesses d’une jurisprudence qui les a qualifiés d’hébergeurs et d’un législateur européen qui les qualifie maintenant de « plateformes ».

Les mêmes causes devraient produire les mêmes effets. Les IA mangeuses d’œuvres devraient échapper aux griefs de contrefaçon et trouver dans un droit accueillant la protection de leur boulimie.

L’ingurgitation d’œuvres par l’IA trouve déjà sa légitimation dans une exception dont seuls les plus rusés avaient vu l’opportunité.
Le législateur européen n’est pas avare pour saupoudrer les droits patrimoniaux des auteurs d’exceptions altruistes, telle celle prévue par l’article 4 de la directive (UE) 2019/790 du 17 avril 2019 sur le droit d'auteur et les droits voisins dans le marché unique numérique intitulée « Exception ou limitation pour la fouille de textes et de données »[4]. Cette exception au droit de reproduction de l’auteur, à l’objectif mystérieux quand elle fut adoptée en 2019, est ainsi formulée : « Les États membres prévoient une exception ou une limitation aux droits [de reproduction] pour les reproductions et les extractions d'œuvres et d'autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données ».

Cette exception est la sœur jumelle de l’exception prévue à l’article 3 de la même directive qui instaure ce droit à la « fouille » de données dans le seul but de la recherche scientifique. Sur 8 considérants, la directive nous explique l’importance de cette exception pour les organismes de recherche scientifique. Mais, au considérant 18, on apprend qu’une telle exception serait également nécessaire « Afin d'améliorer la sécurité juridique […] et d'encourager également l'innovation dans le secteur privé ».

Une intelligence, pas du tout artificielle mais prévoyante, avait donc réussi en 2019 à faire sanctuariser dans le droit d’auteur, l’exception qui permettrait en 2022 aux ChatGPT, Dall-e, Midjourney et consorts de révéler au public leurs incroyables capacités.

Dans sa proposition de directive de 2016, la Commission n’envisageait l’exception de fouille de données que dans un but de recherche scientifique. L’extension de l’exception aux activités privées a été introduite en 2017, par amendement, lors de la discussion du texte au Parlement européen. Il fallait donc protéger en 2019, contre les auteurs, une activité de « fouille » de données dont peu de monde comprenait l’existence et percevait le devenir. 

Véritable cheval de Troie législatif en faveur de l’IA générative, l’exception au droit de propriété qui était sensée être nécessaire à l’émergence de nouvelles connaissances ou de nouveaux services, sert en réalité à exploiter et concurrencer directement les contenus qui sont exploités au titre de l’exception. C’est faire du neuf avec du vieux, en fait…

L’exception connait une exception[5] : l’auteur peut s’opposer (opt-out) « de manière appropriée », notamment par des procédés lisibles par machine, à ce que ses œuvres soient « fouillées ».

Maigre lot de consolation concédé aux titulaires de droit : comment, concrètement, exercer ce droit d’opposition pour qu’il puisse efficacement être opposé aux moteurs d’IA qui « scrawlent » le web ? Comment s’assurer que cette opposition est respectée ?
Tout ce qui s’absorbe sous forme numérique sera absorbé par l’IA et le droit s’y adaptera.

Dans un communiqué du 12 octobre 2023, la SACEM a fait savoir qu’elle exerçait, au nom de ses membres, ledit droit d’opposition. Peu d’autres sociétés de gestion collective l’ont suivie, certainement pour ne pas donner à penser qu’elles acquiesçaient à un système qui ne peut satisfaire les auteurs. A moins que le futur règlement européen sur l’intelligence artificielle, en cours d’adoption, ne vienne accoucher d’une solution, comme souvent imprécise dans les textes européens des dernières années, qui tend à vouloir ménager des intérêts contradictoires.
Le 29 septembre 2023, 73 sociétés de gestion collective, associations, syndicats ont signé un communiqué appelant à l’adoption dans ce futur règlement d’un article 28b (4) ainsi rédigé : 
« Les fournisseurs de modèles de fondation utilisés dans des systèmes d'IA spécifiquement destinés à générer, avec différents niveaux d'autonomie, des contenus tels que des textes complexes, des images, des sons ou des vidéos ("IA générative") et les fournisseurs qui spécialisent un modèle de fondation dans un système d'IA générative, doivent en outre […] sans préjudice de la législation de l'Union en matière de droit d'auteur, documenter et mettre à la disposition du public un résumé suffisamment détaillé de l'utilisation des données d’apprentissage protégées par la législation sur le droit d'auteur. »
Crédit photo : Freepik.com
Les publications de Etienne Papin
Ils ont aimé cet article
Owen Cambien
Technico Commercial, Astradal