Un grand « pillage numérique » : quand l’IA générative défie le droit d’auteur

Publié le 18 juin 2023 à 13:26

Les artistes sont vent debout contre les IA génératives. Ces dernières seraient responsables d’un pillage en masse de leurs œuvres qui, quand elles sont accessibles en ligne, ont servi à les entraîner, sans la moindre autorisation. La génération de contenus inspirés de leurs œuvres est du plagiat, estiment-ils. Ont-ils la loi de leur côté ? Pas forcément. Mais les choses pourraient bientôt changer.

Morceaux de musique, tableaux, voix, style, rythme… Qu’est-ce-qui échappe encore aux intelligences artificielles (IA) génératives lorsqu’elles sont « entraînées » et qu’elles ingurgitent des milliards de données collectées sur le Web ? Le « datascrapping » (en français, le fait d’aspirer des données) est tel que des artistes préfèrent désormais ne plus rien mettre en ligne, par crainte de voir leur art ou leur style copié et imité à la perfection par un des systèmes d’IA, ces outils qui permettent de générer du texte, du code, de la musique, des voix ou des images.

Cette solution radicale est-elle justifiée ? Le droit d’auteur ne protège-t-il pas justement les artistes et titulaires de droit de telles extrémités ? Contrairement à ce qu’on pourrait penser, la loi, face à l’IA, n’est pas du côté des auteurs, du moins pour l’instant.

Les artistes démunis face à l’IA ?

Et c’est justement pour prouver le contraire qu’une poignée d’artistes et d’ayants droit ont entamé des actions judiciaires contre des entreprises d’IA génératives d’images, aux États-Unis et au Royaume-Uni. Getty Images, une plateforme de photographies protégées par le droit d’auteur, s’est par exemple aperçue que ses images avaient servi à entraîner Stable Diffusion, sans son autorisation.
Ce système d’IA aurait pillé en masse ses photographies, estime cette société qui a porté plainte en février dernier. Un mois plus tôt, trois artistes ont attaqué la même Stable Diffusion, mais aussi ses concurrentes Midjourney et DeviantArt. La raison, identique : des milliards d’images ont été collectés en vue de « l’apprentissage » de ces IA, y compris pour les créations protégées par le droit d’auteur.

Au sein de l’Union européenne, certains vont plus loin en demandant directement au législateur de changer le droit qui, selon eux, ne protégerait pas assez les artistes face à l’IA. Dernière initiative en date, celle de l’UVA (« United Voice Artists »), une organisation qui réunit syndicats et associations des comédiens de voix off de films, séries et animations de nombreux pays – dont la France. Le 24 mai dernier, cette association a adressé un manifeste aux décideurs européens demandant, entre autres, de changer les règles du jeu, inquiète des capacités de l’IA à cloner de très nombreuses voix. Cette dernière souhaite que les collectes de voix à des fins d’entraînements soient préalablement autorisées et contractualisées – contre rémunération. Même chose pour tout clonage de voix, qui doit faire l’objet d’un contrat en bonne et due forme avec la personne concernée, ajoute-t-elle.

Oui, l’IA peut scrapper des œuvres protégées

Car, contrairement à ce qu’on pourrait penser, l’IA peut, dans certains pays, collecter en toute légalité des œuvres protégées pour s’entraîner. C’est le cas en Europe, où la directive sur le droit d’auteur de 2019 – transposée en France et donc applicable dans l’Hexagone – prévoit justement ce cas particulier. Normalement, le droit d’auteur empêche toute utilisation d’une œuvre, sauf autorisation du créateur ou de son ayant droit. Une société ne pourra pas, par exemple, reprendre un morceau des Beatles pour une publicité sans l’accord de ses ayants droit et sans le paiement de quelques royalties salés. Mais il existe des exceptions, et cette directive en a prévu une : l’exception dite de « text and data mining » (le droit de fouilles, en français). Elle vise expressément les systèmes d’IA qui collectent des données pour s’entraîner. Seul garde-fou : si l’auteur s’y est opposé expressément, cette collecte n’est pas possible, lorsqu’il s’agit d’un usage commercial.

Pour comprendre cette exception, il faut se remettre dans le contexte de 2019, date de conception de la directive, estime Arnaud Latil, maître de conférences de droit privé à Sorbonne Université et membre du Sorbonne Center for Artificial Intelligence (SCAI). À l’époque, ChatGPT, Midjourney et tous les autres ne sont pas encore lancés. « Les enjeux d’entraînement d’IA n’étaient pas sur le devant de la scène », explique-t-il. Les législateurs n’ont donc pas eu forcément conscience des conséquences de cette exception.

Problème supplémentaire : la façon dont l’auteur s’oppose à cette collecte n’est pas non plus précisée dans le texte. D’autant qu’en pratique, l’IA ne va ni demander, ni prévenir lorsqu’elle collecte une œuvre d’art ou un titre de musique pour s’entraîner. Elle ne va pas non plus faire la différence entre une œuvre tombée dans le domaine public, ou une œuvre protégée par le droit d’auteur, puisqu’elle scrappe de manière massive, sans distinction. D’ailleurs, la protection par le droit d’auteur n’est pas forcément mentionnée sur un site Web. Or, ce n’est pas parce qu’il n’y a aucune inscription sur une image que celle-ci est tombée dans le domaine public et qu’elle est libre de droits.

Mais aujourd’hui, le contexte est bien différent. Les artistes et les ayants droit sont vent debout contre les IA génératives et leur entraînement qui repose sur leurs œuvres. « La question, même si juridiquement, elle peut sembler réglée, politiquement, elle se pose de manière très importante aujourd’hui. Quid du droit des auteurs dont les œuvres ont été entraînées par des IA génératives ? », se demande Arnaud Latil.

La question se pose d’autant plus quand la « donnée scrappée » en question est la voix. Les comédiens de voix off ou de doublage, qui s’estiment en première ligne dans le « pillage de l’IA », n’hésitent pas à parler de « vol » de leur travail lorsque des IA génératives collectent leurs voix accessibles via des rediffusions, des podcasts ou des publicités diffusées en ligne. L’association Les Voix qui regroupe des artistes de voix de doublage a par exemple lancé plusieurs alertes et recommande aux artistes de multiplier les mentions sur les sites et dans leurs contrats, précisant qu’ils refusent que leurs voix soient utilisées à des fins d’entraînement par l’IA.

Génération de contenus : pour l’instant, c’est le vide (juridique)

Autre sujet épineux, la question des contenus générés par l’IA qui imiteraient à la perfection un style, un genre, ou la voix d’un artiste, ce qui revient à créer de nouvelles œuvres « à la manière » d’un artiste. Le mois dernier, une chanson générée par un système d’IA clonant les styles de Drake et de The Weeknd a rencontré un succès fou avant d’être retirée des plateformes de streaming de musique à la demande d’Universal Music Group.

« Aux États-Unis, des comédiens se sont aussi aperçus, en écoutant des programmes auxquels ils n’avaient jamais participé, qu’il s’agissait de leurs voix, de leurs timbres » dont l’IA s’était inspirée, après avoir été collectées sans autorisation pour s’entraîner. « Il y a des procès en cours, des demandes de retrait. En France, le problème n’est pas encore arrivé, car nous avons tiré la sonnette d’alarme », explique Patrick Kuban, comédien de voix off et co-fondateur de l’association Les Voix.

Ce dernier demande aux politiques de se saisir du problème et de s’accorder sur « un moratoire pour arrêter le pillage généralisé », en plus d’une traçabilité de ce qui a été généré par l’IA – qui indiquerait quels artistes ont donné leurs consentements pour que l’IA utilise leur voix, avec un numéro de licence, une certification RGPD…

Car jusqu’à présent, ce point précis des contenus générés par l’IA n’est tranché par aucun texte. « Là, on n’a aucune réponse. Ce n’est prévu nulle part », confirme Arnaud Latil. Car le droit protège seulement une œuvre en particulier et pas son style – par exemple, la copie d’un tableau de Chagall sera considérée comme contrefaisante, c’est-à-dire violant le droit d’auteur du peintre. Mais un tableau fait à la manière de Chagall ne le sera pas. En droit, on dit souvent que les idées, les styles ou les genres sont de libre parcours. Traduction : on ne protège pas ces éléments par le droit d’auteur. Seul le résultat de la création sera protégé.

Le sujet est devenu si sensible que les Parlementaires européens, lors de leur examen du Règlement sur l’IA, ont ajouté une disposition précisant que l’IA générative devait respecter le droit d’auteur, sans aucune autre indication. Pour le professeur, il faut, dans tous les cas, « adapter le droit d’auteur à l’IA, soit en prévoyant un nouveau texte régissant le droit d’auteur pour l’application à l’IA, soit en réformant le droit existant. Mais, ajoute-t-il, le débat doit s’ouvrir sur le droit d’auteur et l’IA ».

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.

droit d'auteur

Stéphanie Bascou

Votre opinion

Jean-Loup VERTAND dit :

18 juin 2023 à 14:52

J’ai voulu devenir dessinateur de bandes dessinées.
Et j’ai fini ma carrière dans la fonction publique.
Je serai artiste aujourd’hui je serai dégouté.
TOUTEFOIS
J’estime que les IA génératives, même si elles ont scrappé sans relâche internet, ce n’est pas du pillage. Car les oeuvres générées sont toutes originales. Et il s’agit de copier un style mais pas une oeuvre.
Les dessinateurs de bandes dessinées franco belges des années 80/ 2000 ont toutes le même style, le style des gros nez etc … Les artistes en manque d’imagination ont appris les uns des autres, ont recopié les styles. Pareil pour les supers héros entre ceux de Marvel et les DC COMICS
Pour moi c’est horrible ce qui arrivent aux artistes mais ce n’est pas du vol. Juste la puissance créative de l’IA qui s’inspire.
Et quand on dit que CHAT GPT ou les ia Génératives artistiques vont détruire des emplois c’est vrai. Mais elles vont en créer d’autres.
Par ailleurs la technologies supprime des emplois mais qui a besoin aujourd’hui d’un portier dans un hôtel de luxe alors que les portes automatiques s’ouvrent toutes seules ? Les portiers ne vont pas déposer plainte contre l’hôtel ou contre les portes automatiques pour se faire payer pour des emplois fictifs à ouvrir des portes !

Répondre
1. frederic Dupeyré dit :
  
  19 juin 2023 à 14:56
  
  Et si on considère que ce que vous appelez “style” est le fond de commerce de l’artiste (je pense à la voix, comme ici, mais aussi à l’art graphique, la sculpture, la musique, l’écriture…) ? Qu’en est il de la protection de l’œuvre de l’artiste ? D’autre part, beaucoup d’œuvres ne peuvent être utilisées sans le consentement et la rémunération de l’auteur, or, ici, l’IA s’est servi d’œuvres , parfois protégées en vue d’entrainement certes, mais aussi en vue de productions souvent payantes. On pourrait, logiquement, considérer que l’IA à produit une œuvre qui lui est propre en se servant d’une production qui ne lui appartenait pas et dont elle n’avait pas obtenu les droits ni le consentement éclairé de l’artiste. Imaginez maintenant qu’une IA génère du chiffre d’affaires en ayant utilisé une œuvre sans le consentement de l’auteur. Imaginez si l’IA se mettait à produire tellement d’œuvre “à la façon de”, saturant ainsi le marché, de sorte que l’artiste lui-même ne puisse plus utiliser son propre style lors de ses créations, constituant ainsi une concurrence qui pourrait être considérée comme déloyale, imaginez que l’IA produise “à la façon de…” une œuvre qui entacherait la réputation d’un artiste ou irait à l’encontre de ses convictions ou des règles qu’il s’est imposées pour son travail … On peut tout imaginer et vous comprendrez @Jean-Loup VERTAND, que c’est beaucoup plus compliqué qu’il n’y parait.
  
  Répondre
Jean-Loup VERTAND dit :

18 juin 2023 à 15:19

Bonjour,

mon précédent commentaire n’a pas été publié. Pourtant il était très correct.

Il donnait un avis objectif et respectueux.

je pense que, en lisant vos précédents articles (qui traitent tous de vols, pillages, pertes d’emplois à cause de l’ia), que vous avez une opinion très tranchée et que vous ne souhaitez pas de commentaires qui aillent à son encontre.

Ce n’est pas ainsi que je conçois la démocratie et le journalisme.

Répondre
Blanc dit :

18 juin 2023 à 23:15

Les IA ne violent pas plus les droits d’auteur que n’importe quel auteur. Comment croyez-vous que les auteurs créent ? Ils s’inspirent de ce qu’ils ont vu autour d’eux pour en extraire ce qui les intéresse et créer quelque-chose d’unique. L’IA fait exactement la même chose, mais avec plus d’efficacité.

Répondre
1. Gris dit :
  
  19 juin 2023 à 09:50
  
  Tout à fait d’accord avec cette analyse de très très haut niveau, on le voit bien, n’importe qui aurait pu écrire le Petit Prince ! Tout le monde peut faire un Warhol également. Relisez vos classiques : https://fr.wikipedia.org/wiki/%C5%92uf_de_Colomb
  
  Répondre
2. frederic Dupeyré dit :
  
  19 juin 2023 à 14:59
  
  Certes. Par contre, quand une œuvre se rapproche trop d’une autre, il y a procès pour plagiat. Or, je vois passer beaucoup de créa d’IA qui ressemblent de façon troublantes à des productions d’auteurs.
  
  Répondre
Gladstone dit :

19 juin 2023 à 11:32

Les I.A. ne “s’inspirent pas”, c’est une caractéristique humaine tout comme l’amour.
L’humain coupe la branche sur laquelle il est assit. Vous croyez qu’on va se prélasser au soleil et les I.A. feront le taf…

Répondre