Meta, l’IA, et le débat du droit d’auteur : l’affaire Kadrey
Alors que l'intelligence artificielle générative bouleverse de nombreux secteurs, les géants de la tech font face à des défis juridiques inédits. L'affaire Kadrey contre Meta, qui se déroule actuellement devant les tribunaux américains, illustre parfaitement les enjeux cruciaux autour des droits d'auteur à l'ère de l'IA. Au cœur du litige : l'utilisation par Meta d'un ensemble de données d'ebooks, LibGen, pour entraîner ses modèles de langage Llama.
Zuckerberg s'appuie sur le modèle de YouTube
Pour se défendre, le PDG de Meta Mark Zuckerberg a adopté une stratégie audacieuse lors de sa déposition. Il a établi un parallèle avec YouTube, expliquant que la plateforme vidéo peut héberger temporairement du contenu piraté avant de le supprimer, tout en conservant une majorité de contenus légitimes et sous licence. Zuckerberg semble ainsi justifier l'emploi par Meta de LibGen, qui comprend des œuvres protégées par le droit d'auteur, au motif que la plupart des données utilisées seraient légales.
Les propos de Zuckerberg soulèvent des questions
Cependant, les extraits de la déposition dévoilés cette semaine soulèvent autant de questions qu'ils apportent de réponses. Zuckerberg affirme ne pas bien connaître LibGen, tout en défendant son utilisation. Il reconnaît que Meta doit faire preuve de prudence concernant le matériel protégé, mais rejette l'idée d'une interdiction totale comme celle qui s'appliquerait à un site intentionnellement illégal.
"Vous savez, [si] quelqu'un fournit un site Web et qu'il essaie intentionnellement de violer les droits des gens... c'est évidemment quelque chose dont nous voudrions être prudents."
Mark Zuckerberg lors de sa déposition
De nouvelles allégations des plaignants
Les avocats des plaignants, dont les auteurs à succès Sarah Silverman et Ta-Nehisi Coates, ont déposé mercredi soir une nouvelle version amendée de leur plainte. Celle-ci contient des allégations supplémentaires à l'encontre de Meta :
- L'entreprise aurait croisé les données de LibGen avec des livres sous droits pour décider de la pertinence d'un accord de licence avec un éditeur.
- Les modèles Llama 3 et les futurs Llama 4 seraient entraînés sur LibGen.
- Les chercheurs de Meta auraient tenté de dissimuler l'utilisation de contenus protégés.
- Meta aurait téléchargé des ebooks piratés provenant d'une autre source, Z-Library, jusqu'en avril 2024.
Un débat crucial pour l'avenir de l'IA
L'affaire Kadrey contre Meta est emblématique des défis juridiques posés par l'essor de l'IA générative. De nombreuses entreprises affirment que l'entraînement sur du contenu protégé relève du fair use (usage raisonnable), mais les titulaires de droits contestent farouchement cette interprétation. Au-delà des aspects légaux, ce procès soulève des questions éthiques sur le respect de la propriété intellectuelle à l'ère des intelligences artificielles.
La défense de Meta et de Zuckerberg, s'appuyant sur le modèle de YouTube, témoigne de la complexité du débat. Comment tracer la ligne entre utilisation légitime et violation des droits d'auteur ? Quelle proportion de contenus sous licence rend acceptable l'emploi d'un jeu de données partiellement piraté ?
En attendant que la justice tranche, l'affaire Kadrey contre Meta illustre brillamment les enjeux colossaux autour de la régulation de l'IA générative. Au-delà des géants de la tech, c'est tout l'écosystème de la création qui attend fébrilement les futurs développements juridiques dans ce domaine. L'équilibre entre innovation technologique et protection des droits des créateurs en dépend.