L’avenir de l’IA générative : Propriété intellectuelle en question
L'essor fulgurant de l'intelligence artificielle générative ces derniers mois a soulevé de nombreuses questions, notamment sur le plan éthique et juridique. Et les récents propos de Mustafa Suleyman, CEO de Microsoft AI, risquent de jeter de l'huile sur le feu en affirmant que tout le contenu web serait "libre d'utilisation".
Un "contrat social" remis en cause
Selon Mustafa Suleyman, le partage d'informations sur Internet depuis les années 90 repose sur un "contrat social" qui stipulerait que tout contenu publié en ligne est libre de droit et peut donc être copié, recréé ou reproduit. Une position pour le moins contestable et qui semble ignorer les notions de propriété intellectuelle et de droit d'auteur.
Le dirigeant nuance tout de même ses propos en évoquant le fichier robots.txt qui permet aux éditeurs d'exclure explicitement leurs contenus de toute indexation ou exploration de données. Mais il considère qu'il s'agit là d'une zone grise qui sera amenée à être tranchée par la justice.
Des pratiques déjà répandues
Cette zone grise, des acteurs majeurs comme Google ou OpenAI l'exploitent déjà allègrement. Comme le révélait le New York Times, les deux entreprises ont littéralement aspiré des millions d'heures de vidéos YouTube, y compris protégées par le droit d'auteur, pour entraîner leurs modèles de langage.
Personne ne tomberait des nues si on apprenait un jour qu'OpenAI en a fait de même.
Une position plus que discutable
La vision de Mustafa Suleyman apparaît donc pour le moins problématique. Considérer que l'ensemble des contenus en ligne, y compris ceux explicitement protégés, peuvent être librement exploités par les entreprises d'IA sans contrepartie ni régulation fait fi du droit fondamental à la propriété intellectuelle.
Cela soulève également la question de la souveraineté des données. Les utilisateurs et créateurs de contenus doivent pouvoir garder la maîtrise de l'utilisation qui est faite de leurs données et créations. Un enjeu crucial à l'heure où le machine learning repose de plus en plus sur l'exploitation massive de données.
Un cadre à définir d'urgence
Face au développement exponentiel de l'IA générative, il apparaît urgent de définir un cadre légal clair et protecteur. Sans cela, le risque est grand de voir les géants du secteur s'arroger un droit d'utilisation illimité sur l'ensemble des contenus disponibles en ligne, au détriment des ayants droit.
Les régulateurs, en Europe comme aux États-Unis, devront trancher rapidement ces questions sous peine de se voir dépasser. Tout l'enjeu sera de trouver un équilibre entre innovation technologique et protection de la propriété intellectuelle. Une équation complexe mais incontournable pour l'avenir d'une IA éthique et responsable.