L’accès aux données par les développeurs IA préoccupe la concurrence
Alors que l'intelligence artificielle générative connait un essor fulgurant, les enjeux d'accès aux données par les développeurs d'IA préoccupent de plus en plus les autorités de concurrence. Comment stimuler l'innovation tout en garantissant une juste rémunération des ayants droit sur les données utilisées pour entraîner les IA ? Un équilibre délicat sur lequel planchent les régulateurs.
L'accès aux données, nerf de la guerre pour l'IA générative
Pour créer des IA toujours plus performantes, les développeurs ont besoin d'accéder à d'immenses volumes de données textuelles, audio et visuelles. Des milliards de pages web, livres, articles et images sont ainsi « ingérées » par les algorithmes d'apprentissage des IA génératives, sans que les ayants droit soient toujours rémunérés.
Cet enjeu est crucial pour les acteurs en position dominante comme OpenAI (ChatGPT) ou Google (Bard), mais aussi pour une myriade de startups et laboratoires de recherche. L'accès aux données conditionne leur capacité d'innovation.
Sans accès à de larges jeux de données diversifiées, impossible de développer des IA génératives compétitives.
Axelle Lemaire, ancienne Secrétaire d'État au Numérique
Les ayants droits réclament leur dû
En parallèle, éditeurs, artistes, photographes et autres créateurs de contenus s'inquiètent. Ils estiment que les IA s'entraînent sur leurs œuvres sans les rémunérer. Aux États-Unis, des actions en justice ont été lancées contre Stability AI, Midjourney et DeviantArt pour violation de droits d'auteur.
En Europe aussi le sujet est pris très au sérieux. La directive sur le droit d'auteur de 2019 a introduit un droit voisin pour les éditeurs de presse vis-à-vis des plateformes online. Une piste pour l'IA ?
Le cadre légal doit évoluer pour prendre en compte cette nouvelle donne technologique, tout en préservant les droits légitimes des créateurs.
Jean-Philippe Mochon, chef du service juridique du CSPLA (ministère de la Culture)
Vers des licences d'utilisation des contenus ?
Plusieurs pistes sont évoquées par les régulateurs pour résoudre ce dilemme. La mise en place de licences d'utilisation des contenus par l'IA en est une. Elle permettrait :
- De rémunérer les ayants droit via des sociétés de gestion collective
- Aux développeurs d'IA d'accéder légalement aux données nécessaires
Mais le diable se cache dans les détails. Quelles données inclure dans les licences ? Comment calculer la rémunération ? Faut-il distinguer usages commerciaux et non-commerciaux des IA ?
L'Europe en première ligne
La Commission européenne a fait de la régulation de l'IA une priorité. Son projet d'AI Act prévoit des contraintes accrues pour les systèmes d'IA à haut risque, notamment en matière de jeux de données d'entraînement.
Bruxelles veut aussi lancer un projet de loi sur l'accès aux données des entreprises. L'objectif : stimuler le partage volontaire des données. Avec en toile de fond la volonté de muscler la compétitivité européenne en IA face aux géants américains et chinois.
L'Europe doit saisir l'opportunité de l'IA générative pour renforcer sa souveraineté technologique et disposer de champions continentaux.
Thierry Breton, Commissaire européen au marché intérieur
Expérimentation et corégulation
Face à ces enjeux complexes, beaucoup appellent à une approche en deux temps. D'abord une phase d'expérimentation et de dialogue entre les parties prenantes (développeurs, ayants droit, régulateurs...) pour définir ensemble les contours de licences sur les données.
Ensuite, la mise en place d'un cadre de corégulation suffisamment souple pour ne pas freiner l'innovation, mais contraignant pour protéger les droits. Un vaste chantier en perspective, pour une technologie qui bouleverse nos paradigmes.
Les autorités de concurrence, garantes du bon fonctionnement des marchés, seront en première ligne pour veiller à ce que les règles du jeu soient respectées. Avec en ligne de mire le consommateur qui doit pouvoir bénéficier d'IA performantes et éthiques. La partie ne fait que commencer...