Sora d’OpenAI : Entraîné sur du Contenu de Jeux Vidéo ?
Sora, la nouvelle IA d'OpenAI capable de générer des vidéos à partir de simples descriptions textuelles, fait déjà parler d'elle. Non pas tant pour ses prouesses techniques, mais plutôt pour la provenance des données qui ont servi à l'entraîner. Il semblerait en effet que du contenu de jeux vidéo et de streams Twitch ait été utilisé, sans accord préalable des ayants droit. De quoi soulever de sérieuses questions juridiques sur l'avenir des IA génératives.
Sora, une IA nourrie aux jeux vidéo ?
Depuis son lancement lundi dernier, de nombreux utilisateurs se sont amusés à tester les capacités de Sora en lui soumettant toutes sortes de requêtes. Et force est de constater que l'IA semble avoir une connaissance assez pointue de l'univers vidéoludique. Des clones de Super Mario Bros aux FPS inspirés de Call of Duty en passant par des jeux de combat façon Tortues Ninja, Sora est capable de générer des séquences de gameplay bluffantes de réalisme.
Mais ce n'est pas tout. L'IA reproduit également avec une fidélité déconcertante l'interface typique d'un stream Twitch, allant même jusqu'à y incruster des «deepfakes» de streamers célèbres comme Auronplay ou Pokimane. Tout porte donc à croire qu'OpenAI a entraîné son modèle sur une large base de vidéos de jeux et de streams, sans forcément obtenir le consentement des créateurs de contenus concernés.
Un vide juridique problématique
Si OpenAI reste pour l'instant très évasif sur l'origine exacte des données d'entraînement de Sora, de nombreux experts juridiques s'inquiètent déjà des implications légales. Car le droit d'auteur s'applique aussi bien au contenu des jeux vidéo en eux-mêmes qu'aux vidéos de gameplay créées par les joueurs et streamers.
Les entreprises qui entraînent des modèles sur des vidéos de jeux sans licence prennent de nombreux risques. Il est presque certain que des éléments protégés par le droit d'auteur se retrouvent dans le set d'entraînement.
– Joshua Weigensberg, avocat spécialisé en propriété intellectuelle
Concrètement, si un utilisateur venait à publier une vidéo générée par Sora reproduisant trop fidèlement un contenu protégé, il pourrait être poursuivi pour violation de copyright. Même si les IA génératives opèrent des transformations, la question de leur éligibilité au «fair use» est loin d'être tranchée.
Un futur semé d'embûches pour les IA génératives
Au-delà de Sora, c'est toute la question de l'entraînement des IA sur des contenus protégés sans accord qui se pose. On l'a déjà vu avec les modèles de génération d'images comme Stable Diffusion ou Midjourney, accusés de violer les droits de nombreux artistes. Et les choses risquent de se compliquer encore avec l'avènement des «world models» dont Sora fait partie, capables non seulement de générer des médias mais aussi des expériences interactives complètes comme des jeux vidéo.
Il y a fort à parier que les géants de la tech comme OpenAI n'ont pas fini d'en découdre avec les ayants droit sur ces sujets. Car si l'engouement pour les prouesses des IA ne faiblit pas, leur cadre légal et éthique reste encore largement à définir. Il en va de la protection de la propriété intellectuelle, mais aussi de la juste rétribution des créateurs dont le travail, consciemment ou non, nourrit ces systèmes.
Une chose est sûre : l'émergence des IA génératives redistribue les cartes et force à repenser en profondeur les notions de création et d'originalité. Arriverons-nous à trouver un équilibre entre le progrès technologique et le respect des droits ? La partie ne fait que commencer, mais elle s'annonce d'ores et déjà intense, dans l'univers des jeux vidéo comme ailleurs.