Les Recommandations de la CNIL sur la Réutilisation des Données en Ligne
Dans un contexte où les données abondent sur Internet, leur réutilisation soulève de nombreux enjeux éthiques et réglementaires. Comment exploiter ces précieuses ressources tout en respectant la vie privée des individus et les principes du RGPD ? Pour répondre à ces interrogations, la CNIL vient de publier de nouvelles recommandations sur le sujet. Panorama des bonnes pratiques à adopter pour une réutilisation responsable des données disponibles en ligne.
Réutiliser les données publiques d'Internet : un cadre à respecter
Blogs, réseaux sociaux, sites web... Internet regorge de données librement accessibles qui constituent un véritable trésor informationnel. Mais attention, "librement accessible" ne veut pas dire "librement réutilisable" ! Comme le rappelle la CNIL, le fait que des données soient rendues publiques ne les soustrait pas au droit des données personnelles.
"Le régime de protection des données s'applique dès lors que les informations concernent des personnes physiques identifiées ou identifiables, et ce même si elles ont été rendues publiques par les personnes elles-mêmes"
CNIL
Concrètement, cela signifie que la réutilisation de ces données doit respecter les grands principes du RGPD :
- Licéité : il faut disposer d'une base légale (consentement, intérêt légitime...)
- Transparence : les personnes doivent être informées des finalités de la réutilisation
- Proportionnalité : seules les données strictement nécessaires peuvent être collectées et traitées
La CNIL souligne également que certaines catégories de données sensibles (origines, opinions, santé, orientation sexuelle...) sont soumises à des règles encore plus strictes.
Anonymiser les données pour limiter les risques
Pour faciliter la réutilisation des données publiques dans le respect du RGPD, la CNIL recommande de procéder à leur anonymisation. Cette technique consiste à supprimer tous les éléments permettant d'identifier directement ou indirectement une personne. Noms, adresses, photos... Une fois correctement anonymisées, les données échappent au champ d'application du RGPD.
Mais gare aux fausses bonnes idées ! L'autorité met en garde contre les techniques d'anonymisation réversibles comme le cryptage ou la pseudonymisation. Si des moyens raisonnables permettent de ré-identifier les personnes, alors les données ne sont pas réellement anonymes et restent soumises au RGPD.
"Les responsables de traitement doivent être particulièrement vigilants lorsqu'ils anonymisent des jeux de données destinés à être diffusés"
CNIL
Encadrer le web scraping et respecter les conditions de réutilisation
La CNIL s'intéresse également à la pratique du web scraping qui consiste à aspirer de façon automatisée de grandes quantités de données sur des sites web. Si cette technique est en principe licite, elle doit respecter les conditions posées par les éditeurs des sites, notamment via les conditions générales d'utilisation (CGU) et les fichiers robots.txt.
"Les éditeurs de sites peuvent légitimement encadrer ou restreindre le scraping de leurs données, par exemple pour préserver la disponibilité de leurs services"
CNIL
L'aspiration doit aussi se faire avec discernement, sans mettre en péril la sécurité ou la stabilité des sites visés. Les robots doivent respecter un délai raisonnable entre deux requêtes et ne pas chercher à contourner les mesures anti-robots mises en place.
Adopter une approche éthique et responsable
Au-delà du respect de la réglementation, la réutilisation éthique des données requiert une véritable réflexion sur les finalités poursuivies et leurs potentielles dérives. Certains usages prédictifs ou d'influence peuvent en effet se révéler problématiques.
"Il est essentiel d'adopter une approche responsable dans la réutilisation de données, en s'interrogeant sur les biais potentiels, les risques de discrimination ou d'atteintes à la vie privée"
CNIL
En conclusion, si la réutilisation des données publiques d'Internet ouvre de nombreuses opportunités, elle doit se faire de façon raisonnée et proportionnée. En suivant les recommandations de la CNIL, les acteurs pourront exploiter tout le potentiel de ces données dans un cadre éthique et soucieux des droits des personnes. Un équilibre nécessaire à l'heure où les données irriguent toujours plus d'aspects de nos vies.