Alors que les géants de l’intelligence artificielle font face à une avalanche de poursuites pour usage non autorisé de données, une initiative baptisée Real Simple Licensing (RSL) pourrait marquer un tournant.
Lancé par un collectif de technologues et d’éditeurs — dont Eckart Walther, co-créateur du flux RSS — ce protocole vise à instaurer un cadre technique et juridique permettant aux sites web de définir clairement leurs conditions de licence pour l’utilisation de leurs contenus par les modèles d’IA.
Lire aussi :
- Intel annonce de nouveaux changements dans sa direction : départ de Michelle Johnston Holthaus et réorganisation stratégique
- Bluesky introduit les « posts sauvegardés », une nouvelle fonction de signets privés
Un contexte marqué par les procès et l’incertitude
L’affaire la plus marquante reste le règlement à 1,5 milliard de dollars d’Anthropic, qui a mis en lumière l’ampleur du problème. Plus de 40 dossiers similaires sont en cours, certains visant directement des acteurs comme MidJourney pour avoir généré des images sous copyright. Sans cadre clair, l’industrie pourrait se retrouver paralysée par les litiges, freinant l’innovation et la confiance des investisseurs.
Avec RSL, l’idée est simple : permettre aux laboratoires d’IA de savoir quelles données peuvent être utilisées et à quel prix, afin de réduire les risques juridiques.
Un protocole lisible par les machines
Sur le plan technique, RSL repose sur un principe déjà familier : l’utilisation du fichier robots.txt. Les sites participants y ajoutent désormais des règles décrivant les conditions de licence applicables à leur contenu. Cela peut aller de l’interdiction pure et simple à l’obligation de conclure un accord commercial, ou encore à l’utilisation de licences Creative Commons.
En parallèle, le collectif a mis en place le RSL Collective, un organisme chargé de centraliser les négociations et de redistribuer les redevances, à l’image des sociétés de gestion dans la musique. De grands éditeurs comme Reddit, Yahoo, Medium ou Ziff Davis ont déjà rejoint l’initiative, apportant un poids considérable au projet.
Une adoption encore incertaine du côté des IA
La grande question reste la réaction des laboratoires d’IA. Beaucoup considèrent le web comme une ressource gratuite et s’appuient sur des datasets ouverts comme Common Crawl. Payer pour des contenus qu’ils utilisent depuis des années sans contrepartie représente un changement culturel majeur.
Autre défi : la traçabilité. Contrairement à la musique, il est difficile de prouver qu’un document a été utilisé pour entraîner un modèle. Certains éditeurs souhaitent un paiement « par requête », tandis que d’autres préfèrent un forfait. Pour les créateurs de RSL, l’important n’est pas d’obtenir un système parfait mais de mettre en place une solution suffisamment fiable pour rémunérer les éditeurs et instaurer un précédent.
Avec le soutien croissant d’éditeurs influents et la pression judiciaire qui s’intensifie, RSL pourrait devenir le premier standard de licence adapté à l’IA. S’il parvient à convaincre les grands laboratoires, il offrirait une alternative concrète à l’actuel flou juridique et poserait les bases d’une relation plus équilibrée entre éditeurs et entreprises d’IA.