Reddit a récemment déposé une plainte contre Anthropic, une start-up spécialisée dans l’intelligence artificielle, pour l’utilisation non autorisée de ses données dans le but d’entraîner des modèles d’IA.
Selon la plainte, déposée devant un tribunal de Californie du Nord, Reddit accuse Anthropic d’avoir utilisé ses données à des fins commerciales sans obtenir l’accord nécessaire. Cette action marque un tournant dans la manière dont les entreprises abordent l’utilisation des données en ligne pour la formation de modèles d’intelligence artificielle.
Lire aussi :
- Comment l’intégration de Reddit Answers peut-elle transformer l’expérience des utilisateurs qui cherchent des réponses précises sur Reddit ?
- Claude Explains : L’IA Anthropic au service de la création de contenu
Les accusations de Reddit
Reddit affirme qu’Anthropic a extrait illégalement des données du site, permettant à la start-up de profiter de ce contenu sans rémunérer les utilisateurs qui l’ont généré. Reddit précise avoir demandé à plusieurs reprises à Anthropic de cesser d’utiliser ses données, mais la start-up a continué d’explorer le site sans autorisation.
Un autre point soulevé par Reddit est le non-respect des fichiers robots.txt, un standard permettant aux propriétaires de sites de demander aux robots d’exploration de ne pas accéder à certaines sections. Reddit accuse Anthropic d’avoir ignoré ces fichiers et d’avoir poursuivi l’exploration de la plateforme plus de 100 000 fois, malgré les demandes explicites de la société.
Les précédents juridiques
Le procès intenté par Reddit s’inscrit dans un contexte plus large, où plusieurs autres entreprises et créateurs de contenu ont engagé des poursuites similaires contre des entreprises d’IA pour l’utilisation non autorisée de leurs données.
Le New York Times a par exemple poursuivi OpenAI et Microsoft pour l’utilisation de ses articles dans l’entraînement de leurs modèles d’IA. D’autres auteurs, comme Sarah Silverman, ont également porté plainte contre Meta pour l’utilisation de leurs livres sans compensation. Ces actions visent à obtenir une compensation et à établir des règles claires sur la manière dont les entreprises technologiques doivent utiliser les données personnelles.
Les demandes de Reddit
Reddit demande à Anthropic des dommages et intérêts pour l’utilisation non autorisée de ses données, ainsi qu’une restitution des bénéfices générés par cette exploitation. Reddit cherche également à obtenir une injonction pour empêcher Anthropic de continuer à utiliser ses données sans autorisation.
L’entreprise met en avant l’importance de protéger la vie privée de ses utilisateurs, tout en soulignant qu’elle est ouverte à des accords formels avec des entreprises d’IA qui respectent les conditions de confidentialité et de rémunération.
Cette affaire pourrait marquer un tournant pour la régulation de l’utilisation des données personnelles dans le domaine de l’intelligence artificielle. Reddit se positionne ainsi comme un défenseur de la protection des données, cherchant à établir des règles strictes sur l’exploitation des contenus générés par les utilisateurs pour la formation des modèles d’IA.