OpenAI fait face à une accusation sérieuse de violation de droits d’auteur en raison de l’utilisation non autorisée d’articles de The New York Times et Daily News pour entraîner ses modèles d’intelligence artificielle.
Les deux journaux poursuivent OpenAI en justice, affirmant que leurs contenus ont été extraits sans autorisation pour alimenter les systèmes d’IA de l’entreprise. Dans le cadre de cette enquête, OpenAI avait accepté de fournir deux machines virtuelles pour permettre aux avocats des plaignants d’examiner les ensembles de données utilisés pour entraîner les modèles. Cependant, un incident inattendu a perturbé les recherches : les ingénieurs d’OpenAI ont accidentellement supprimé des données cruciales stockées sur l’une de ces machines. Malgré les tentatives de récupération des fichiers, la suppression de la structure des dossiers a rendu ces données inutilisables pour déterminer si les articles des journaux avaient été effectivement utilisés.
Lire aussi :
- Comment le nouveau mode chat IA de Brave améliore-t-il l’expérience de recherche en ligne par rapport à Google ?
- Comment cet incident pourrait-il influencer les relations entre les géants de l’IA et les créateurs de contenu ?
Un débat sur la responsabilité et la transparence
Dans une lettre déposée au tribunal, les avocats des plaignants ont exprimé leur frustration, expliquant que cet incident les oblige à refaire plusieurs jours de travail, engendrant des coûts supplémentaires en temps et en ressources. Cependant, ils ont précisé qu’il n’y avait aucune preuve que cette suppression ait été intentionnelle. OpenAI, de son côté, a réagi en niant toute responsabilité, affirmant que le problème était dû à une mauvaise configuration technique demandée par les plaignants eux-mêmes. Ce désaccord met en lumière la difficulté pour les deux parties de coopérer dans le cadre de cette affaire.
La question du fair use dans l’entraînement des IA
Au-delà de cet incident, le procès soulève un débat juridique majeur : l’utilisation de données protégées par le droit d’auteur pour entraîner des modèles d’IA est-elle considérée comme un usage équitable (fair use) ? OpenAI affirme que l’entraînement sur des contenus disponibles publiquement entre dans cette catégorie. Cependant, cette position est contestée, notamment par les éditeurs de presse, qui réclament une rémunération pour l’utilisation de leurs contenus. Dans ce contexte, OpenAI a signé des accords de licence avec certains médias, tels que l’Associated Press et Dotdash Meredith, pour éviter de futures contestations. Les détails financiers de ces accords, toutefois, restent confidentiels.