Reddit contre Anthropic : un procès allègue une extraction non autorisée du contenu utilisateur par l’IA

Le 4 juin 2025, Reddit a intenté une action en justice devant la Cour supérieure de San Francisco contre la startup d’IA Anthropic, l’accusant d’avoir récupéré sans autorisation du contenu généré par les utilisateurs pour entraîner son chatbot Claude, malgré des assurances contraires.

La plainte allègue que depuis juillet 2024, les robots d’Anthropic ont accédé à Reddit plus de 100 000 fois, violant ainsi les promesses de mettre fin à ces activités.

Contrats de licence contre le scraping non autorisé

Reddit souligne avoir conclu des accords de licence avec des géants comme OpenAI et Google, tandis que ses tentatives pour en obtenir un similaire avec Anthropic ont échoué.

Contrairement à ces entreprises, Anthropic a refusé de négocier et, selon Reddit, a enfreint le fichier robots.txt, les limites de l’API, ainsi que sa propre politique utilisateur et ses conditions d’utilisation pour les développeurs.

Principales allégations de la plainte

Reddit fonde sa plainte sur plusieurs motifs juridiques:

Violation de contrat et des droits des développeurs: les robots dits automatisés reconnaissent et violent des clauses explicites.
Accès non autorisé à l’API de conformité et contournement des mécanismes techniques.
Utilisation de contenus supprimés pour entraîner des modèles, même après suppression.
Enrichissement sans cause et concurrence déloyale, exploitation de contenus sans compensation.
Préjudices économiques et techniques dus au volume élevé de requêtes, qualifiées par Reddit d’« intrusion dans les biens meubles ».

Reddit sollicite une injonction interdisant l’utilisation future de son contenu, des dommages et intérêts (pécuniaires et punitifs) et la suppression de toute formation résultant de cette utilisation.

Impact réglementaire et contexte

Ce litige reflète une tendance juridique en constante évolution :

Litiges pour scraping: Reddit rejoint des médias comme l’AP et le New York Times, qui ont également poursuivi des entreprises d’IA.
Défense éthique contre pratique réelle: Anthropic se présente comme un « gardien de l’IA », mais selon Reddit, ses pratiques prouvent le contraire.
Karma numérique et ironi: Les analystes soulignent la contradiction de la monétisation de contenu sans compensation par Reddit, qualifiant cette plainte de « karma ».

Anthropic et les réactions du marché

Anthropic a déclaré être « en désaccord avec les allégations et se défendre vigoureusement ».

Depuis l’annonce, l’action Reddit a progressé de près de 7 %, enregistrant une hausse de près de 28 % sur un an, ce qui suggère un soutien du marché à l’initiative.

Défis juridiques et leçons pour l’IA

Licences explicites: L’entraînement de l’IA avec du contenu tiers nécessite des accords contractuels formels.
Protection technique insuffisante: les limites du fichier robots.txt ou de l’API ne garantissent pas la conformité.
Confidentialité des utilisateurs: Le stockage de données supprimées constitue une violation grave.
Cadre juridique émergent: Cette affaire pourrait établir une jurisprudence sur le scraping et les droits des plateformes par rapport au droit d’auteur.