La controversia giudiziaria tra Reddit Inc. e Anthropic PBC (società creatrice del modello AI Claude) presso la Corte Superiore di San Francisco il 4 giugno 2025 (San Francisco Superior Court – CGC-25-524892) dice molto delle tensioni ora in gioco sui massimi sistemi dell’intelligenza artificiale e diritti digitali.
Indice degli argomenti
Perché Reddit ha denunciato Anthropic
Reddit ha denunciato Anthropic per presunto utilizzo non autorizzato dei dati della piattaforma per addestrare i suoi modelli di intelligenza artificiale, in particolare il chatbot Claude. Reddit sostiene che Anthropic ha effettuato oltre 100.000 accessi ai dati della piattaforma nonostante il divieto specificato nel file robots.txt
, utilizzato per bloccare i bot di scraping.
Reddit accusa Anthropic di aver violato i termini di servizio e di essersi arricchita ingiustamente utilizzando i contenuti della piattaforma senza il consenso degli utenti. L’azienda afferma di aver già stretto accordi di licenza con altre società come Google e OpenAI, che garantiscono un utilizzo regolamentato dei dati.
Reddit chiede un risarcimento danni, il pagamento della somma guadagnata con l’ingiusto arricchimento e un’ingiunzione che vieti di usare i dati per scopi commerciali
Lo scontro Reddit e Anthropic su AI e diritto d’autore
La scelta di Reddit di articolare la propria azione legale principalmente sui principi della concorrenza sleale, piuttosto che su una mera violazione del copyright, mette in luce le crescenti limitazioni dell’apparato giuridico tradizionale nella tutela dei contenuti digitali e segnala l’emergere di nuovi framework interpretativi più adeguati alle complessità dell’economia dell’intelligenza artificiale.
Tale approccio metodologico assume rilevanza particolare considerando che i contenuti di Reddit, essendo prevalentemente costituiti da post e commenti degli utenti, rischiano di presentare profili di tutela relativa al diritto d’autore decisamente controversi, rendendo la strategia della concorrenza sleale non soltanto preferibile, ma una via preferenziale per l’ottenimento di una tutela giuridica effettiva.
I limiti della protezione Copyright sui contenuti user-generated
L’architettura giuridica del copyright, sviluppata per proteggere opere creative tradizionali caratterizzate da un significativo grado di originalità e creatività, incontra evidenti difficoltà applicative nel contesto dei contenuti generati dagli utenti delle piattaforme digitali. I post di Reddit, le discussioni nei thread, i commenti e le interazioni sociali potrebbero non superare la la soglia di originalità richiesta per la protezione autoriale tout-court, configurandosi invece come forme di comunicazione quotidiana prive del requisito della creatività necessario per l’attribuzione di diritti d’autore.
Questa lacuna strutturale del sistema copyright tradizionale crea quello che potremmo definire un “protection gap” (vuoto di protezione) che potrebbe risultare particolarmente problematico nell’era dell’intelligenza artificiale, dove il valore economico dei contenuti non risiede nella loro singola creatività, ma nella loro capacità aggregata di costituire dataset di addestramento per sistemi di machine learning. Tale valore emergente rischia di sfuggire alle categorie interpretative tradizionali del diritto d’autore, richiedendo per questo motivo strumenti giuridici alternativi e più flessibili.
La dottrina del Fair Use nel training AI e le sue incertezze applicative
La dottrina del fair use, invocata dalle Big Tech per giustificare l’utilizzo di contenuti altresì protetti, presenta inoltre una serie di ambiguità interpretative, non facilmente superabili, che rendono incerta l’applicazione al settore dell’intelligenza artificiale generativa.
Il carattere trasformativo dell’utilizzo, uno degli elementi centrali nella valutazione del fair use, risulta difficilmente definibile nel contesto dell’addestramento di modelli linguistici, dove i contenuti originali vengono sottoposti a processi di elaborazione statistica che ne alterano profondamente la natura senza necessariamente crearne versioni direttamente riconoscibili.
La giurisprudenza americana non ha ancora consolidato un orientamento uniforme sulla questione, creando quindi un contesto di incertezza giuridica che ha reso in qualche modo necessario il ricorso non esclusivo al copyright come strumento di tutela. Questa situazione di incertezza spinge conseguentemente verso l’adozione di strategie giuridiche alternative, come appunto la concorrenza sleale, caratterizzate da maggiore flessibilità interpretativa e maggiore capacità di adattamento alle nuove realtà economiche digitali.
L’Unfair Competition Law californiana come strumento di tutela espansiva
L’Unfair Competition Law californiana (California Business and Professions Code Section 17200 et seq.) offre un framework giuridico significativamente più flessibile e comprensivo rispetto al copyright tradizionale. La normativa californiana definisce come illecita qualsiasi pratica commerciale “illegale, sleale o fraudolenta” (unlawful, unfair, or fraudulent), creando una categoria tripartita che consente di catturare condotte potenzialmente lesive anche quando non configurano violazioni di specifici diritti di proprietà intellettuale.
Questa formulazione ampia e inclusiva permetterebbe di superare alcune criticità categoriali del copyright, consentendo una valutazione più complessiva delle condotte commerciali e del loro impatto competitivo. Nel caso Reddit v. Anthropic, tale approccio consentirebbe quindi di focalizzare l’attenzione non tanto sulla natura giuridica dei singoli contenuti appropriati, quanto sulla modalità e sull’impatto economico dell’appropriazione stessa, spostando il focus dall’ownership alla fairness delle pratiche commerciali, ossia dalla proprietà ai principi di equità concorrenziale.
La teoria della concorrenza sleale permette inoltre di applicare efficacemente il principio dell’arricchimento senza giusta causa, particolarmente rilevante nel contesto del data harvesting per l’intelligenza artificiale. Anthropic ha sviluppato un modello di business del valore di 61,5 miliardi di dollari utilizzando, secondo le allegazioni di Reddit, contenuti appropriati gratuitamente e senza consenso, configurando così un evidente squilibrio economico tra il valore creato e la compensazione corrisposta ai creatori originali dei contenuti.
Questo approccio consentirebbe ovvero di quantificare il danno non soltanto in termini di violazione di diritti specifici, ma soprattutto in termini di valore economico trasferito illegittimamente, aprendo prospettive risarcitorie potenzialmente più ampie e realistiche rispetto ai tradizionali danni da violazione del copyright.
Violazione del robots.txt
Un’ulteriore allegazione verte sulla possibilità che Anthropic abbia deliberatamente ignorato le direttive contenute nei file robots.txt presente su Reddit. Il robots.txt costituisce infatti un standard tecnico industrialmente riconosciuto che formalizza le restrizioni di accesso imposte dai proprietari dei siti web, creando una sorta di “contratto tecnico” la cui violazione evidenzia la mala fede del soggetto che effettua lo scraping.
Questa dimensione tecnico-contrattuale rafforzerebbe la posizione di Reddit, nell’ottica in cui sarebbe stato noto ad Anthropic quali fossero le restrizioni imposte mediante il robot.txt, con una violazione che sarebbe aggravata quindi da un elemento soggettivo doloso.
Data licensing e danno concorrenziale
Un altro elemento cruciale nella strategia legale di Reddit risiede nella dimostrazione dell’esistenza di un mercato legittimo per il licensing dei contenuti digitali destinati all’addestramento di sistemi di IA. Gli accordi stipulati da Reddit con Google (60 milioni di dollari annui) e OpenAI dimostrano chiaramente l’esistenza di un valore economico riconosciuto e quantificabile per l’accesso ai contenuti della piattaforma.
Questa evidenza contrattuale costituisce quindi una prova diretta del danno concorrenziale subito da Reddit, configurando l’appropriazione gratuita operata da Anthropic come una distorsione delle dinamiche competitive del mercato del data licensing. Il prezzo di mercato stabilito negli accordi legittimi fornisce inoltre, aspetto di assoluto rilievo, un parametro oggettivo per la quantificazione del danno economico subito.
La condotta di Anthropic, ove confermata, non danneggerebbe quindi soltanto Reddit bensì l’intero ecosistema economico emergente intorno al data licensing per l’intelligenza artificiale. L’appropriazione gratuita di contenuti che altri operatori acquisiscono attraverso regolari accordi commerciale alimenta infatti quella distorsione competitiva che può compromettere la sostenibilità economica dell’intero modello di business del data licensing su cui si sta fondando l’ecosistema dell’AI Generativa.
Tale prospettiva sistemica rafforza la configurazione della fattispecie di concorrenza sleale, dimostrando che gli effetti della condotta di Anthropic si estendono oltre il rapporto bilaterale con Reddit, impattando negativamente sulle dinamiche competitive dell’intero settore e sulla formazione di un mercato equo e sostenibile per il licensing dei dati di addestramento.
Reddit contro Anthropic: le implicazioni strategiche e procedurali
L’approccio basato sulla concorrenza sleale presenta significativi vantaggi probatori rispetto al tradizionale enforcement del copyright. Mentre la violazione del copyright richiede la dimostrazione di elementi tecnici complessi come l’originalità dell’opera, la sussistenza della protezione e l’effettiva copia sostanziale, la concorrenza sleale si focalizza su elementi più facilmente dimostrabili come l’esistenza di una pratica commerciale, il suo carattere sleale e l’impatto economico negativo.
Questa semplificazione dell’onere probatorio è particolarmente rilevante nel contesto dell’intelligenza artificiale, dove la dimostrazione diretta della riproduzione di contenuti specifici nei modelli addestrati presenta sfide tecniche considerevoli, mentre la dimostrazione dell’utilizzo di dataset e dell’impatto economico risulta più accessibile e convincente per i giudici.
La configurazione della fattispecie di concorrenza sleale apre, come si diceva poc’anzi, prospettive risarcitorie potenzialmente più ampie rispetto al copyright tradizionale. Mentre i danni da violazione del copyright sono tipicamente limitati ai profitti perduti e ai danni effettivamente dimostrabili, la concorrenza sleale consentirebbe in astratto di richiedere la restituzione di tutti gli arricchimenti illecitamente ottenuti dal soggetto che ha posto in essere la condotta sleale.
Dal Fair Use alla “Business Fairness” per il copyright con l’AI
La giurisprudenza americana ha dimostrato crescenti difficoltà nell’applicazione della dottrina tradizionale del fair use ai contenuti generati dall’intelligenza artificiale. Un esempio paradigmatico è rappresentato dalla sentenza Warhol vs. Goldsmith della Corte Suprema degli Stati Uniti, che come si analizzava “può far scuola anche in materia di intelligenza artificiale e software di generazione grafica”, poiché “le implicazioni di questa decisione avranno indubbiamente un impatto rilevante nei settori dell’arte, dell’intrattenimento e del giornalismo, nonché nell’ambito specifico dell’intelligenza artificiale applicata alla fotografia e alla grafica”.
Tale orientamento giurisprudenziale restrittivo sul fair use conferma quindi la necessità di strumenti alternativi di tutela come la concorrenza sleale, che non dipendono dalle incertezze interpretative del copyright ma si basano su principi più chiari di correttezza commerciale. La stessa difficoltà nell’applicazione del fair use emerge dalle prime decisioni giudiziarie specificamente dedicate all’IA, dove “dopo mesi di attesa sulle decisioni degli organi giudiziari statunitensi, è giunta la prima battuta d’arresto giudiziaria per tre artisti statunitensi che avevano citato in giudizio Stability AI”, evidenziando come “l’estrema difficoltà che i legali degli artisti hanno affrontato nell’impostare una causa” basata esclusivamente sul copyright.
La controversia Reddit v. Anthropic si configura quindi come un potenziale leading case destinato a influenzare l’evoluzione della giurisprudenza tecnologica americana ed europea. La scelta strategica di privilegiare la concorrenza sleale rispetto al copyright potrebbe infatti ispirare una nuova generazione di contenziosi caratterizzati da maggiore pragmatismo e flessibilità interpretativa.
Tale evoluzione giurisprudenziale appare particolarmente necessaria considerando la velocità di sviluppo delle tecnologie di intelligenza artificiale, che spesso supera la capacità di adattamento delle categorie giuridiche tradizionali. L’approccio basato sulla fairness delle pratiche commerciali piuttosto che sulla rigida applicazione di diritti di proprietà specifici potrebbe offrire maggiore adattabilità alle future evoluzioni tecnologiche.
L’influenza sui framework regolamentari europei sulla giurisprudenza italiana
Il precedente stabilito dal caso Reddit-Anthropic potrebbe inoltre influenzare significativamente lo sviluppo di futuri framework regolamentari per l’intelligenza artificiale. L’enfasi sulla concorrenza sleale e sulla fairness delle pratiche commerciali si allinea infatti con le tendenze regolamentari emergenti, come l’AI Act europeo, che privilegiano approcci basati su principi generali rispetto a quelli relativi a “contenitori regolatori” più rigidi.
L’integrazione tra tutela contrattuale, concorrenza sleale e principi di equità concorrenziale economica potrebbe costituire il modello per una nuova generazione di normative tecnologiche caratterizzate da maggiore flessibilità e capacità di adattamento alle rapide evoluzioni del settore dell’intelligenza artificiale.
L’esperienza americana della controversia Reddit v. Anthropic potrebbe altresì giocare un ruolo dirimente nell’evoluzione della dottrina e della giurisprudenza italiana, alle prese con l’analisi relative alle pratiche di scraping più disparate. L’approccio basato sulla concorrenza sleale piuttosto che sul mero copyright potrà infatti essere di ispirazione per strategie legali innovative anche nel contesto italiano, dove la maggiore flessibilità dell’articolo 2598 e ss. del Codice Civile offre strumenti interpretativi potenzialmente più adatti alle complessità dell’economia dell’intelligenza artificiale.
In questa prospettiva, il paradigma emergente dalla controversia americana potrebbe costituire un prezioso punto di riferimento per la definizione di nuovi standard di tutela nell’ordinamento italiano, contribuendo all’evoluzione di un diritto tecnologico più equilibrato ed efficace nell’era dell’intelligenza artificiale generativa.