Il dibattito riguardante l’utilizzo delle opere creative da parte delle aziende di intelligenza artificiale per l’addestramento dei propri modelli sta raggiungendo un punto cruciale. Un’importante causa legale potrebbe stabilire un precedente significativo per il futuro del settore. La discussione non verte più solo sulla questione se l’addestramento AI possa essere considerato “uso lecito”, ma si estende anche all’origine dei dati utilizzati per tale addestramento. Al centro di questo nuovo panorama legale vi è una causa collettiva intentata da un gruppo di autori ed editori contro la società Anthropic.
Anthropic e la causa per violazione del diritto d’autore
La disputa tra innovazione nell’intelligenza artificiale e diritti di proprietà intellettuale sta giungendo a una fase decisiva, tracciando una linea netta. Gli autori sostengono che Anthropic abbia impiegato milioni di libri piratati provenienti da “biblioteche ombra” illegali come LibGen per addestrare i propri modelli. Dopo mesi di contenzioso legale, i querelanti hanno presentato un piano per distribuire un accordo storico da 1,5 miliardi di dollari.
Piano di compensazione per gli autori
Il piano proposto rappresenta una vittoria significativa per i creatori di contenuti, delineando un processo semplificato in cui autori ed editori possono presentare richieste. Per la maggior parte delle opere, si suggerisce una suddivisione equa 50/50 dei fondi, basata su norme consolidate nel settore.
Come affermato dagli autori Charles Graeber e Kirk Wallace Johnson nelle dichiarazioni rese in tribunale, questa causa e il relativo accordo inviano un messaggio chiaro: “è sbagliato rubare”. Inoltre, ricorda alle aziende tecnologiche che “non sono al di sopra della legge e che la nostra proprietà intellettuale non è a disposizione vostra”. Questo sentimento costituisce il nucleo della questione.
Distinzione sull’uso dei dati piratati
Un giudice aveva precedentemente stabilito che l’addestramento AI può essere considerato uso lecito del materiale protetto da copyright; Tale decisione era accompagnata da una condizione fondamentale: era vietato utilizzare dati ottenuti tramite pirateria. Questa distinzione rappresenta ora il messaggio principale dell’intero settore. Ciò implica che le aziende AI non possono più fare affidamento su contenuti estratti o rubati per i loro modelli. Devono documentare meticolosamente le proprie fonti, negoziare licenze e sviluppare modalità legittime per acquisire dati d’addestramento.
Impatto sull’industria AI
Questa battaglia legale funge da campanello d’allarme per gli sviluppatori di intelligenza artificiale, poiché potrebbe trasformare radicalmente il modo in cui queste aziende operano in futuro. Il caso potrebbe fungere da modello per numerose altre cause pendenti relative ai diritti d’autore nell’ambito dell’intelligenza artificiale. La decisione finale riguardo all’accordo sarà presa a breve, con il tribunale previsto ad esaminare il piano dei querelanti questa settimana.
Lascia un commento