Nvidia è attualmente l’azienda più sulla cresta dell’onda grazie ai suoi chip che hanno reso possibile l’esplosione nello sviluppo di LLM ed IA. Insieme all’hardware però, Nvidia offre anche molte soluzioni software a complemento e una di queste, NeMo, è utile per creare, personalizzare e distribuire modelli linguistici di grandi dimensioni. Questa tecnologia è stata addestrata su una quantità di dati molto elevata ma sembra che parte di quel dataset contenga anche materiale protetto da copyright. Nvidia infatti è stata citata in giudizio da tre autori che hanno affermato che l‘azienda ha utilizzato i loro libri protetti da copyright senza permesso per addestrare il suo NeMo.
Brian Keene, Abdi Nazemian e Stewart O’Nan hanno affermato che i loro lavori facevano parte di un set di dati di circa 196.640 libri che hanno aiutato NeMo a simulare il linguaggio scritto ordinario, prima di essere rimossi in ottobre “a causa di una violazione del copyright“.
In una proposta di class action depositata venerdì sera presso il tribunale federale di San Francisco, gli autori hanno affermato che la rimozione riflette il fatto che Nvidia ha “ammesso” di aver addestrato NeMo sul set di dati, violando così i loro diritti d’autore. Chiedono danni non specificati per le persone negli Stati Uniti le cui opere protette da copyright hanno contribuito ad addestrare i cosiddetti modelli linguistici di NeMo negli ultimi tre anni.
Tra le opere oggetto della causa ci sono il romanzo di Keene del 2008 “Ghost Walk”, il romanzo di Nazemian del 2019 “Like a Love Story” e il racconto di O’Nan del 2007 “Last Night at the Lobster”.
Al momento della stesura di questo articolo, Nvidia non ha ancora rilasciato una dichiarazione in merito. Allo stesso modo, nemmeno gli avvocati degli autori hanno risposto alle richieste di ulteriori commenti.
Anche OpenAI e Microsoft citate in giudizio per la stessa ragione
La causa trascina Nvidia in un crescente numero di contenziosi da parte di scrittori, così come il The New York Times, sull’intelligenza artificiale generativa, che crea nuovi contenuti basati su input come testo, immagini e suoni.
Altre società citate in giudizio per la tecnologia includono OpenAI, che ha creato la piattaforma AI ChatGPT, e il suo partner Microsoft.