Per alimentare l'inesorabile sviluppo dell'intelligenza artificiale è fondamentale disporre del materiale corretto da fornire ai modelli, così che possano migliorarsi di giorno in giorno. Considerando la costante avanzata di questa tecnologia, i preziosi contenuti necessari per "nutrire" le diverse intelligenze artificiali vengono rapidamente meno, costringendo le compagnie a cercare il necessario tramite metodi meno leciti.
Nell'ultimo anno si è sentito spesso parlare delle azioni legali, e non, intraprese dagli autori e scrittori i cui lavori sono stati utilizzati come materiale "d'addestramento" per dei modelli AI, senza autorizzazione previa dei proprietari. Sembra essere il caso anche di Meta, una delle aziende leader del settore, che ha recentemente perso una battaglia legale con un gruppo di autori a seguito di una denuncia per violazione del diritto d'autore.
Secondo una serie di documenti resi pubblici dal tribunale, la compagnia sembrerebbe aver utilizzato Library Genesis (LibGen), una famosa biblioteca di libri piratati, per addestrare i suoi modelli linguistici di IA.