L'addestramento dei modelli di intelligenza artificiale più diffusi al giorno d'oggi richiede ingenti quantità di contenuti da "dare in pasto" al soggetto in fase di sviluppo. Innumerevoli immagini, testi e dati vengono quotidianamente raccolti dalle fonti più disparate, senza alcun tipo di autorizzazione pregressa, così da poterli fornire ai modelli AI come preziose risorse, ricche di informazioni da riutilizzare a proprio piacimento.
Dall'avvento di questa tecnologia e della conseguente pratica di furto dei contenuti altrui, diversi professionisti (e non) nel settore creativo hanno cercato di sensibilizzare il prossimo e l'industria all'uso chiaramente irrispettoso del proprio lavoro. A seguito dell'ampliamento di questa pratica, attualmente utilizzata anche per raccogliere dati e informazioni dai siti web di svariate grandi compagnie, quest'ultime si sono rese conto del problema, muovendosi per far fronte alla scomoda situazione.
Di recente, infatti, la compagnia tech statunitense Cloudflare ha introdotto un nuovo sistema in grado di bloccare l'accesso ai siti web da parte dei bot AI il cui ruolo è raccogliere ingenti quantità di dati, conosciuti meglio come "crawlers".