Come ormai appurato, ChatGPT e altre piattaforme di intelligenza artificiale generativa vengono "allenate" su ingenti quantità di immagini provenienti dal vasto mondo di Internet. Può capitare, qualche volta, che parte di questi contenuti siano di dominio pubblico, oppure che vengano concessi tramite licenze. Purtroppo, è ora confermato che la maggior parte dei contenuti tramite i quali l'IA generativa viene "addestrata" non appartengano né alla prima, né alla seconda categoria.
In questo video-saggio proposto da Bloomberg Law, la compagnia illustra e spiega il problema partendo dalle fondamenta della situazione. Suddivide, infatti, la mole di immagini coinvolte in "input", tutti quei soggetti visivi che vengono presi dal world wide web, spesso, senza chiedere alcun tipo di autorizzazione, e "output", i risultati che le intelligenze artificiali generano e diffondono online successivamente.