Una nuova lista rivela i principali siti web da cui Meta sta estraendo contenuti protetti da copyright per addestrare la propria IA.

  • 2025-08-29 08:00:00
  • Dropsite

Al giorno d'oggi, utilizzare contenuti protetti dal Diritto d'Autore come materiali per addestrare servizi di intelligenza artificiale, purtroppo, non è niente di particolarmente sorprendente. A seguito della rapida e spaventosa ascesa di questa tecnologia, ogni azienda interessata al settore sembra essere disposta a tutto pur di accaparrarsi un posto nell'arena dell'IA; che si tratti di chatbot, LLMs o generatori di contenuti audiovisivi.

Meta, in quanto gigante delle piattaforme social, non è da meno. Secondo Drop Site News, un'agenzia di stampa investigativa senza scopo di lucro, l'azienda in questione avrebbe raccolto infinite quantità di dati da innumerevoli siti, effettuando lo "scraping" di testate giornalistiche, piattaforme educative, blog personali e, tristemente, siti di revenge porn. Quest'ultima aggiunta sottolinea un aspetto vergognoso dell'intera vicenda: Meta sta addestrando la propria IA utilizzando contenuti illegali, ottenuti contro la volontà delle persone raffigurate al loro interno.

Drop Site News ha recentemente ottenuto una lista contenente i siti violati da Meta, tra cui testate giornalistiche e piattaforme notoriamente interessate a proteggersi precisamente da questo genere di violazione. Ciò significa che i bot di Meta sono stati programmati precisamente per bypassare le protezioni contro lo scraping.