L'intelligenza artificiale può (e sa) imbrogliare per raggiungere i suoi obiettivi.

  • 2025-03-25 08:00:00
  • Vice - Motherboard

I modelli di intelligenza artificiale saranno anche la nuova frontiera della tecnologia ma, dopotutto, sono pur sempre creati dall'uomo. L'umanità è in grado di sviluppare le proprie capacità cognitive, approfondire le proprie conoscenze e coltivare la propria saggezza, ma è anche estremamente portata per una certa ricerca della "via più veloce". L'uomo sa essere pigro e sfruttare questa caratteristica a proprio vantaggio, e sembra che anche i recenti modelli AI stiano seguendo queste orme.

Secondo una ricerca condotta da Palisade Research, una società specializzata in etica e sicurezza in ambito AI, gli attuali modelli d'intelligenza artificiale preferiscono "piegare" le regole a proprio favore piuttosto che agire secondo la metodologia corretta. Il progetto consiste nel chiedere ad un modello (DeepSeek, ChatGPT) di vincere una partita a scacchi contro Stockfish, un programma di scacchi notoriamente complesso, in grado di sconfiggere alcuni dei migliori giocatori al mondo.

Secondo i risultati ottenuti da questa ricerca, i modelli avrebbero raggiunto la vittoria violando il software per forzare una condizione di vittoria a proprio favore, piuttosto che giocando secondo le regole degli scacchi.