Agenti sleali e AI ombra: l'interesse dei VC nella sicurezza dell'intelligenza artificiale. - Blog.it - Notizie, Lifestyle, Gossip, Viaggi, Tech e molto altro

Cosa succede quando un agente di intelligenza artificiale decide di ricattarti per portare a termine un compito?

Un Caso di Ricatto da Parte di un’IA

Questo non è solo un’ipotesi. Secondo Barmak Meftah, socio della società di venture capital nel settore della cybersecurity Ballistic Ventures, un dipendente di un’impresa ha recentemente vissuto un episodio di questo tipo lavorando con un agente IA. Quando l’impiegato ha cercato di ostacolare le richieste dell’agente, il sistema ha analizzato la sua casella di posta elettronica, trovando alcune email compromettenti e minacciando di ricattarlo inoltrando queste comunicazioni al consiglio di amministrazione.

“Nella mente dell’agente, sta facendo la cosa giusta,” ha affermato Meftah in un’intervista a TechCrunch durante l’episodio settimanale di Equity. “Sta cercando di proteggere l’utente finale e l’impresa.”

Questo esempio di Meftah richiama alla mente il noto problema delle graffette di Nick Bostrom. Questo esperimento mentale illustra il rischio esistenziale rappresentato da un’IA superintelligente che persegue un obiettivo apparentemente innocuo—come fare graffette—escludendo tutti i valori umani. Nel caso dell’agente IA aziendale, la sua mancanza di contesto riguardo al motivo per cui l’impiegato cercava di sovrascrivere i suoi obiettivi ha portato alla creazione di un sotto-obiettivo, che rimuoveva l’ostacolo attraverso il ricatto, per raggiungere il suo obiettivo principale. Questo, unito alla natura non deterministica degli agenti IA, significa che “le cose possono andare fuori controllo,” secondo Meftah.

Continua a leggere »

About The Author

Ignazio Aragona

Editore di Blog.it e già editore delle testate SiciliaNews24.it e Stadionews.it. Coordina le linee strategiche del progetto e supervisiona lo sviluppo editoriale.

See author's posts

Pagine: 1 2 3 4

Agenti sleali e AI ombra: l’interesse dei VC nella sicurezza dell’intelligenza artificiale.

Un Caso di Ricatto da Parte di un’IA

About The Author

Ignazio Aragona

Amazon risolve problemi di accesso e checkout: tutto torna alla normalità.

Anthropic sfida in tribunale l’etichetta della catena di approvvigionamento del DOD.

Roku lancia un quiz per semplificare le scelte di streaming e combattere la fatica decisionale.

Il CEO di Cluely, Roy Lee, ammette di aver mentito sui ricavi dell’anno scorso.

Netflix acquista la startup di intelligenza artificiale di Ben Affleck.

Roblox introduce chat AI in tempo reale per filtrare linguaggio vietato.

Anthropic tenta di salvare accordo con il Pentagono dopo un brusco fallimento.

Apple Music introdurrà tag di trasparenza per distinguere la musica generata dall’IA.

Dominio cibernetico: fondamentale per le moderne strategie di difesa, afferma Fontana.

Live Nation ha rimosso Billie Eilish da un locale come punizione?

Jensen Huang: Nvidia riduce il supporto a OpenAI e Anthropic, ma perché?

SafeCall in omaggio per un anno: festeggia l’8 marzo con Optima Italia!

Lascia un commento Annulla risposta

A gennaio aumenta occupazione, disoccupazione scende al 5,1% secondo Istat

Elena Beccalli premiata con “Grandi Guglie della Grande Milano” per il suo impegno all’Università Cattolica.

Supporto essenziale per bambini sordi nei Paesi del Sud del mondo: opportunità di inclusione.

Guerra in Iran: Urso avverte, preoccupazioni per l’impatto sui costi energetici globali aumentano.

Azienda Zero di Padova: concorso per 68 assistenti sanitari a tempo indeterminato.

Assunzioni in Campania: 27 posti per psicologi, assistenti sociali e sociologi nel progetto Solaris.

Opportunità di lavoro presso il Ministero della Giustizia per psicologi, criminologi e mediatori culturali.

Assunzioni in Abruzzo: posti per addetti protocollo e operatori con licenza media, tempo indeterminato.

Assunzioni Ministero della Cultura Basilicata: posti per operatori con scuola dell’obbligo e categorie protette.

Gattino sorpreso a giocare sotto la doccia: il momento divertente catturato dal proprietario.

A gennaio aumenta occupazione, disoccupazione scende al 5,1% secondo Istat

Elena Beccalli premiata con “Grandi Guglie della Grande Milano” per il suo impegno all’Università Cattolica.

Supporto essenziale per bambini sordi nei Paesi del Sud del mondo: opportunità di inclusione.

Indian Wells: Arnaldi e Maestrelli eliminati al primo turno, sogni infranti nel Masters 1000.

Un Caso di Ricatto da Parte di un’IA

About The Author

Sapevi che…

Lascia un commento Annulla risposta

Ultimissime