OpenAI avverte: i browser AI potrebbero rimanere sempre vulnerabili ad attacchi di injection.

Ciò che distingue OpenAI è il suo “attaccante automatizzato basato su LLM”. Questo attaccante è fondamentalmente un bot addestrato da OpenAI, utilizzando il rafforzamento dell’apprendimento, per assumere il ruolo di un hacker alla ricerca di modi per insinuare istruzioni malevole in un agente AI. Il bot può testare l’attacco in simulazione prima di utilizzarlo realmente, mostrando come l’AI target immaginerebbe l’attacco e quali azioni adotterebbe.

Il bot può quindi analizzare quella risposta, modificare l’attacco e riprovare. Questa capacità di comprendere il ragionamento interno dell’AI target è qualcosa a cui gli attaccanti esterni non hanno accesso. Pertanto, in teoria, il bot di OpenAI dovrebbe essere in grado di individuare le vulnerabilità più rapidamente rispetto a un attaccante reale.

Si tratta di una tattica comune nei test di sicurezza AI: costruire un agente per trovare i casi limite e testarli rapidamente in simulazione. “Il nostro attaccante addestrato con rafforzamento dell’apprendimento può indirizzare un agente a eseguire flussi di lavoro dannosi sofisticati e a lungo termine che si sviluppano in decine (o persino centinaia) di passi,” ha affermato OpenAI. “Abbiamo anche osservato nuove strategie di attacco che non sono emerse nella nostra campagna di red teaming umana o in rapporti esterni.”

« Torna al paragrafo precedente Continua a leggere »

About The Author

Ignazio Aragona

Editore di Blog.it e già editore delle testate SiciliaNews24.it e Stadionews.it. Coordina le linee strategiche del progetto e supervisiona lo sviluppo editoriale.

See author's posts

Pagine: 1 2 3 4 5 6

About The Author

Ignazio Aragona

Come l’IA sta rivoluzionando i sistemi di difesa globali e la sicurezza nazionale

Meta danneggerà i suoi occhiali smart con scelte controverse e poco innovative.

Le startup revolutionary: 18 aziende fondate da ex studenti di OpenAI.

L’innovativa visione dell’AI secondo The Pitt: un futuro all’insegna della tecnologia avanzata.

General Catalyst investe 5 miliardi di dollari in India nei prossimi cinque anni.

L’ex dirigente di Meta rivela i segreti dietro il potere della pubblicità.

FBI: Cresce il fenomeno del ‘jackpotting’ degli ATM, milionari furti per i pirati informatici.

Ministro uzbeko esplora il polo dell’innovazione a Ostiense: opportunità e collaborazioni future.

La serie “The Hunt” di Apple TV ha finalmente una data di debutto.

Chrome potenzia la produttività con nuove funzionalità mentre infiamma la battaglia dei browser.

Perché essere l’app più popolare al mondo è così vantaggioso?

Reliance annuncia piano investimento di 110 miliardi di dollari in AI per le ambizioni tech indiane.

Lascia un commento Annulla risposta

Baby gang a Piacenza: 5 misure cautelari contro aggressioni e rapine tra coetanei

Unicredit finanzia il piano di investimenti strategici di Blu Ocean per la crescita futura

Arrestato a Boscoreale un 43enne con droga e pistola in un B&B.

Sea Watch: Piantedosi annuncia ricorso contro il risarcimento.

Nuovi concorsi PNRR 2026: 156 assunzioni dalla Presidenza del Consiglio dei Ministri.

Assunzioni in Sicilia: 73 posti per autisti a tempo indeterminato, parte il concorso pubblico.

Emilia Romagna: cercasi 50 operatori scolastici con diploma di scuola dell’obbligo o licenza media.

Università di Firenze: aperto bando per diplomati come collaboratori amministrativi. Candidati ora!

Assunzioni ASL CN1 Piemonte: coadiutori amministrativi a tempo indeterminato per disabili con licenza media.

Gillian Anderson: il fascino gotico degli anni 2000 in vista dei BAFTA. Scoprilo ora!

Baby gang a Piacenza: 5 misure cautelari contro aggressioni e rapine tra coetanei

Re Carlo prende posizione dopo l’arresto di Andrea con una dichiarazione deliberata.

Benefici dell’olio essenziale Thieves: purifica, protegge e rinvigorisce corpo e ambiente

Ciclone Gezani devasta il Madagascar: gravi danni e vittime. Situazione critica.

About The Author

Sapevi che…

Lascia un commento Annulla risposta

Ultimissime