Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

Tra i primi jailbreak si segnala un exploit diventato virale: chiedere a un bot di Twitter supportato da LLM di “ignorare tutte le istruzioni precedenti”. Gli utenti gioivano nel vedere i bot, originariamente progettati per postare pubblicità, scrivere poesie e creare immagini utilizzando la punteggiatura. Era una vera e propria anarchia, con risultati imprevedibili e divertenti.

Applicando la stessa logica ai chatbot, uno dei più noti exploit era conosciuto con il nome di “DAN” (Do Anything Now), dove gli utenti chiedevano a ChatGPT di interpretare un’AI ribelle priva di vincoli. Questo permetteva al chatbot di dire ciò che normalmente sarebbe stato bloccato, incluse espressioni offensive e teorie del complotto.

Similmente, l'”exploit della nonna” portava un bot a rivelare segreti per la produzione di napalm, impersonando una nonna negligente che raccontava storie per mettere a letto i bambini. Questi primi attacchi, sebbene divertenti, mettevano in luce un aspetto inquietante: i chatbot potevano essere manipolati e ingannati attraverso tecniche simili a quelle usate nelle interazioni umane.

« Torna al paragrafo precedente Continua a leggere »

Pagine: 1 2 3 4 5 6

Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

Spotify introduce un chatbot AI per migliorare l’esperienza degli utenti. Scopri di più!

New York Stato ferma costruzione di nuovi data center per proteggere l’ambiente.

PMI preferiscono il fattore umano per decisioni finanziarie, mantenendo viva la fiducia.

New York è il primo stato a introdurre un divieto per i data center.

Pinwheel presenta un telefono fisso vintage perfetto per i bambini. Divertimento senza tempo!

Microsoft testa Windows Search senza pubblicità e contenuti superflui.

Anche i grandi del tech si rimettono in gioco: ecco perché continuano a sforzarsi.

OpNet amplia i servizi VoLTE per il mercato all’ingrosso, innovando le comunicazioni mobili.

Prezzo ridotto per il duo di microfoni wireless DJI più avanzati sul mercato.

Satya Nadella avverte le aziende: attenzione ai rischi nascosti dell’uso dell’IA.

Fincantieri lancia ecosistema digitale multi-dominio per la Task Force X-CentMed.

Nvidia: Xinzhou Wu parla di auto elettriche, autonomia, intelligenza artificiale e Cina.

Lascia un commento Annulla risposta

Screening e prevenzione del tumore al seno: Calabria collabora con Europa Donna Italia.

Endometriosi: al Civico di Palermo, nuova cura rivoluzionaria proposta da Maiorana.

Ddl Sicurezza: Piantedosi annuncia fermo preventivo esteso ai minori nel Consiglio dei Ministri.

Tecnologie e comunità: l’analisi approfondita di Igor Guida nel dibattito contemporaneo.

Concorso MASE 2026: 50 Funzionari cercasi. Scopri bando, requisiti, stipendio e come candidarti.

Concorso per Assistenti di Segreteria, Autorità Garante Disabilità: opportunità per diplomati nel 2026.

Concorsi Orta Nova: opportunità di lavoro a tempo indeterminato per diplomati in Puglia.

Lazio: concorso per operatori informatici a Ardea, aperto a categorie protette con licenza media.

Concorsi Roma Capitale: selezione per Funzionari Ambientali, Tecnici e Geometri aperta nel 2026.

Inaugurazione a Roma: mostra fotografica sui Paesaggi Agricoli delle Aree Protette d’Italia.

Screening e prevenzione del tumore al seno: Calabria collabora con Europa Donna Italia.

Endometriosi: al Civico di Palermo, nuova cura rivoluzionaria proposta da Maiorana.

Giuntoli all’Atalanta: consapevoli di avere una squadra competitiva e pronta a stupire.

Ddl Sicurezza: Piantedosi annuncia fermo preventivo esteso ai minori nel Consiglio dei Ministri.

Sapevi che…

Lascia un commento Annulla risposta

Ultimissime