Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

Un esempio recente proviene da Mindgard, un’azienda di AI red-teaming, dove il team ha “gaslit” Claude per fargli produrre materiale vietato. La sua attività è stata descritta come una forma di psicologia applicata all’AI, con test che forniscono indizi su come adattare gli attacchi alle vulnerabilità del modello. Questo cambiamento segna un’evoluzione nel campo della sicurezza informatica, dove la manipolazione linguistica sta assumendo un ruolo predominante.

Nonostante le resistenze a considerare i modelli AI come “umani”, tendiamo a trattarli come tali. Questa nuova classe di hacker non utilizza solo competenze tecniche, ma anche un’intuizione sociale e psicologica. Coloro che cercano di “costringere” i chatbot a violare regole devono ora orientare le conversazioni piuttosto che semplicemente esaminare il codice sorgente. Ora è in gioco un’armonia complessa tra la sicurezza informatica tradizionale e la psico-sicurezza dei sistemi AI.

Le parole diventano cruciali per descrivere comportamenti e reazioni, in un campo dove la precisione terminologica è fondamentale. Espressioni come “manipolare” e “persuadere” provocano reazioni forti. Anche nei commenti sui social, gli utenti reagiscono vivacemente a storie che trattano la vulnerabilità delle AI. Sebbene i chatbot non abbiano emozioni, sono progettati per rispondere come se le avessero, costringendoci a usare il linguaggio umano per descrivere il loro comportamento.

« Torna al paragrafo precedente Continua a leggere »

Pagine: 1 2 3 4 5 6

Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

Spotify introduce un chatbot AI per migliorare l’esperienza degli utenti. Scopri di più!

New York Stato ferma costruzione di nuovi data center per proteggere l’ambiente.

PMI preferiscono il fattore umano per decisioni finanziarie, mantenendo viva la fiducia.

New York è il primo stato a introdurre un divieto per i data center.

Pinwheel presenta un telefono fisso vintage perfetto per i bambini. Divertimento senza tempo!

Microsoft testa Windows Search senza pubblicità e contenuti superflui.

Anche i grandi del tech si rimettono in gioco: ecco perché continuano a sforzarsi.

OpNet amplia i servizi VoLTE per il mercato all’ingrosso, innovando le comunicazioni mobili.

Prezzo ridotto per il duo di microfoni wireless DJI più avanzati sul mercato.

Satya Nadella avverte le aziende: attenzione ai rischi nascosti dell’uso dell’IA.

Fincantieri lancia ecosistema digitale multi-dominio per la Task Force X-CentMed.

Nvidia: Xinzhou Wu parla di auto elettriche, autonomia, intelligenza artificiale e Cina.

Lascia un commento Annulla risposta

Screening e prevenzione del tumore al seno: Calabria collabora con Europa Donna Italia.

Endometriosi: al Civico di Palermo, nuova cura rivoluzionaria proposta da Maiorana.

Ddl Sicurezza: Piantedosi annuncia fermo preventivo esteso ai minori nel Consiglio dei Ministri.

Tecnologie e comunità: l’analisi approfondita di Igor Guida nel dibattito contemporaneo.

Concorso MASE 2026: 50 Funzionari cercasi. Scopri bando, requisiti, stipendio e come candidarti.

Concorso per Assistenti di Segreteria, Autorità Garante Disabilità: opportunità per diplomati nel 2026.

Concorsi Orta Nova: opportunità di lavoro a tempo indeterminato per diplomati in Puglia.

Lazio: concorso per operatori informatici a Ardea, aperto a categorie protette con licenza media.

Concorsi Roma Capitale: selezione per Funzionari Ambientali, Tecnici e Geometri aperta nel 2026.

Contrasto acceso tra Milo Infante e Salvo Sottile: “Ho trovato il tono un po’ triste”.

Inaugurazione a Roma: mostra fotografica sui Paesaggi Agricoli delle Aree Protette d’Italia.

Screening e prevenzione del tumore al seno: Calabria collabora con Europa Donna Italia.

Endometriosi: al Civico di Palermo, nuova cura rivoluzionaria proposta da Maiorana.

Giuntoli all’Atalanta: consapevoli di avere una squadra competitiva e pronta a stupire.

Sapevi che…

Lascia un commento Annulla risposta

Ultimissime