Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.

I Cambiamenti nel Mondo del Hacking dei Chatbot

Le vulnerabilità più evidenti non sono durate a lungo, e le aziende tecnologiche si sono affrettate a chiudere le fessure note. Tuttavia, la vulnerabilità di fondo rimaneva: i chatbot sono progettati per interagire e limitare troppo le conversazioni che li rendono utili è controproducente.

Impedire l’uso di termini come “bomba”, “metanfetamina” e “sarin” sarebbe difficile, dato che hanno utilizzi legittimi in ambiti come storia, medicina e chimica. Ciò che conta è il contesto, ma codificare il contesto richiederebbe di scrivere regole fisse in anticipo, capaci di distinguere tra un avviso di sicurezza e una richiesta mascherata in un’infinità di combinazioni di parole, scenari e argomenti.

I recenti attacchi ai chatbot sembrano più simili a conversazioni piuttosto che ordini diretti. I jailbreakers non chiedono più ai modelli di infrangere le loro regole in modo esplicito, ma piuttosto li persuadono, coccolano o ingannano nel ridurre le difese, rendendo il “proibito” interessante e accettabile nel contesto dialogico.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *