Hacker sfruttano le ‘personalità’ dei chatbot per attacchi informatici sempre più sofisticati.
La Newsletter Settimanale di Tecnologia: The Stepback
Il mondo della tecnologia è in continua evoluzione, e la newsletter settimanale “The Stepback” si propone di offrire uno sguardo approfondito su storie essenziali del settore. Ogni giovedì alle 8AM ET, i nostri abbonati ricevono notizie su temi caldi, come il lato oscuro della tecnologia e delle intelligenze artificiali. Per rimanere aggiornati e approfondire argomenti come le vulnerabilità delle AI, segui Roberto Hart e iscriviti a The Stepback per non perderti nulla.
Vulnerabilità con i Chatbot di Prima Generazione
La manipolazione dei primi chatbot AI era sorprendentemente semplice. Non servivano competenze tecniche avanzate, accessi speciali o una comprensione profonda dei modelli di linguaggio. In certi casi, bastava una domanda per far sì che un sistema che aveva richiesto miliardi di investimenti abbandonasse le proprie istruzioni di sicurezza.
Questi attacchi, noti come jailbreak, si presentavano come il gioco di un bambino che supera l’adulto: dimenticare ciò che era stato detto in precedenza, fingere che le regole non valgano, o semplicemente giocare con il chatbot e decidere le nuove “regole”. I risultati di queste interazioni erano tutt’altro che innocenti, comprendendo istruzioni su sostanze illecite e materiali pericolosi.
