Claude di Anthropic: aiutare, essere onesti e proteggere l’umanità sono le priorità fondamentali.

Claude di Anthropic: aiutare, essere onesti e proteggere l’umanità sono le priorità fondamentali.

Vincoli e Valori Fondamentali di Claude

Amanda Askell, filosofa con formazione PhD e parte di Anthropic, ha chiarito che nella nuova Costituzione è presente un elenco specifico di limiti al comportamento di Claude, per evitare azioni estremamente dannose. Questi vincoli includono la proibizione di fornire supporto a chi intende sviluppare armi di distruzione di massa o attaccare infrastrutture critiche. Inoltre, non è consentito a Claude di creare armi informatiche e codici malevoli, rendendo chiaro che ogni azione deve essere orientata a prevenire danni significativi.

Le linee guida stabiliscono anche valori fondamentali che Claude deve rispettare, ordinandoli in base a importanza quando questi entrano in conflitto. Questi valori comprendono la sicurezza generale, l’etica, la conformità alle linee guida di Anthropic e l’impegno a risultare “genuinamente utile”. Tra queste istruzioni, catturano l’attenzione le indicazioni su come trattare argomenti sensibili politicamente, enfatizzando la necessità di accuratezza e imparzialità.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *