Anthropic: alcuni modelli Claude ora gestiscono conversazioni dannose o abusive.

Nuove funzionalità di Claude: un cambiamento significativo nell’interazione con l’IA

Anthropic ha recentemente annunciato nuove funzionalità per i suoi modelli di intelligenza artificiale, permettendo a Claude di terminare le conversazioni in casi rari e estremi di interazioni dannose o abusive da parte degli utenti. Interessante notare che l’azienda sottolinea di non agire per tutelare gli utenti umani, ma piuttosto per proteggere il modello di IA stesso.

La posizione di Anthropic sui modelli di IA

Per chiarire la posizione dell’azienda, Anthropic non sostiene che i suoi modelli di Claude siano senzienti o possano subire danni a causa delle conversazioni con gli utenti. Secondo le loro dichiarazioni, rimangono “altamente incerti” riguardo allo stato morale potenziale di Claude e di altri modelli di linguaggio avanzati, sia ora che in futuro. La compagnia ha lanciato un programma volto a studiare il “benessere del modello” e afferma di adottare un approccio precauzionale, cercando di identificare e implementare interventi a basso costo per mitigare i rischi legati al benessere del modello.

Continua a leggere »

About The Author

Redazione

See author's posts

Pagine: 1 2 3

Nuove funzionalità di Claude: un cambiamento significativo nell’interazione con l’IA

La posizione di Anthropic sui modelli di IA

About The Author

Redazione

I MacBook con touchscreen di Apple potrebbero avere la funzionalità Dynamic Island.

Multiverse Computing lancia un modello AI compresso gratuito chiamato ‘soonicorn’.

Discord posticipa il lancio globale della verifica dell’età. Motivazioni e impatti attesi.

Instagram ritarda l’implementazione di funzionalità di sicurezza per adolescenti, emerge da un documento legale.

TikTok e MLB insieme: più baseball sul social network per una nuova esperienza!

Waymo avvia servizi di robotaxi in 10 città degli Stati Uniti.

Dopo miliardi di dollari, l’Xbox rimane un mistero per molti.

Stripe e PayPal Ventures investono in Xflow per risolvere i pagamenti B2B internazionali in India.

Il Dipartimento di Giustizia di Trump sfiderà davvero Ticketmaster?

Il conflitto tra Tesla e il DMV della California continua senza conclusione.

Scopri i nuovi AirTag di Apple: disponibili ora per il tuo upgrade ideale.

Anthropic accusa i laboratori cinesi di sfruttare Claude mentre gli USA discutono le esportazioni di chip AI.

Lascia un commento Annulla risposta

Contratti nazionali 2022/24: assente l’atto per i dirigenti, anticipazioni per la scuola.

Due arresti a Roma per rapine armate in gioiellerie e uffici postali.

Certificazioni informatiche: passaggio alla prima fascia senza perdere i titoli precedenti.

41 bis: Equilibrio delicato tra istituzioni e diritti umani in discussione

Concorso ISS: opportunità per collaboratori tecnici diplomati nell’ambito della salute pubblica.

Equitalia Giustizia: assunzioni 2026, pubblicati bandi per 12 posti disponibili.

Oltre 2.000 assunzioni nella PA: nuovi concorsi pubblicati in Gazzetta Ufficiale.

Concorso Vigili del Fuoco 2026: Bando imminente per 400 posti riservati a diplomati.

ARPA Lazio ricerca collaboratori tecnici: scopri i concorsi aperti per nuove assunzioni.

Concorso ISS: opportunità per collaboratori tecnici diplomati nell’ambito della salute pubblica.

Belen Rodriguez rivela il suo segreto hi-tech per una pelle impeccabile. Scopri di più!

Sofia Goggia: orario e numero pettorale nella prima prova di discesa a Soldeu 2026.

“Unconditional”: la nuova serie israeliana su Apple TV esplora amori e relazioni senza limiti.

Autorizzazione di viaggio elettronica (ETA): novità per i visitatori spiegate in breve.

Nuove funzionalità di Claude: un cambiamento significativo nell’interazione con l’IA

La posizione di Anthropic sui modelli di IA

About The Author

Sapevi che…

Lascia un commento Annulla risposta

Ultimissime