Adobe sotto accusa per uso improprio di opere degli autori nella formazione dell’IA.
Adobe e l’Integrazione dell’IA
Come molte altre aziende tecnologiche, Adobe ha investito significativamente nell’intelligenza artificiale negli ultimi anni. Dal 2023, la compagnia ha introdotto diversi servizi di IA, tra cui Firefly, una suite per la generazione di contenuti multimediali. Recentemente, però, l’adozione spinta di questa tecnologia ha portato a problemi legali, con un nuovo contenzioso che accusa Adobe di aver utilizzato libri piratati per addestrare uno dei suoi modelli di IA.
Un’azione legale collettiva è stata proposta a favore di Elizabeth Lyon, un’autrice dell’Oregon, che afferma che Adobe ha impiegato versioni non autorizzate di vari libri, inclusa la sua opera, per addestrare il programma SlimLM dell’azienda.
Cosa è SlimLM?
Adobe definisce SlimLM come una serie di modelli linguistici leggeri ottimizzati per compiti di assistenza alla documentazione su dispositivi mobili. Secondo l’azienda, SlimLM è stato pre-addestrato usando il dataset SlimPajama-627B, un insieme di dati open-source rilasciato da Cerebras nel giugno 2023. Lyon, che ha redatto diverse guide per la scrittura non-fiction, sostiene che alcune delle sue opere siano state incluse in questo dataset di pre-addestramento utilizzato da Adobe.
La causa di Lyon, riportata da Reuters, segnala che il suo lavoro è stato inserito in un sottoinsieme elaborato di un dataset manipolato, alla base del programma di Adobe: “Il dataset SlimPajama è stato creato copiando e manipolando il dataset RedPajama (incluso il copia della collezione Books3)”, si legge nel documento legale. “Pertanto, essendo una copia derivata del dataset RedPajama, SlimPajama contiene il dataset Books3, incluse le opere protette dell’attrice e dei membri della Classe.”
