Adobe sotto accusa per uso improprio di opere degli autori nella formazione dell’IA.
Il Problema Legale dei Materiali Piratati
Il dataset “Books3”, una vasta collezione di 191.000 libri utilizzata per addestrare i sistemi di IA generativa, ha suscitato numerosi problemi legali nel settore tecnologico. Anche il dataset RedPajama è stato menzionato in diverse cause legali. A settembre, è stata intentata una causa contro Apple, accusando la compagnia di aver utilizzato materiali protetti da copyright per addestrare il suo modello di intelligenza artificiale. Tale causa ha citato il dataset e ha accusato l’azienda di copiare opere protette “senza consenso e senza riconoscimento o compenso.” Ad ottobre, una causa simile contro Salesforce ha affermato, anch’essa, che la compagnia aveva utilizzato RedPajama per scopi di addestramento.
Sfortunatamente, questo tipo di controversie legali è diventato piuttosto comune nel panorama tecnologico. Gli algoritmi di IA sono addestrati su enormi dataset e, in alcuni casi, si sospetta che tali dataset includano materiali piratati. A settembre, Anthropic ha accettato di pagare 1,5 miliardi di dollari a vari autori che l’avevano denunciata, accusandola di aver utilizzato versioni piratate delle loro opere per addestrare il suo chatbot, Claude. Questo caso potrebbe rappresentare un potenziale punto di svolta nelle battaglie legali in corso riguardanti il materiale coperto da copyright nei dati di addestramento dell’IA.
