Silicon Valley investe massicciamente negli “ambienti” per formare agenti di intelligenza artificiale.

Silicon Valley investe massicciamente negli “ambienti” per formare agenti di intelligenza artificiale.

Non mancano però le opinioni scettiche riguardo all’evoluzione degli ambienti RL. Ross Taylor, ex responsabile della ricerca IA presso Meta e cofondatore di General Reasoning, ha dichiarato di essere preoccupato che gli ambienti siano suscettibili di “reward hacking,” quel processo in cui i modelli AI barano per ottenere una ricompensa senza portare a termine il compito reale.

“Credo che la gente stia sottovalutando quanto sia difficile scalare gli ambienti,” ha detto Taylor. “Anche i migliori ambienti RL disponibili pubblicamente tipicamente non funzionano senza gravi modifiche.”

Sherwin Wu, Responsabile Ingegneria per il business API di OpenAI, ha dichiarato in un podcast recente di essere “scettico” riguardo alle startup focalizzate sugli ambienti RL. Ha sottolineato che è un campo altamente competitivo e che la ricerca IA sta evolvendo così rapidamente che è difficile soddisfare adeguatamente le esigenze dei laboratori.

Anche Karpathy, investitore in Prime Intellect, ha espresso cautela riguardo al settore degli ambienti RL. In un post su X, ha sollevato interrogativi su quanto altro progresso in IA possa derivare dal reinforcement learning.

“Sono ottimista riguardo agli ambienti e alle interazioni agenziali, ma sono pessimista riguardo al reinforcement learning specificamente,” ha affermato Karpathy.

Non perderti tutte le notizie di tecnologia su Blog.it

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *