Silicon Valley investe massicciamente negli “ambienti” per formare agenti di intelligenza artificiale.
Alcuni ambienti sono abbastanza elaborati, consentendo agli agenti AI di utilizzare strumenti, accedere a internet o impiegare varie applicazioni software per completare un compito specifico. Altri sono più ristretti, mirati ad aiutare un agente ad apprendere compiti specifici in applicazioni software aziendali.
Mentre gli ambienti RL attualmente rappresentano una novità a Silicon Valley, esiste già una certa esperienza nell’utilizzo di questa tecnica. Uno dei primi progetti di OpenAI nel 2016 fu la costruzione di “RL Gym”, che era molto simile alla concezione moderna di ambienti. Nello stesso anno, il sistema AI AlphaGo di Google DeepMind ha battuto un campione del mondo nel gioco da tavolo Go, utilizzando anch’esso tecniche di RL in un ambiente simulato.
Ciò che rende unici gli ambienti di oggi è che i ricercatori stanno cercando di costruire agenti AI che utilizzano modelli di trasformatori di grandi dimensioni. A differenza di AlphaGo, che era un sistema AI specializzato che operava in ambienti chiusi, gli agenti AI odierni sono addestrati per avere capacità più generali. I ricercatori di IA hanno oggi un punto di partenza più forte, ma anche un obiettivo complicato in cui potrebbero sorgere più problemi.
