Google ha lanciato il suo agent AI più avanzato il giorno del rilascio di GPT-5.2.
Test e Risultati di Deep Research
In aggiunta, è stato testato su “Humanity’s Last Exam,” un benchmark indipendente di conoscenze generali che presenta compiti estremamente specifici, e su BrowserComp, un benchmark per attività agentiche basate su browser.
Il nuovo agente di Google ha dimostrato di essere superiore nei confronti delle proprie metriche e del benchmark “Humanity’s”. Tuttavia, ChatGPT 5 Pro di OpenAI ha ottenuto risultati sorprendentemente competitivi e ha leggermente superato Google in BrowserComp.
Le valutazioni di benchmark sono risultate obsolete non appena Google ha pubblicato i risultati, visto che lo stesso giorno OpenAI ha lanciato il tanto atteso GPT 5.2, codename “Garlic”. OpenAI afferma che il suo modello più recente supera i concorrenti, in particolare Google, su una serie di benchmark tradizionali, inclusi quelli creati internamente.
