Google ha lanciato il suo agent AI più avanzato il giorno del rilascio di GPT-5.2.

Google Lancia il Nuovo Gemini Deep Research Giovedì, Google ha presentato una versione "rinnovata"...

Test e Risultati di Deep Research

In aggiunta, è stato testato su “Humanity’s Last Exam,” un benchmark indipendente di conoscenze generali che presenta compiti estremamente specifici, e su BrowserComp, un benchmark per attività agentiche basate su browser.

Il nuovo agente di Google ha dimostrato di essere superiore nei confronti delle proprie metriche e del benchmark “Humanity’s”. Tuttavia, ChatGPT 5 Pro di OpenAI ha ottenuto risultati sorprendentemente competitivi e ha leggermente superato Google in BrowserComp.

Le valutazioni di benchmark sono risultate obsolete non appena Google ha pubblicato i risultati, visto che lo stesso giorno OpenAI ha lanciato il tanto atteso GPT 5.2, codename “Garlic”. OpenAI afferma che il suo modello più recente supera i concorrenti, in particolare Google, su una serie di benchmark tradizionali, inclusi quelli creati internamente.


Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *