Guida alla visione del keynote di Jensen Huang al GTC 2026 di Nvidia.
In ambito hardware, ci sono speculazioni riguardo il rilascio di un nuovo chip progettato per accelerare il processo di inferenza AI, ossia il modo in cui un modello AI applica ciò che ha appreso per generare risposte o prendere decisioni. Questo processo è differente da quello di addestramento, che richiede una potenza di calcolo molto maggiore. L’ottimizzazione dell’inferenza è considerata uno degli ultimi colli di bottiglia per la scalabilità delle applicazioni AI. Se confermato, il nuovo chip rappresenterebbe l’ultima mossa di Nvidia per dominare non solo il mercato dell’addestramento, dove già detiene una quota dell’80%, ma anche quello dell’inferenza, in cui la concorrenza con chip personalizzati di Google, Amazon e altri si sta intensificando.
Kevin Cook, stratega senior di equity presso Zacks Investment Research, ha dichiarato a TechCrunch che i partecipanti dovrebbero anche aspettarsi un annuncio riguardante la relazione di Nvidia con Groq. Quest’ultima è l’azienda di inferenza per la quale Nvidia avrebbe sborsato 20 miliardi di dollari l’anno scorso per licenziare la propria tecnologia. C’è molta curiosità riguardo a questa collaborazione, soprattutto considerando che Jonathan Ross, fondatore di Groq, e Sunny Madra, presidente dell’azienda, si sono uniti a Nvidia per aiutare a sviluppare e scalare la tecnologia concessa in licenza.
