NVIDIA GB10 e DGX Spark: cosa ci fa davvero la gente che lo compra

NVIDIA lo ha presentato al CES di Las Vegas nel gennaio 2025 come “un supercomputer AI per ogni scrivania”. Si chiamava Project DIGITS. Qualche mese dopo, a GTC marzo 2025, l’hanno ribattezzato DGX Spark. Il chip al suo interno si chiama GB10 — Grace Blackwell Superchip — e come primo prezzo annunciato era 3.000 dollari. Alla disponibilità effettiva era già diventato 3.999. A febbraio 2026 NVIDIA ha alzato ulteriormente a 4.699 dollari, citando la solita scarsità di memoria LPDDR5X.

Quasi esattamente lo stesso schema del Mac Mini. La DRAM evidentemente costa cara a tutti.

Però il GB10 è una cosa diversa, e vale la pena capire cosa ci fa davvero la gente che lo compra — non quello che dice il comunicato stampa NVIDIA.

Evoluzione dell'AI computing: da DGX-1 a DGX Spark
Dall’DGX-1 consegnato a OpenAI nel 2016 al DGX Spark da scrivania. Fonte: NVIDIA Newsroom

Cosa c’è dentro

Il GB10 combina una CPU ARM a 20 core con una GPU Blackwell su un singolo package, prodotti a 3nm da TSMC e collegati tramite NVLink C2C. La memoria è condivisa tra CPU e GPU: 128 GB di LPDDR5X con 273 GB/s di banda. Questo numero, 273 GB/s, è quello che determina praticamente tutto quello che il DGX Spark può e non può fare.

Come lo usano in pratica

Le recensioni concrete, quelle di chi ci ha messo le mani sopra davvero (Tom’s Hardware, ServeTheHome, LMSYS, IntuitionLabs), convergono su un punto: il DGX Spark arriva pronto all’uso con CUDA 13.0.2, Docker con GPU passthrough e Ollama già installato. Accendi, colleghi un modello dal catalogo NGC, e nel giro di pochi minuti stai girando PyTorch. Per uno sviluppatore questo è un vantaggio concreto rispetto a mettere insieme una workstation con GPU discrete.

Su Llama 3.1 8B ottiene circa 368 token al secondo in decodifica a batch 32. Per un dispositivo che entra in uno zaino e si attacca a una presa normale, è un numero che fa alzare un sopracciglio.

I modelli da 70 miliardi di parametri girano, ma lentamente. Il collo di bottiglia è esattamente quella banda di memoria: 273 GB/s sono pochi rispetto a quello che richiedono i modelli grandi per generare testo velocemente. Tom’s Hardware è diretto: è un sandbox da sviluppo, non è infrastruttura di produzione.

Il laboratorio LMSYS, che di benchmark sui modelli linguistici se ne intende, ha testato il DGX Spark con SGLang e Ollama su diversi modelli open-weight. La conclusione è analoga: i modelli fino a 14-30 miliardi di parametri girano bene, quelli da 70B in su sono adatti alla prototipazione e alla sperimentazione, non a chi ha bisogno di throughput serio.

A gennaio 2026, con l’aggiornamento software presentato al CES, NVIDIA ha portato miglioramenti fino a 2,5 volte le performance di lancio tramite ottimizzazioni TensorRT-LLM e speculative decoding. Quindi se qualcuno lo ha comprato a ottobre 2025 e poi l’ha aggiornato, oggi ha una macchina sensibilmente più veloce di quella che ha comprato.

Chi ha senso che lo compri

Chi fa ricerca su modelli open-weight e vuole un ambiente CUDA nativo senza dipendere dal cloud. Chi sviluppa agenti autonomi e vuole testare tutto in locale prima di scalare. Chi ha bisogno di girare modelli da 70-200 miliardi di parametri per sperimentare, non per servire utenti in produzione.

Chi non ha senso che lo compri: chi cerca un server di inferenza per produzione. Per quello esistono soluzioni dedicate, anche meno costose per workload specifici.

Due unità collegate via ConnectX permettono di girare modelli fino a 405 miliardi di parametri. A CES 2026 NVIDIA ha mostrato un robot Reachy Mini di Pollen Robotics che girava interamente su DGX Spark. Dimostrazioni, ma dimostrazioni concrete.

Il prezzo da 4.699 dollari è alto. Non scandaloso per quello che fa — 128 GB di memoria unificata con CUDA nativo non li trovi facilmente altrove a quel prezzo — ma è alto. E il fatto che NVIDIA abbia già alzato il prezzo due volte in un anno suggerisce che la domanda c’è, e che la memoria rimane il vincolo.


Fonti:
Tom’s Hardware — NVIDIA DGX Spark Review
ServeTheHome — NVIDIA DGX Spark Review
LMSYS — NVIDIA DGX Spark In-Depth Review
IntuitionLabs — NVIDIA DGX Spark Review
NVIDIA Newsroom — DGX Spark Arrives for World’s AI Developers
ServeTheHome — GB10 Architecture at Hot Chips 2025
– Immagini: NVIDIA Newsroom, uso editoriale

Lascia un commento