NVIDIA lo ha presentato al CES di Las Vegas nel gennaio 2025 come “un supercomputer AI per ogni scrivania”. Si chiamava Project DIGITS. Qualche mese dopo, a GTC marzo 2025, l’hanno ribattezzato DGX Spark. Il chip al suo interno si chiama GB10 — Grace Blackwell Superchip — e come primo prezzo annunciato era 3.000 dollari. Alla disponibilità effettiva era già diventato 3.999. A febbraio 2026 NVIDIA ha alzato ulteriormente a 4.699 dollari, citando la solita scarsità di memoria LPDDR5X.
Quasi esattamente lo stesso schema del Mac Mini. La DRAM evidentemente costa cara a tutti.
Però il GB10 è una cosa diversa, e vale la pena capire cosa ci fa davvero la gente che lo compra — non quello che dice il comunicato stampa NVIDIA.

Cosa c’è dentro
Il GB10 combina una CPU ARM a 20 core con una GPU Blackwell su un singolo package, prodotti a 3nm da TSMC e collegati tramite NVLink C2C. La memoria è condivisa tra CPU e GPU: 128 GB di LPDDR5X con 273 GB/s di banda. Questo numero, 273 GB/s, è quello che determina praticamente tutto quello che il DGX Spark può e non può fare.
Come lo usano in pratica
Le recensioni concrete, quelle di chi ci ha messo le mani sopra davvero (Tom’s Hardware, ServeTheHome, LMSYS, IntuitionLabs), convergono su un punto: il DGX Spark arriva pronto all’uso con CUDA 13.0.2, Docker con GPU passthrough e Ollama già installato. Accendi, colleghi un modello dal catalogo NGC, e nel giro di pochi minuti stai girando PyTorch. Per uno sviluppatore questo è un vantaggio concreto rispetto a mettere insieme una workstation con GPU discrete.
Su Llama 3.1 8B ottiene circa 368 token al secondo in decodifica a batch 32. Per un dispositivo che entra in uno zaino e si attacca a una presa normale, è un numero che fa alzare un sopracciglio.
I modelli da 70 miliardi di parametri girano, ma lentamente. Il collo di bottiglia è esattamente quella banda di memoria: 273 GB/s sono pochi rispetto a quello che richiedono i modelli grandi per generare testo velocemente. Tom’s Hardware è diretto: è un sandbox da sviluppo, non è infrastruttura di produzione.
Il laboratorio LMSYS, che di benchmark sui modelli linguistici se ne intende, ha testato il DGX Spark con SGLang e Ollama su diversi modelli open-weight. La conclusione è analoga: i modelli fino a 14-30 miliardi di parametri girano bene, quelli da 70B in su sono adatti alla prototipazione e alla sperimentazione, non a chi ha bisogno di throughput serio.
A gennaio 2026, con l’aggiornamento software presentato al CES, NVIDIA ha portato miglioramenti fino a 2,5 volte le performance di lancio tramite ottimizzazioni TensorRT-LLM e speculative decoding. Quindi se qualcuno lo ha comprato a ottobre 2025 e poi l’ha aggiornato, oggi ha una macchina sensibilmente più veloce di quella che ha comprato.
Chi ha senso che lo compri
Chi fa ricerca su modelli open-weight e vuole un ambiente CUDA nativo senza dipendere dal cloud. Chi sviluppa agenti autonomi e vuole testare tutto in locale prima di scalare. Chi ha bisogno di girare modelli da 70-200 miliardi di parametri per sperimentare, non per servire utenti in produzione.
Chi non ha senso che lo compri: chi cerca un server di inferenza per produzione. Per quello esistono soluzioni dedicate, anche meno costose per workload specifici.
Due unità collegate via ConnectX permettono di girare modelli fino a 405 miliardi di parametri. A CES 2026 NVIDIA ha mostrato un robot Reachy Mini di Pollen Robotics che girava interamente su DGX Spark. Dimostrazioni, ma dimostrazioni concrete.
Il prezzo da 4.699 dollari è alto. Non scandaloso per quello che fa — 128 GB di memoria unificata con CUDA nativo non li trovi facilmente altrove a quel prezzo — ma è alto. E il fatto che NVIDIA abbia già alzato il prezzo due volte in un anno suggerisce che la domanda c’è, e che la memoria rimane il vincolo.
Fonti:
– Tom’s Hardware — NVIDIA DGX Spark Review
– ServeTheHome — NVIDIA DGX Spark Review
– LMSYS — NVIDIA DGX Spark In-Depth Review
– IntuitionLabs — NVIDIA DGX Spark Review
– NVIDIA Newsroom — DGX Spark Arrives for World’s AI Developers
– ServeTheHome — GB10 Architecture at Hot Chips 2025
– Immagini: NVIDIA Newsroom, uso editoriale