Trasforma il tuo data center in una fabbrica di IA ad alte prestazioni con le architetture di riferimento NVIDIA Enterprise.
Panoramica
Le architetture di riferimento NVIDIA Enterprise (Enterprise RA) consentono alle organizzazioni di progettare, distribuire e scalare fabbriche IA ad alte prestazioni utilizzando un'infrastruttura convalidata e ripetibile. Questi design combinano calcolo certificato, networking est-ovest e nord-sud ad alta velocità, strumenti di osservabilità e software per garantire prestazioni scalabili, da cluster a quattro nodi ad ambienti su scala aziendale.
Architetture di riferimento Enterprise
È ora disponibile una suite completa di istruzioni per la configurazione di cluster nel data center.
Casi d'uso
Accelera i carichi di lavoro di IA agentica, physical AI, calcolo ad alte prestazioni (HPC) e simulazione IA con le architetture di riferimento NVIDIA Enterprise collaudate e i sistemi certificati NVIDIA forniti da partner globali. Le configurazioni di cluster dell'infrastruttura principali per la distribuzione di fabbriche IA aziendali sono descritte di seguito.
La configurazione della fabbrica IA NVIDIA RTX PRO™ è progettata per una vasta gamma di carichi di lavoro aziendali, tra cui IA generativa e agentica, analisi dei dati, calcolo visivo e simulazione ingegneristica. Le distribuzioni sono ottimizzate su punti di progettazione da 16 e 32 nodi, fornendo un equilibrio ideale tra prestazioni, scalabilità ed efficienza di distribuzione. Progettati per l'accelerazione universale del carico di lavoro nell'IA aziendale, nella simulazione e nel visual computing, i server NVIDIA RTX PRO sono ottimizzati per ambienti PCIe, rendendoli ideali per data center con spazio, alimentazione e raffreddamento limitati. Progettati appositamente per i carichi di lavoro IA moderni, offrono prestazioni efficienti per l'IA agentica e l'inferenza di modelli linguistici di grandi dimensioni (LLM).
La configurazione della fabbrica IA NVIDIA HGX™ ad alte prestazioni è progettata appositamente per l'addestramento e l'inferenza IA multi-nodo su larga scala, sfruttando i sistemi NVIDIA HGX. Disponibile in design point da 32, 64 e 128 nodi e supportata dalla rete NVIDIA Spectrum-X™, l'architettura è dotata di un design flessibile e ottimizzato per rail che consente un'integrazione efficiente in diversi layout di rack, offrendo prestazioni ad alto throughput e a bassa latenza. Fornisce prestazioni rivoluzionarie per gli utenti esperti di IA che eseguono i carichi di lavoro più impegnativi, consente l'addestramento e l'ottimizzazione di modelli su larga scala e accelera notevolmente l'inferenza. Con una precisione di nuova generazione e interconnessioni ultra veloci, la soluzione offre un throughput dei token fino a 15 volte superiore.
La configurazione NVIDIA NVL72 AI Factory è progettata per addestrare e distribuire modelli da trilioni di parametri, offrendo potenza di calcolo exascale in un singolo rack. Progettato per garantire un throughput elevato dei modelli, l'inferenza multi-utente e l'inferenza in tempo reale su larga scala, consente la nuova generazione di innovazione basata sull'IA. I punti di progettazione della distribuzione sono incentrati su configurazioni da quattro e otto rack. Basata su una rete flessibile e ottimizzata per rail, l'architettura si adatta a diversi layout di rack e design di sistema, offrendo prestazioni ad alta larghezza di banda e a bassa latenza. La piattaforma offre output eccezionali per le fabbriche IA con un'efficienza energetica leader del settore ed è basata su NVIDIA NVLink™ di quinta generazione, Tensor Core FP4 e innovazioni termiche avanzate.
Vantaggi
Sblocca infrastrutture IA scalabili e ad alte prestazioni con configurazioni comprovate e pronte per i partner.
Soddisfa le esigenze intensive di inferenza, ottimizzazione e addestramento IA con architetture che garantiscono un utilizzo completo delle GPU e prestazioni coerenti su cluster multi-nodo.
Espandi facilmente la tua infrastruttura e garantisci una distribuzione scalabile e semplificata per un massimo di 128 nodi. Crea le basi per soluzioni full-stack con il design convalidato NVIDIA Enterprise AI Factory, che sfrutta il nostro ecosistema software.
Semplifica i processi di distribuzione e i design efficienti, riduci la complessità e il costo totale di proprietà (TCO), riducendo al contempo il time-to-value.
Segui modelli di progettazione specifici e standardizzati per ottenere un funzionamento coerente da un'installazione all'altra, ridurre la necessità di un supporto frequente e consentire tempi di risoluzione più rapidi.
Partner
Siamo orgogliosi di collaborare con i principali partner in quanto portano sul mercato architetture di riferimento aziendali e soluzioni per fabbriche IA. I design approvati da questi partner hanno superato il nostro Design Review Board, offrendo indicazioni che meritano la nostra approvazione in una o più delle seguenti categorie: infrastruttura, logica di rete e software.
Sovereign AI OS Reference Architecture di Palantir è basata sulle architetture di riferimento NVIDIA Enterprise, testate e qualificate per eseguire la suite software completa di Palantir sull'infrastruttura NVIDIA AI con i nostri partner di sistema globali. Questa architettura IA sovrana è fondamentale per i clienti con flussi di lavoro sensibili alla latenza, requisiti di sovranità dei dati e un'elevata distribuzione geografica. L'architettura fornisce alle aziende un controllo totale sui propri dati, sui modelli IA e sulle applicazioni.
Risorse
NVIDIA ha creato una fabbrica IA unificata per scalare i flussi di lavoro di IA generativa e agentica in tutta l'azienda, garantendo sicurezza, prestazioni e coerenza. La piattaforma supporta centinaia di agenti IA che accelerano l'innovazione, semplificano la progettazione software e hardware e ottimizzano le operazioni della supply chain, riducendo i tempi di pianificazione di oltre il 95% e conseguendo in solo anno un lavoro di progettazione di decenni.