Architetture di riferimento NVIDIA Enterprise

Architetture di riferimento Enterprise

Costruisci fabbriche di IA scalabili

Trasforma il tuo data center in una fabbrica di IA ad alte prestazioni con le architetture di riferimento NVIDIA Enterprise.

Inizia

Leggi il whitepaper | Scopri i sistemi certificati NVIDIA

Inizia

Panoramica

Le fondamenta per il successo dell’IA

Le architetture di riferimento NVIDIA Enterprise (Enterprise RA) consentono alle organizzazioni di progettare, distribuire e scalare fabbriche IA ad alte prestazioni utilizzando un'infrastruttura convalidata e ripetibile. Questi design combinano calcolo certificato, networking est-ovest e nord-sud ad alta velocità, strumenti di osservabilità e software per garantire prestazioni scalabili, da cluster a quattro nodi ad ambienti su scala aziendale.

Palantir collabora con NVIDIA per fornire Sovereign AI Operating System Reference Architecture

Leggi il comunicato stampa

Design collaudato e prestazioni convalidate

Scopri come le Enterprise RA, basate su distribuzioni del mondo reale e configurazioni collaudate in campo, semplificano la pianificazione e massimizzano il ROI per un'infrastruttura IA scalabile.

Leggi il white paper

Architetture di riferimento Enterprise

Guida alla gamma completa

È ora disponibile una suite completa di istruzioni per la configurazione di cluster nel data center.

Infrastruttura

Le architetture di riferimento NVIDIA Enterprise partono da configurazioni hardware convalidate, tra cui pattern di nodi di rete CPU-GPU, diagrammi di cablaggio e dettagli dell'infrastruttura.

Logica di rete

La Networking Configuration and Logical Architecture Logic Guide for Enterprise RAs fornisce istruzioni per la gestione e il provisioning dei nodi attraverso la progettazione VLAN e la simulazione di rete su NVIDIA Air.

Software

Il nostro stack di riferimento software per le Enterprise Reference Architectures (RA) delinea il software per gestire, eseguire il provisioning e dimensionare i cluster dell'infrastruttura. Le versioni attuali si concentrano su Kubernetes open source, con il software NVIDIA AI Enterprise e NVIDIA Run:ai.

Osservabilità

La Guida all'osservabilità per le NVIDIA Enterprise Reference Architectures utilizza strumenti open source, come Prometheus e Grafana, per monitorare le prestazioni della GPU e di rete nell'intero cluster. I dashboard forniscono metriche in tempo reale sullo stato del sistema e sull'efficienza del carico di lavoro.

Distribuzione

La guida alla distribuzione per NVIDIA Enterprise Reference Architectures è una raccolta di best practice per l'infrastruttura che il nostro team ha appreso attraverso la creazione, la distribuzione, i test e la convalida dei cluster interni su cui abbiamo costruito il nostro programma.

Storage

L'NVIDIA-Certified Storage Program è un'iniziativa complementare promossa da partner selezionati che hanno creato guide allo storage progettate per essere integrate nelle Enterprise RA. Scopri di più su questo programma unico.

Casi d'uso

Progettato per ogni scenario di utilizzo

Accelera i carichi di lavoro di IA agentica, physical AI, calcolo ad alte prestazioni (HPC) e simulazione IA con le architetture di riferimento NVIDIA Enterprise collaudate e i sistemi certificati NVIDIA forniti da partner globali. Le configurazioni di cluster dell'infrastruttura principali per la distribuzione di fabbriche IA aziendali sono descritte di seguito.

Fabbrica IA NVIDIA RTX PRO
Fabbrica IA NVIDIA HGX
Fabbrica IA NVIDIA NVL72

Fabbrica IA NVIDIA RTX PRO

La configurazione della fabbrica IA NVIDIA RTX PRO™ è progettata per una vasta gamma di carichi di lavoro aziendali, tra cui IA generativa e agentica, analisi dei dati, calcolo visivo e simulazione ingegneristica. Le distribuzioni sono ottimizzate su punti di progettazione da 16 e 32 nodi, fornendo un equilibrio ideale tra prestazioni, scalabilità ed efficienza di distribuzione. Progettati per l'accelerazione universale del carico di lavoro nell'IA aziendale, nella simulazione e nel visual computing, i server NVIDIA RTX PRO sono ottimizzati per ambienti PCIe, rendendoli ideali per data center con spazio, alimentazione e raffreddamento limitati. Progettati appositamente per i carichi di lavoro IA moderni, offrono prestazioni efficienti per l'IA agentica e l'inferenza di modelli linguistici di grandi dimensioni (LLM).

Vedi le specifiche di configurazione del cluster

Fabbrica IA NVIDIA HGX

La configurazione della fabbrica IA NVIDIA HGX™ ad alte prestazioni è progettata appositamente per l'addestramento e l'inferenza IA multi-nodo su larga scala, sfruttando i sistemi NVIDIA HGX. Disponibile in design point da 32, 64 e 128 nodi e supportata dalla rete NVIDIA Spectrum-X™, l'architettura è dotata di un design flessibile e ottimizzato per rail che consente un'integrazione efficiente in diversi layout di rack, offrendo prestazioni ad alto throughput e a bassa latenza. Fornisce prestazioni rivoluzionarie per gli utenti esperti di IA che eseguono i carichi di lavoro più impegnativi, consente l'addestramento e l'ottimizzazione di modelli su larga scala e accelera notevolmente l'inferenza. Con una precisione di nuova generazione e interconnessioni ultra veloci, la soluzione offre un throughput dei token fino a 15 volte superiore.

Vedi le specifiche di configurazione del cluster

Fabbrica IA NVIDIA NVL72

La configurazione NVIDIA NVL72 AI Factory è progettata per addestrare e distribuire modelli da trilioni di parametri, offrendo potenza di calcolo exascale in un singolo rack. Progettato per garantire un throughput elevato dei modelli, l'inferenza multi-utente e l'inferenza in tempo reale su larga scala, consente la nuova generazione di innovazione basata sull'IA. I punti di progettazione della distribuzione sono incentrati su configurazioni da quattro e otto rack. Basata su una rete flessibile e ottimizzata per rail, l'architettura si adatta a diversi layout di rack e design di sistema, offrendo prestazioni ad alta larghezza di banda e a bassa latenza. La piattaforma offre output eccezionali per le fabbriche IA con un'efficienza energetica leader del settore ed è basata su NVIDIA NVLink™ di quinta generazione, Tensor Core FP4 e innovazioni termiche avanzate.

Vedi le specifiche di configurazione del cluster

Vantaggi

Il valore strategico delle architetture di riferimento Enterprise

Sblocca infrastrutture IA scalabili e ad alte prestazioni con configurazioni comprovate e pronte per i partner.

Prestazioni di picco per carichi di lavoro IA

Soddisfa le esigenze intensive di inferenza, ottimizzazione e addestramento IA con architetture che garantiscono un utilizzo completo delle GPU e prestazioni coerenti su cluster multi-nodo.

Scalabilità flessibile, operazioni semplificate

Espandi facilmente la tua infrastruttura e garantisci una distribuzione scalabile e semplificata per un massimo di 128 nodi. Crea le basi per soluzioni full-stack con il design convalidato NVIDIA Enterprise AI Factory, che sfrutta il nostro ecosistema software.

Ridurre la complessità e il TCO

Semplifica i processi di distribuzione e i design efficienti, riduci la complessità e il costo totale di proprietà (TCO), riducendo al contempo il time-to-value.

Sostenibilità

Segui modelli di progettazione specifici e standardizzati per ottenere un funzionamento coerente da un'installazione all'altra, ridurre la necessità di un supporto frequente e consentire tempi di risoluzione più rapidi.

Partner

Partner per le prestazioni

Siamo orgogliosi di collaborare con i principali partner in quanto portano sul mercato architetture di riferimento aziendali e soluzioni per fabbriche IA. I design approvati da questi partner hanno superato il nostro Design Review Board, offrendo indicazioni che meritano la nostra approvazione in una o più delle seguenti categorie: infrastruttura, logica di rete e software.

Inizia

Sovereign AI OS Reference Architecture Palantir con NVIDIA

Sovereign AI OS Reference Architecture di Palantir è basata sulle architetture di riferimento NVIDIA Enterprise, testate e qualificate per eseguire la suite software completa di Palantir sull'infrastruttura NVIDIA AI con i nostri partner di sistema globali. Questa architettura IA sovrana è fondamentale per i clienti con flussi di lavoro sensibili alla latenza, requisiti di sovranità dei dati e un'elevata distribuzione geografica. L'architettura fornisce alle aziende un controllo totale sui propri dati, sui modelli IA e sulle applicazioni.

Scopri di più

Risorse

Scopri di più sulle architetture di riferimento Enterprise

Architettura di riferimento NVIDIA RTX PRO AI Factory

La configurazione NVIDIA RTX PRO AI Factory supporta una vasta gamma di carichi di lavoro aziendali, tra cui l'inferenza IA agentica, l'IA fisica e industriale, il calcolo visivo e il calcolo ad alte prestazioni per l'analisi dei dati e la simulazione. Questo documento descrive in dettaglio i componenti hardware alla base di questa architettura scalabile e modulare.

Leggi il white paper

Architettura di riferimento NVIDIA HGX AI Factory

La configurazione NVIDIA HGX AI Factory è incentrata sull'inferenza IA ad alte prestazioni, sull'addestramento dei modelli e sull'ottimizzazione. Questo documento delinea i componenti hardware di un'architettura scalabile e modulare, tra cui indicazioni per cluster e topologie di fabric di rete utilizzate per interconnettere il cluster.

Leggi il white paper

Sblocca un throughput enorme dei token con NVIDIA Run:ai

Il benchmarking congiunto con Nebius mostra che le distribuzioni GPU frazionarie che utilizzano NVIDIA Run:ai su NVIDIA Enterprise Reference Architectures migliorano significativamente il throughput e l'utilizzo per i carichi di lavoro LLM di produzione.

Leggi il blog

Panoramica dell'architettura di riferimento NVIDIA Enterprise

Questo whitepaper presenta le architetture di riferimento NVIDIA Enterprise che forniscono una guida collaudata per progettare e creare fabbriche IA per distribuzioni di livello aziendale da 32 a 1.024 GPU. Queste architetture aiutano a semplificare la distribuzione dell'infrastruttura IA, a ridurre la complessità operativa e ad accelerare il time-to-value.

Leggi il white paper

Reti nord–sud: la chiave per carichi di lavoro IA aziendali più veloci

Le architetture di riferimento aziendali di NVIDIA guidano le organizzazioni nella distribuzione di fabbriche IA che utilizzano reti nord-sud e est-ovest, fornendo ricette di progettazione per un'infrastruttura IA scalabile, sicura e ad alte prestazioni.

Leggi il blog

Distribuire NVIDIA H200 NVL su larga scala con una nuova architettura di riferimento aziendale

NVIDIA H200 NVL accelera la distribuzione dell'IA con memoria migliorata, NVLink ad alta velocità e una configurazione Enterprise RA ottimizzata.

Leggi il blog

La fabbrica di intelligenza artificiale (IA) di NVIDIA promuove l'innovazione aziendale su larga scala

NVIDIA ha creato una fabbrica IA unificata per scalare i flussi di lavoro di IA generativa e agentica in tutta l'azienda, garantendo sicurezza, prestazioni e coerenza. La piattaforma supporta centinaia di agenti IA che accelerano l'innovazione, semplificano la progettazione software e hardware e ottimizzano le operazioni della supply chain, riducendo i tempi di pianificazione di oltre il 95% e conseguendo in solo anno un lavoro di progettazione di decenni.

Scopri i risultati chiave

NVIDIA Blackwell Ultra offre prestazioni fino a 50 volte migliori e costi 35 volte inferiori per l'IA per agenti

Progettata per accelerare la nuova generazione di IA per agenti, NVIDIA Blackwell Ultra offre prestazioni di inferenza rivoluzionarie con costi notevolmente inferiori. I fornitori di cloud come Microsoft, CoreWeave e Oracle Cloud Infrastructure stanno distribuendo sistemi NVIDIA GB300 NVL72 su larga scala per casi d'uso a bassa latenza e con contesti estesi, come la codifica agentica e gli assistenti di codifica.

Ciò è reso possibile dalla profonda co-progettazione tra NVIDIA Blackwell, NVLink™ e NVLink Switch per la scalabilità, NVFP4 per la precisione a bassa latenza e NVIDIA Dynamo e TensorRT™ LLM per la velocità e la flessibilità, nonché dallo sviluppo con i framework della community SGLang, vLLM e molto altro ancora.

Scopri i risultati chiave

Prossimi passi

È tutto pronto per iniziare?

Scopri di più su NVIDIA Enterprise AI Factory.

Inizia

Approfondisci le architetture di riferimento NVIDIA Enterprise

Scopri come le architetture di riferimento NVIDIA Enterprise forniscono blueprint scalabili e prescrittivi per distribuire un'infrastruttura IA ad alte prestazioni.

Leggi il white paper

CPU (ammissibili)	2x 64c Intel Xeon 2x 64c AMD EPYC
GPU	8 NVIDIA RTX PRO™ 6000 Blackwell Server Edition
Networking (Est-Ovest)	4x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
Networking (nord-sud)	1x BlueField-3 B3220 (2x 200 Gb)
Memoria host (min)	Min 1.024 GB DDR5 ECC (1x DIMM per slot)
Unità di avvio host (min)	1x NVMe da 1 TB
Storage host (Min)	2 x NVMe da 4 TB

CPU (ammissibili)	2x 64c Intel Xeon 2x 64c AMD EPYC
GPU	8 GPU NVIDIA Blackwell Ultra
Networking (Est-Ovest)	8x NVIDIA® BlueField®-3 B3140H (1x 400 Gb)
Networking (nord-sud)	1x BlueField-3 B3220 (2x 200 Gb)
Memoria host (min)	Min DDR5 ECC da 1.536 GB (1 DIMM per slot)
Unità di avvio host (min)	1x NVMe da 1 TB
Storage host (Min)	2 x NVMe da 4 TB

CPU	2x 72c NVIDIA Grace™ (36 per rack)
GPU	4x GPU NVIDIA Blackwell (72 per rack)
Networking (Est-Ovest)	4x NVIDIA® ConnectX®-7 (1x 400 Gb)
Networking (nord-sud)	2x NVIDIA BlueField®-3 B3240 (4x 200 Gb)

Architetture di riferimento Enterprise

Costruisci fabbriche di IA scalabili

Le fondamenta per il successo dell’IA

Palantir collabora con NVIDIA per fornire Sovereign AI Operating System Reference Architecture

Design collaudato e prestazioni convalidate

Guida alla gamma completa

Infrastruttura

Logica di rete

Software

Osservabilità

Distribuzione

Storage

Progettato per ogni scenario di utilizzo

Fabbrica IA NVIDIA RTX PRO

Fabbrica IA NVIDIA HGX

Fabbrica IA NVIDIA NVL72

Il valore strategico delle architetture di riferimento Enterprise

Prestazioni di picco per carichi di lavoro IA

Scalabilità flessibile, operazioni semplificate

Ridurre la complessità e il TCO

Sostenibilità

Partner per le prestazioni

Sovereign AI OS Reference Architecture Palantir con NVIDIA

Scopri di più sulle architetture di riferimento Enterprise

Architettura di riferimento NVIDIA RTX PRO AI Factory

Architettura di riferimento NVIDIA HGX AI Factory

Sblocca un throughput enorme dei token con NVIDIA Run:ai

Panoramica dell'architettura di riferimento NVIDIA Enterprise

Reti nord–sud: la chiave per carichi di lavoro IA aziendali più veloci

Distribuire NVIDIA H200 NVL su larga scala con una nuova architettura di riferimento aziendale

La fabbrica di intelligenza artificiale (IA) di NVIDIA promuove l'innovazione aziendale su larga scala

NVIDIA Blackwell Ultra offre prestazioni fino a 50 volte migliori e costi 35 volte inferiori per l'IA per agenti

Prossimi passi

È tutto pronto per iniziare?

Approfondisci le architetture di riferimento NVIDIA Enterprise

Specifiche configurazione cluster 2-8-5-200

Specifiche configurazione cluster 2-8-9-400

Specifiche configurazione cluster 2-4-6-400