Architetture di riferimento NVIDIA Enterprise

Architetture di riferimento Enterprise

Costruisci fabbriche di IA scalabili

Trasforma il tuo data center in una fabbrica di IA ad alte prestazioni con le architetture di riferimento NVIDIA Enterprise.

Panoramica

Le fondamenta per il successo dell’IA

Le architetture di riferimento NVIDIA Enterprise (Enterprise RA) consentono alle organizzazioni di progettare, distribuire e scalare fabbriche IA ad alte prestazioni utilizzando un'infrastruttura convalidata e ripetibile. Questi design combinano calcolo certificato, networking est-ovest e nord-sud ad alta velocità, strumenti di osservabilità e software per garantire prestazioni scalabili, da cluster a quattro nodi ad ambienti su scala aziendale.

Palantir collabora con NVIDIA per fornire Sovereign AI Operating System Reference Architecture

Sovereign AI OS Reference Architecture di Palantir è basata sulle architetture di riferimento NVIDIA Enterprise, testate e qualificate per eseguire la suite software completa di Palantir sull'infrastruttura NVIDIA AI.

Design collaudato e prestazioni convalidate

Scopri come le Enterprise RA, basate su distribuzioni del mondo reale e configurazioni collaudate in campo, semplificano la pianificazione e massimizzano il ROI per un'infrastruttura IA scalabile.

Architetture di riferimento Enterprise

Guida alla gamma completa

È ora disponibile una suite completa di istruzioni per la configurazione di cluster nel data center.

Infrastruttura

Le architetture di riferimento NVIDIA Enterprise partono da configurazioni hardware convalidate, tra cui pattern di nodi di rete CPU-GPU, diagrammi di cablaggio e dettagli dell'infrastruttura.

Logica di rete

La Networking Configuration and Logical Architecture Logic Guide for Enterprise RAs fornisce istruzioni per la gestione e il provisioning dei nodi attraverso la progettazione VLAN e la simulazione di rete su NVIDIA Air.

Software

Il nostro stack di riferimento software per le Enterprise Reference Architectures (RA) delinea il software per gestire, eseguire il provisioning e dimensionare i cluster dell'infrastruttura. Le versioni attuali si concentrano su Kubernetes open source, con il software NVIDIA AI Enterprise e NVIDIA Run:ai.

Osservabilità

La Guida all'osservabilità per le NVIDIA Enterprise Reference Architectures utilizza strumenti open source, come Prometheus e Grafana, per monitorare le prestazioni della GPU e di rete nell'intero cluster. I dashboard forniscono metriche in tempo reale sullo stato del sistema e sull'efficienza del carico di lavoro.

Distribuzione

La guida alla distribuzione per NVIDIA Enterprise Reference Architectures è una raccolta di best practice per l'infrastruttura che il nostro team ha appreso attraverso la creazione, la distribuzione, i test e la convalida dei cluster interni su cui abbiamo costruito il nostro programma.

Storage

L'NVIDIA-Certified Storage Program è un'iniziativa complementare promossa da partner selezionati che hanno creato guide allo storage progettate per essere integrate nelle Enterprise RA. Scopri di più su questo programma unico.

Casi d'uso

Progettato per ogni scenario di utilizzo

Accelera i carichi di lavoro di IA agentica, physical AI, calcolo ad alte prestazioni (HPC) e simulazione IA con le architetture di riferimento NVIDIA Enterprise collaudate e i sistemi certificati NVIDIA forniti da partner globali. Le configurazioni di cluster dell'infrastruttura principali per la distribuzione di fabbriche IA aziendali sono descritte di seguito.

Fabbrica IA NVIDIA RTX PRO

La configurazione della fabbrica IA NVIDIA RTX PRO™ è progettata per una vasta gamma di carichi di lavoro aziendali, tra cui IA generativa e agentica, analisi dei dati, calcolo visivo e simulazione ingegneristica. Le distribuzioni sono ottimizzate su punti di progettazione da 16 e 32 nodi, fornendo un equilibrio ideale tra prestazioni, scalabilità ed efficienza di distribuzione. Progettati per l'accelerazione universale del carico di lavoro nell'IA aziendale, nella simulazione e nel visual computing, i server NVIDIA RTX PRO sono ottimizzati per ambienti PCIe, rendendoli ideali per data center con spazio, alimentazione e raffreddamento limitati. Progettati appositamente per i carichi di lavoro IA moderni, offrono prestazioni efficienti per l'IA agentica e l'inferenza di modelli linguistici di grandi dimensioni (LLM).

Fabbrica IA NVIDIA HGX

La configurazione della fabbrica IA NVIDIA HGX™ ad alte prestazioni è progettata appositamente per l'addestramento e l'inferenza IA multi-nodo su larga scala, sfruttando i sistemi NVIDIA HGX. Disponibile in design point da 32, 64 e 128 nodi e supportata dalla rete NVIDIA Spectrum-X™, l'architettura è dotata di un design flessibile e ottimizzato per rail che consente un'integrazione efficiente in diversi layout di rack, offrendo prestazioni ad alto throughput e a bassa latenza. Fornisce prestazioni rivoluzionarie per gli utenti esperti di IA che eseguono i carichi di lavoro più impegnativi, consente l'addestramento e l'ottimizzazione di modelli su larga scala e accelera notevolmente l'inferenza. Con una precisione di nuova generazione e interconnessioni ultra veloci, la soluzione offre un throughput dei token fino a 15 volte superiore.

Fabbrica IA NVIDIA NVL72

La configurazione NVIDIA NVL72 AI Factory è progettata per addestrare e distribuire modelli da trilioni di parametri, offrendo potenza di calcolo exascale in un singolo rack. Progettato per garantire un throughput elevato dei modelli, l'inferenza multi-utente e l'inferenza in tempo reale su larga scala, consente la nuova generazione di innovazione basata sull'IA. I punti di progettazione della distribuzione sono incentrati su configurazioni da quattro e otto rack. Basata su una rete flessibile e ottimizzata per rail, l'architettura si adatta a diversi layout di rack e design di sistema, offrendo prestazioni ad alta larghezza di banda e a bassa latenza. La piattaforma offre output eccezionali per le fabbriche IA con un'efficienza energetica leader del settore ed è basata su NVIDIA NVLink™ di quinta generazione, Tensor Core FP4 e innovazioni termiche avanzate.

Vantaggi

Il valore strategico delle architetture di riferimento Enterprise

Sblocca infrastrutture IA scalabili e ad alte prestazioni con configurazioni comprovate e pronte per i partner.

Prestazioni di picco per carichi di lavoro IA

Soddisfa le esigenze intensive di inferenza, ottimizzazione e addestramento IA con architetture che garantiscono un utilizzo completo delle GPU e prestazioni coerenti su cluster multi-nodo.

Scalabilità flessibile, operazioni semplificate

Espandi facilmente la tua infrastruttura e garantisci una distribuzione scalabile e semplificata per un massimo di 128 nodi. Crea le basi per soluzioni full-stack con il design convalidato NVIDIA Enterprise AI Factory, che sfrutta il nostro ecosistema software.

Ridurre la complessità e il TCO

Semplifica i processi di distribuzione e i design efficienti, riduci la complessità e il costo totale di proprietà (TCO), riducendo al contempo il time-to-value.

Sostenibilità

Segui modelli di progettazione specifici e standardizzati per ottenere un funzionamento coerente da un'installazione all'altra, ridurre la necessità di un supporto frequente e consentire tempi di risoluzione più rapidi.

Partner

Partner per le prestazioni

Siamo orgogliosi di collaborare con i principali partner in quanto portano sul mercato architetture di riferimento aziendali e soluzioni per fabbriche IA. I design approvati da questi partner hanno superato il nostro Design Review Board, offrendo indicazioni che meritano la nostra approvazione in una o più delle seguenti categorie: infrastruttura, logica di rete e software.

Sovereign AI OS Reference Architecture Palantir con NVIDIA

Sovereign AI OS Reference Architecture di Palantir è basata sulle architetture di riferimento NVIDIA Enterprise, testate e qualificate per eseguire la suite software completa di Palantir sull'infrastruttura NVIDIA AI con i nostri partner di sistema globali. Questa architettura IA sovrana è fondamentale per i clienti con flussi di lavoro sensibili alla latenza, requisiti di sovranità dei dati e un'elevata distribuzione geografica. L'architettura fornisce alle aziende un controllo totale sui propri dati, sui modelli IA e sulle applicazioni.

Risorse

Scopri di più sulle architetture di riferimento Enterprise

Architettura di riferimento NVIDIA RTX PRO AI Factory

La configurazione NVIDIA RTX PRO AI Factory supporta una vasta gamma di carichi di lavoro aziendali, tra cui l'inferenza IA agentica, l'IA fisica e industriale, il calcolo visivo e il calcolo ad alte prestazioni per l'analisi dei dati e la simulazione. Questo documento descrive in dettaglio i componenti hardware alla base di questa architettura scalabile e modulare.

Architettura di riferimento NVIDIA HGX AI Factory

La configurazione NVIDIA HGX AI Factory è incentrata sull'inferenza IA ad alte prestazioni, sull'addestramento dei modelli e sull'ottimizzazione. Questo documento delinea i componenti hardware di un'architettura scalabile e modulare, tra cui indicazioni per cluster e topologie di fabric di rete utilizzate per interconnettere il cluster.

Sblocca un throughput enorme dei token con NVIDIA Run:ai

Il benchmarking congiunto con Nebius mostra che le distribuzioni GPU frazionarie che utilizzano NVIDIA Run:ai su NVIDIA Enterprise Reference Architectures migliorano significativamente il throughput e l'utilizzo per i carichi di lavoro LLM di produzione.

Panoramica dell'architettura di riferimento NVIDIA Enterprise

Questo whitepaper presenta le architetture di riferimento NVIDIA Enterprise che forniscono una guida collaudata per progettare e creare fabbriche IA per distribuzioni di livello aziendale da 32 a 1.024 GPU. Queste architetture aiutano a semplificare la distribuzione dell'infrastruttura IA, a ridurre la complessità operativa e ad accelerare il time-to-value.

Reti nord–sud: la chiave per carichi di lavoro IA aziendali più veloci

Le architetture di riferimento aziendali di NVIDIA guidano le organizzazioni nella distribuzione di fabbriche IA che utilizzano reti nord-sud e est-ovest, fornendo ricette di progettazione per un'infrastruttura IA scalabile, sicura e ad alte prestazioni.

Distribuire NVIDIA H200 NVL su larga scala con una nuova architettura di riferimento aziendale

NVIDIA H200 NVL accelera la distribuzione dell'IA con memoria migliorata, NVLink ad alta velocità e una configurazione Enterprise RA ottimizzata.

La fabbrica di intelligenza artificiale (IA) di NVIDIA promuove l'innovazione aziendale su larga scala

NVIDIA ha creato una fabbrica IA unificata per scalare i flussi di lavoro di IA generativa e agentica in tutta l'azienda, garantendo sicurezza, prestazioni e coerenza. La piattaforma supporta centinaia di agenti IA che accelerano l'innovazione, semplificano la progettazione software e hardware e ottimizzano le operazioni della supply chain, riducendo i tempi di pianificazione di oltre il 95% e conseguendo in solo anno un lavoro di progettazione di decenni.

NVIDIA Blackwell Ultra offre prestazioni fino a 50 volte migliori e costi 35 volte inferiori per l'IA per agenti

Progettata per accelerare la nuova generazione di IA per agenti, NVIDIA Blackwell Ultra offre prestazioni di inferenza rivoluzionarie con costi notevolmente inferiori. I fornitori di cloud come Microsoft, CoreWeave e Oracle Cloud Infrastructure stanno distribuendo sistemi NVIDIA GB300 NVL72 su larga scala per casi d'uso a bassa latenza e con contesti estesi, come la codifica agentica e gli assistenti di codifica.

Ciò è reso possibile dalla profonda co-progettazione tra NVIDIA Blackwell, NVLink™ e NVLink Switch per la scalabilità, NVFP4 per la precisione a bassa latenza e NVIDIA Dynamo e TensorRT™ LLM per la velocità e la flessibilità, nonché dallo sviluppo con i framework della community SGLang, vLLM e molto altro ancora.

Prossimi passi

È tutto pronto per iniziare?

Scopri di più su NVIDIA Enterprise AI Factory.

Approfondisci le architetture di riferimento NVIDIA Enterprise

Scopri come le architetture di riferimento NVIDIA Enterprise forniscono blueprint scalabili e prescrittivi per distribuire un'infrastruttura IA ad alte prestazioni.

Specifiche configurazione cluster 2-8-5-200

Specifiche configurazione cluster 2-8-9-400

Specifiche configurazione cluster 2-4-6-400

Cisco è il leader tecnologico mondiale che sta rivoluzionando il modo in cui le organizzazioni si connettono e si proteggono nell'era dell'IA. Da oltre 40 anni Cisco ha connesso il mondo in modo sicuro. Con le sue soluzioni e servizi basati sull'IA leader del settore, Cisco consente a clienti, partner e community di sbloccare l'innovazione, migliorare la produttività e rafforzare la resilienza digitale. Con lo scopo al centro della propria attività, Cisco rimane impegnata a creare un futuro più connesso e inclusivo per tutti.

Soluzioni approvate dal NVIDIA Design Review Board:

Dell Technologies aiuta le organizzazioni e gli individui a costruire il proprio futuro digitale e a trasformare il modo di lavorare, vivere e giocare. L'azienda fornisce ai clienti il portfolio di tecnologie e servizi più ampio e innovativo del settore per l'era dell'IA.

Soluzioni approvate dal NVIDIA Design Review Board:

HPE è leader nella tecnologia aziendale essenziale che riunisce la potenza dell'IA, del cloud e della rete per aiutare le organizzazioni a ottenere di più. Come pionieri delle possibilità, la nostra innovazione e le nostre competenze promuovono il modo di vivere e lavorare delle persone. Consentiamo ai nostri clienti di tutti i settori di ottimizzare le prestazioni operative, trasformare i dati in previsione e massimizzare il loro impatto. Realizza le tue ambizioni più audaci con HPE.

Soluzioni approvate dal NVIDIA Design Review Board:

Lenovo è una potenza tecnologica globale con un fatturato di 69 miliardi di dollari, al 196° posto nella classifica Fortune Global 500 e che serve milioni di clienti ogni giorno in 180 mercati. Incentrata sulla visione audace di fornire una tecnologia più intelligente per tutti, la nostra partnership in corso con NVIDIA combina i server Lenovo con le GPU accelerate. Lenovo Hybrid AI Advantage™ con NVIDIA aumenta la produttività e l'innovazione con una distribuzione IA più rapida, basata sulla libreria IA Lenovo e su un portfolio completo di infrastruttura IA, dispositivi, soluzioni e servizi.

Soluzioni approvate dal NVIDIA Design Review Board:

Supermicro è leader globale nelle soluzioni IT totali ottimizzate per le applicazioni. Fondata e operativa a San Jose, in California, Supermicro si impegna a fornire innovazioni all'avanguardia per le aziende, il cloud, l'IA e l'infrastruttura IT 5G per le telecomunicazioni/edge. Siamo un fornitore di soluzioni IT complete con server, IA, storage, IoT, sistemi switch, software e servizi di supporto. L'esperienza di Supermicro nella progettazione delle schede madri, dell'alimentazione e degli chassis consente ulteriormente lo sviluppo e la produzione, consentendo l'innovazione di nuova generazione dal cloud all'edge per i nostri clienti globali.

Soluzioni approvate dal NVIDIA Design Review Board: