Project Ceiba

Costruzione del supercomputer per l'IA più grande al mondo nel cloud

Costruzione del supercomputer per l'IA nel cloud più grande al mondo

Project Ceiba, una collaborazione rivoluzionaria tra AWS e NVIDIA, mira a superare i confini dell'intelligenza artificiale (IA) costruendo il più grande supercomputer per l'IA in cloud. Ospitato esclusivamente su AWS, questo supercomputer all'avanguardia supporterà gli sforzi di ricerca e sviluppo di NVIDIA nel campo dell'IA.

Promuovere l'innovazione all'avanguardia

I team di ricerca e sviluppo di NVIDIA sfrutteranno l'immensa capacità di Project Ceiba per promuovere progressi in un'ampia gamma di settori all'avanguardia, tra cui modelli linguistici di grandi dimensioni (LLM), grafica (immagini, video e generazione 3D), simulazione, biologia digitale, robotica, veicoli a guida autonoma, previsione del clima con NVIDIA Earth-2 e altro ancora. Questa iniziativa rivoluzionaria stimolerà il lavoro di NVIDIA per promuovere l'IA generativa, plasmando il futuro dell'intelligenza artificiale e delle sue applicazioni in diversi domini.

Modello di progettazione

Infrastruttura IA scalabile

Project Ceiba sarà disponibile tramite l'architettura NVIDIA DGX Cloud. DGX Cloud è una piattaforma IA scalabile end-to-end per sviluppatori, che offre capacità scalabili costruite sulla più recente architettura NVIDIA e co-progettata a ogni livello con AWS. DGX Cloud sarà disponibile su AWS entro la fine dell'anno e AWS sarà il primo provider di servizi cloud a offrire DGX Cloud basato sull'architettura NVIDIA Blackwell con GB200. Project Ceiba si basa sull'infrastruttura dell'IA di AWS appositamente costruita, progettata per offrire immensa scalabilità, sicurezza avanzata e prestazioni senza precedenti necessarie per un supercomputer di tale portata.

Modello di progettazione

Exaflop di IA elaborati, circa 375 volte più potenti dell'attuale supercomputer Frontier più veloce al mondo

per superchip, il che consente il trasferimento e l'elaborazione dei dati in modo velocissimo

GPU NVIDIA Blackwell, il primo supercomputer nel suo genere

Caratteristiche

Questo progetto congiunto ha segnato svariate tappe fondamentali per il settore:
La configurazione del progetto Ceiba include 20.736 superchip NVIDIA GB200 Grace Blackwell. Questo supercomputer unico nel suo genere è costruito utilizzando l'ultimo GB200 NVL72 di NVIDIA, un sistema su scala rack raffreddato a liquido con NVLink di quinta generazione, scalabile fino a 20.736 GPU Blackwell collegate a 10.368 CPU NVIDIA Grace. Questo supercomputer è in grado di elaborare ben 414 exaflop di IA, circa 375 volte più potente dell'attuale supercomputer Frontier più veloce al mondo. Se si combinasse l'attuale capacità di supercalcolo del mondo, non si raggiungerebbe l'1% della potenza di calcolo di 414 exaflop. In prospettiva, ciò equivale a far lavorare in tandem oltre 6 miliardi di computer portatili tra i più avanzati al mondo. Inoltre, se ogni essere umano sulla Terra eseguisse un calcolo al secondo, impiegherebbe più di 1.660 anni per eguagliare ciò che il progetto Ceiba può ottenere in un solo secondo.

Project Ceiba è il primo sistema a sfruttare le enormi capacità di scalabilità orizzontale abilitate dalla rete  Elastic Fabric Adapter di AWS (EFA) di quarta generazione, fornendo un throughput di rete senza precedenti pari a 1.600Ggbps per superchip a bassa latenza e larghezza di banda elevata, che consente il trasferimento e l'elaborazione dei dati alla velocità della luce. 

Il raffreddamento a liquido esiste da anni. I giocatori lo utilizzeranno per il loro PC da gaming. Sebbene non sia una tecnologia nuova, AWS ha scelto di proposito il raffreddamento ad aria rispetto al raffreddamento a liquido prima del progetto Ceiba, perché risultava conveniente in termini di costi. Per affrontare le sfide della densità di potenza e fornire questa potenza di calcolo senza precedenti nel progetto Ceiba, AWS ha aperto la strada all'uso del raffreddamento a liquido su larga scala nei data center per soluzioni di calcolo ad alte prestazioni più efficienti e sostenibili.

Il progetto Ceiba incorporerà funzionalità di sicurezza leader del settore ideate per proteggere anche i dati IA più sensibili. L'architettura GPU Blackwell di NVIDIA, che garantisce una comunicazione sicura tra le GPU integrate con AWS Nitro System e le tecnologie EFA, consentirà di proteggere dati crittografati end-to-end per carichi di lavoro di IA generativa. Questa soluzione congiunta consente di decrittare e caricare dati IA sensibili nelle GPU mantenendo al contempo il completo isolamento dagli operatori dell'infrastruttura, il tutto verificando l'autenticità delle applicazioni utilizzate per elaborare i dati. Utilizzando Nitro System, i clienti possono verificare tramite metodi crittografici le loro applicazioni sul Servizio AWS di gestione delle chiavi (KMS) e decrittare i dati solo quando superano i controlli necessari, garantendo la crittografia end-to-end per i loro dati, mentre fluiscono attraverso carichi di lavoro di IA generativa. Per ulteriori informazioni, leggi questo blog e visita la pagina web sull'IA sicura.