Proyecto Ceiba

Creación de la supercomputadora de IA más grande del mundo en la nube

Construcción de la supercomputadora de IA más grande del mundo en la nube

El Proyecto Ceiba, una colaboración innovadora entre AWS y NVIDIA, tiene como objetivo ampliar los límites de la inteligencia artificial (IA) mediante la construcción de la supercomputadora de IA más grande de la nube. Alojada exclusivamente en AWS, esta supercomputadora de última generación impulsará los esfuerzos de investigación y desarrollo de NVIDIA en IA.

Impulse la innovación de vanguardia

Los equipos de investigación y desarrollo de NVIDIA aprovecharán el inmenso poder del Proyecto Ceiba para impulsar los avances en una amplia gama de campos de vanguardia, incluidos los modelos de lenguaje de gran tamaño (LLM), los gráficos (imágenes, videos y generación 3D), la simulación, la biología digital, la robótica, los vehículos autónomos, la predicción climática con NVIDIA Earth-2, y más. Esta innovadora iniciativa impulsará el trabajo de NVIDIA para promover la IA generativa y así dar forma al futuro de la inteligencia artificial y sus aplicaciones en diferentes dominios.

Patrón de diseño

Infraestructura escalable de IA

El Proyecto Ceiba estará disponible a través de la arquitectura NVIDIA DGX Cloud. DGX Cloud es una plataforma integral de IA escalable para desarrolladores, la cual ofrece capacidad escalable basada en la arquitectura más reciente de NVIDIA y diseñada conjuntamente en cada capa con AWS. DGX Cloud estará disponible en AWS a finales de este año y AWS será el primer proveedor de servicios en la nube en ofrecer DGX Cloud basada en la arquitectura NVIDIA Blackwell con GB200. El Proyecto Ceiba se basa en la infraestructura de IA personalizada de AWS, diseñada para ofrecer la inmensa escala, la seguridad mejorada y el rendimiento incomparable que una supercomputadora de esta magnitud necesita.

Patrón de diseño

exaflops de IA procesados, alrededor de 375 veces más potentes que Frontier, la supercomputadora más rápida del mundo actualmente

por superchip, lo que permite una transferencia y un procesamiento de datos ultrarrápidos

GPU NVIDIA Blackwell, la primera supercomputadora de su clase

Características

Este proyecto conjunto ha establecido varios hitos que definen la industria:
La configuración del Proyecto Ceiba incluye 20 736 superchips NVIDIA GB200 Grace Blackwell. Este superordenador, el primero de su clase, está construido con el último GB200 NVL72 de NVIDIA, un sistema refrigerado líquida y escalado en rack con NVLink de quinta generación, que se amplía a 20 736 GPU Blackwell conectadas a 10 368 CPU NVIDIA Grace. Esta supercomputadora es capaz de procesar 414 exaflops de IA, unas 375 veces más potente que la supercomputadora Frontier, la más rápida del mundo actual. Si se combinara la capacidad de supercomputación actual de todo el mundo, no alcanzaría el 1 % de la potencia informática que representan 414 exaflops. Para ponerlo en perspectiva, equivale a tener más de 6 mil millones de las computadoras portátiles más avanzadas del mundo trabajando en conjunto. Para poner esto en mayor perspectiva, si cada ser humano de la Tierra realizara un cálculo por segundo, tardarían más de 1660 años en igualar lo que el Proyecto Ceiba puede lograr en solo un segundo.

Project Ceiba es el primer sistema que aprovecha las enormes capacidades de escalado horizontal que ofrecen las redes AWS Elastic Fabric Adapter (EFA) de cuarta generación, lo que proporciona una velocidad sin precedentes de 1600 Gbps por superchip de rendimiento de red de baja latencia y gran ancho de banda, lo que permite una transferencia y un procesamiento de datos ultrarrápidos. 

La refrigeración líquida existe desde hace años. Los jugadores lo tendrán para su ordenador personal de juego. Si bien no se trata de una tecnología nueva, AWS eligió deliberadamente la refrigeración por aire en lugar de la refrigeración líquida antes del Proyecto Ceiba porque tenía sentido desde el punto de vista de la rentabilidad. Para abordar los desafíos de la densidad de energía y ofrecer esta potencia informática sin igual en el Proyecto Ceiba, AWS ha sido pionera en el uso de refrigeración líquida en el desescalado horizontal en los centros de datos para obtener soluciones informáticas de alto rendimiento más eficientes y sostenibles.

El Proyecto Ceiba incorporará características de seguridad líderes en la industria diseñadas para proteger incluso los datos de IA más confidenciales. La arquitectura de GPU Blackwell de NVIDIA, que proporciona una comunicación segura entre las GPU integradas con las tecnologías AWS Nitro System y EFA, permitirá la seguridad de los datos cifrados de extremo a extremo para las cargas de trabajo de IA generativa. Esta solución conjunta permite descifrar y cargar información confidencial de IA en las GPU a la vez que mantiene un aislamiento total de los operadores de infraestructura. Todo ello mientras se verifica la autenticidad de las aplicaciones utilizadas para procesar los datos. Con el sistema Nitro, los clientes pueden validar criptográficamente sus aplicaciones en el AWS Key Management System (KMS) y descifrar los datos solo cuando se realizan las comprobaciones necesarias, lo que garantiza el cifrado de extremo a extremo de sus datos a medida que fluyen a través de cargas de trabajo de IA generativa. Lea este blog y visite la página Web segura de IA para más información.