A NVIDIA anuncia seu supercomputador de IA de última geração – o NVIDIA DGX SuperPOD equipado com NVIDIA GB200 Grace Blackwell Superchips – para processar modelos de trilhões de parâmetros com tempo de atividade constante para cargas de trabalho de inferência e treinamento de IA generativa em superescala.
Apresentando uma nova arquitetura em escala de rack, altamente eficiente e com refrigeração líquida, o novo DGX SuperPOD é construído com os sistemas NVIDIA DGX™ GB200 e fornece 11,5 exaflops de supercomputação de IA com precisão FP4 e 240 terabytes de memória rápida – escalonando para mais com racks adicionais.
Cada sistema DGX GB200 apresenta 36 superchips NVIDIA GB200 – que incluem 36 CPUs NVIDIA Grace e 72 GPUs NVIDIA Blackwell – conectados como um supercomputador por meio do NVIDIA NVLink® de quinta geração. Os superchips GB200 oferecem um aumento de desempenho de até 30 vezes em comparação com a GPU NVIDIA H100 Tensor Core para grandes cargas de trabalho de inferência de modelos de linguagem (LLM).
"Os supercomputadores NVIDIA DGX AI são as fábricas da revolução industrial da IA", afirma Jensen Huang, fundador e CEO da NVIDIA. "O novo DGX SuperPOD combina os mais recentes avanços em computação acelerada, rede e software da NVIDIA para permitir que todas as empresas, setores e países refinem e gerem sua própria IA."
O DGX SuperPOD com tecnologia Grace Blackwell apresenta oito ou mais sistemas DGX GB200 e pode ser dimensionado para dezenas de milhares de superchips GB200 conectados via NVIDIA Quantum InfiniBand. Para obter um enorme espaço de memória compartilhada para alimentar modelos de AI de última geração, os clientes podem implementar uma configuração que conecta as 576 GPUs Blackwell em oito sistemas DGX GB200 conectados via NVLink.
Nova arquitetura DGX SuperPOD em escala de rack para a era da IA generativa
O novo DGX SuperPOD com sistemas DGX GB200 apresenta uma estrutura de computação unificada. Além do NVIDIA NVLink de quinta geração, a estrutura inclui DPUs NVIDIA BlueField®-3 e será compatível com a rede NVIDIA Quantum-X800 InfiniBand, anunciada separadamente hoje. Essa arquitetura fornece até 1.800 gigabytes por segundo de largura de banda para cada GPU na plataforma.
Além disso, a tecnologia NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) de quarta geração fornece 14,4 teraflops de computação em rede, um aumento de 4 vezes na arquitetura DGX SuperPOD de última geração em comparação com a geração anterior.
Arquitetura turnkey emparelhada com software avançado para um tempo de atividade sem precedentes
O novo DGX SuperPOD é um supercomputador de IA completo, em escala de data center, que se integra ao armazenamento de alto desempenho de parceiros certificados pela NVIDIA para atender às demandas de cargas de trabalho de IA generativas. Cada um é construído, cabeado e testado na fábrica para acelerar drasticamente a implantação nos data centers dos clientes.
O DGX SuperPOD com tecnologia Grace Blackwell apresenta recursos inteligentes de gerenciamento preditivo para monitorar continuamente milhares de pontos de dados em hardware e software para prever e interceptar fontes de tempo de inatividade e ineficiência, economizando tempo, energia e custos de computação.
O software pode identificar áreas de preocupação e planejar a manutenção, ajustar com flexibilidade os recursos de computação e salvar e retomar automaticamente os trabalhos para evitar tempo de inatividade, mesmo sem a presença de administradores de sistema.
Se o software detectar a necessidade de substituição de um componente, o cluster ativará a capacidade de espera para garantir que o trabalho seja concluído a tempo. Qualquer substituição de hardware necessária pode ser programada para evitar tempo de inatividade não planejado.
"Essa última geração de supercomputador possibilitará o processamento de cargas de trabalho de inferência e treinamento de IA generativa, contribuindo no desempenho do mercado como um todo, em diversos setores", ressalta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Sistemas NVIDIA DGX B200 promovem a supercomputação de IA para os setores
A NVIDIA também apresentou o sistema NVIDIA DGX B200, uma plataforma unificada de supercomputação de IA para treinamento, ajuste fino e inferência de modelos de IA.
O DGX B200 é a sexta geração de projetos DGX tradicionais montados em rack e resfriados a ar, usados pelos setores em todo o mundo. O novo sistema DGX B200 com arquitetura Blackwell inclui oito GPUs NVIDIA B200 Tensor Core e dois processadores Intel® Xeon® de 5ª geração. Os clientes também podem montar o DGX SuperPOD usando sistemas DGX B200 para criar Centros de Excelência em IA que podem potencializar o trabalho de grandes equipes de desenvolvedores que executam muitos trabalhos diferentes.
Os sistemas DGX B200 incluem o recurso de precisão FP4 na nova arquitetura Blackwell, proporcionando até 144 petaflops de desempenho de IA, um enorme 1,4 TB de memória de GPU e 64 TB/s de largura de banda de memória. Isso proporciona uma inferência em tempo real 15 vezes mais rápida para modelos de trilhões de parâmetros em comparação com a geração anterior.
Os sistemas DGX B200 incluem redes avançadas com oito NICs NVIDIA ConnectX™-7 e duas DPUs BlueField-3. Elas fornecem até 400 gigabits por segundo de largura de banda por conexão, proporcionando rápido desempenho de IA com as plataformas de rede NVIDIA Quantum-2 InfiniBand e NVIDIA Spectrum-X Ethernet.
Software e suporte especializado para ampliar a produção de IA
Todas as plataformas NVIDIA DGX incluem o software NVIDIA AI Enterprise para desenvolvimento e implantação de nível empresarial. Os clientes da DGX podem acelerar seu trabalho com os modelos de base, frameworks, kits de ferramentas e novos microsserviços NVIDIA NIM pré-treinados incluídos na plataforma de software.
Os especialistas em NVIDIA DGX e os parceiros selecionados da NVIDIA certificados para oferecer suporte às plataformas DGX auxiliam os clientes em todas as etapas da implantação, para que eles possam mover rapidamente a IA para a produção. Quando os sistemas estiverem operacionais, os especialistas em DGX continuarão a dar suporte aos clientes na otimização de seus pipelines e infraestrutura de IA.
Disponibilidade
Espera-se que os sistemas NVIDIA DGX SuperPOD com DGX GB200 e DGX B200 estejam disponíveis ainda este ano nos parceiros globais da NVIDIA.