AI 확장의 청사진 제시하는 NVIDIA Rubin 플랫폼 기반 NVIDIA DGX SuperPOD

NVIDIA DGX Rubin 시스템은 컴퓨팅, 네트워킹, 소프트웨어 분야의 최신 NVIDIA 혁신 기술을 통합해, NVIDIA Blackwell 플랫폼 대비 추론 토큰 비용을 최대 10배까지 절감합니다. 이로써 추론, 훈련부터 긴 컨텍스트 추론까지 모든 AI 워크로드를 효과적으로 가속합니다.
by NVIDIA Korea

NVIDIA DGX SuperPOD는 NVIDIA Rubin 플랫폼을 기반으로 대규모 시스템 구축의 길을 열며, 향후 AI 컴퓨팅의 도약을 이끌고 있습니다.

미국 라스베이거스에서 열린 CES 2026에서 Rubin 플랫폼이 공개됐습니다. 이 플랫폼은 혁신적인 단일 AI 슈퍼컴퓨터 구현을 위한 6개의 신규 칩으로 구성되며, 에이전틱 AI, 전문가 혼합(mixture-of-experts, MoE) 모델, 긴 컨텍스트 추론 가속화에 중점을 두고 개발됐죠.

Rubin 플랫폼은 NVIDIA Vera CPU, Rubin GPU, NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 이더넷 스위치까지 총 6종의 칩을 통합했죠. 이처럼 고도화된 공동 설계는 훈련 가속화와 추론 토큰 생성 비용을 절감시킵니다.

DGX SuperPOD는 기업과 연구 환경 전반에 걸쳐 Rubin 기반 시스템을 배포하는 핵심 설계로 자리매김하고 있습니다.

NVIDIA DGX 플랫폼은 NVIDIA 컴퓨팅부터 네트워킹, 소프트웨어에 이르기까지 전체 기술 스택을 단일 통합 시스템으로 제공합니다. 이를 통해 인프라 통합 부담을 해소하고, 기술팀이 AI 혁신과 비즈니스 성과에 집중할 수 있도록 돕죠.

NVIDIA  젠슨 황 CEO는 “Rubin 플랫폼은 훈련과 추론에 대한 AI 컴퓨팅 수요가 급증하는 시점에 정확히 적절한 시점에 공개됐습니다”고 말했습니다.

AI 산업 혁명을 위한 새로운 플랫폼

Rubin 플랫폼은 새로운 DGX 시스템에 탑재되면서 AI 지능과 효율성을 비약적으로 향상시켰는데요. 핵심 기술은 다음과 같습니다.

  • 6세대 NVIDIA NVLink: GPU당6TB/s, Vera Rubin NVL72 랙당 260TB/s로 대규모 MoE, 긴 컨텍스트 워크로드 지원
  • NVIDIA Vera CPU: 88개의 NVIDIA 맞춤형 올림푸스(Olympus) 코어, 완전한2 호환성. 초고속 NVLink-C2C 연결성으로 업계 최고의 효율적인 AI 팩토리 컴퓨팅 제공
  • NVIDIA Rubin GPU: AI 추론을 위해 50페타플롭스의 NVFP4 컴퓨팅 성능을 제공하며, 하드웨어 가속 압축 기능을 갖춘 3세대 트랜스포머 엔진 탑재
  • 3세대 NVIDIA 컨피덴셜 컴퓨팅: Vera Rubin NVL72는 최초의 랙 스케일 플랫폼으로 CPU, GPU, NVLink 도메인 전반에 걸쳐 데이터 보안을 유지하는 NVIDIA 컨피덴셜 컴퓨팅 제공
  • 2세대 RAS 엔진: GPU, CPU, NVLink를 아우르는 NVIDIA Rubin 플랫폼은 실시간 상태 모니터링, 내결함성, 사전 예방 유지보수를 제공하며, 모듈식 케이블 프리 트레이로 서비스 속도 3배 향상

이러한 혁신 기술의 결합으로, Rubin 플랫폼은 이전 세대 대비 추론 토큰 비용을 최대 10배 절감시킵니다. 이는 AI 모델의 규모, 컨텍스트, 추론 깊이가 확대된 측면에서 중요한 진전이죠.

DGX SuperPOD: Rubin 플랫폼 기반 청사진

Rubin 플랫폼 기반의 DGX SuperPOD 시스템에 통합되는 요소는 다음과 같습니다.

  • NVIDIA DGX Vera Rubin NV72 또는 DGX Rubin NVL8 시스템
  • 안전한 소프트웨어 정의 인프라를 위한 NVIDIA BlueField-4 DPU
  • 차세대 추론을 위한 NVIDIA 추론 컨텍스트 메모리 스토리지 플랫폼(Inference Context Memory Storage Platform)
  • NVIDIA ConnectX-9 SuperNIC
  • NVIDIA Quantum-X800 Infiniband, NVIDIA Spectrum-X 이더넷
  • 자동화된 AI 인프라 오케스트레이션과 운영을 위한 NVIDIA Mission Control

NVIDIA DGX SuperPOD는 DGX Vera Rubin NVL72를 기반으로 8개의 DGX Vera Rubin NVL72 시스템을 통합하고, 576개의 Rubin GPU를 탑재해 28.8 엑사플롭의 FP4 성능과 600 테라바이트(TB)의 고속 메모리를 제공합니다. 각 DGX Vera Rubin NVL72 시스템은 36개의 Vera CPU, 72개의 Rubin GPU, 18개의 BlueFIeld-4 DPU를 결합해 랙 전체에 걸쳐 통합된 메모리와 컴퓨팅 공간을 제공하죠. 총 260 테라바이트(TB/s)에 달하는 NVLink 처리량을 통해 모델 분할의 필요성을 없애고, 랙 전체가 단일하고 일관된 AI 엔진처럼 작동하도록 설계됐습니다.

NVIDIA DGX SuperPOD는 DGX Rubin NVL8 시스템을 기반으로, 512개의 Rubin GPU를 탑재했으며, 총 64개의 DGX Rubin NVL8 시스템으로 구성됩니다. NVIDIA DGX Rubin NVL8 시스템은 x86 CPU와 액체 냉각식 폼팩터를 결합해, 개발부터 배포까지 모든 AI 프로젝트에서 Rubin 아키텍처의 효율성을 제공합니다. 8개의 NVIDIA Rubin GPU와 6세대 NVLink로 구동되는 각 DGX Rubin NVL8은 NVIDIA Blackwell 시스템 대비 5.5배의 NVFP4 플롭(FLOPS)을 제공합니다.

AI 팩토리를 위한 차세대 네트워킹

Rubin 플랫폼은 NVIDIA Spectrum-6 이더넷 스위치, NVIDIA Quantum-X800 InfiniBand 스위치, BlueField-4 DPU, ConnectX-9 SuperNIC을 탑재한 혁신적인 네트워킹 기술로 데이터센터를 고성능 AI 공장으로 새롭게 정의합니다. 세계 최대 규모의 AI 워크로드를 지속적으로 처리하도록 설계됐는데요. 이러한 혁신 기술을 NVIDIA DGX SuperPOD에 통합함으로써, Rubin 플랫폼은 기존 시스템의 확장성, 혼잡도, 안정성 관련 병목 현상을 해소합니다.

대규모 클러스터를 위한 최적화된 연결성

차세대 800Gb/s 엔드투엔드 네트워킹 제품군은 인피니밴드와 이더넷 환경 모두에서 AI 인프라의 최고 효율을 보장하는 두 가지 맞춤형 경로를 제공합니다.

  • NVIDIA Quantum-X800 InfiniBand: 전용 AI 클러스터를 위해 업계 최저 지연 시간과 최고 성능을 제공합니다. 확장 가능한 SHARP(Scalable Hierarchical Aggregation and Reduction Protocol) v4와 적응형 라우팅 기술을 활용해 집합 연산을 네트워크로 오프로드하죠.
  • NVIDIA Spectrum-X 이더넷: Spectrum-6 이더넷 스위치와 ConnectX-9 SuperNIC을 기반으로 구축된 이 플랫폼은 표준 이더넷 프로토콜을 활용합니다. 이를 통해 AI 팩토리에 예측 가능하고 고성능의 확장성과 분산 연결성을 구현하며, 특히 AI 워크로드의 ‘이스트-웨스트(east-west)’ 트래픽 패턴에 최적화된 것이 특징입니다.

기가와트급 AI 팩토리 구축

이러한 신기술들은 Rubin 플랫폼과의 고도화된 공동 설계를 통해 탄생했습니다. NVIDIA는 혼잡 제어와 성능 격리 기술을 완전하게 구현함으로써 차세대 기가와트급 AI 팩토리 시대를 열고 있습니다. 이러한 통합적 접근 방식은 AI 모델의 복잡성이 심화되더라도 AI 팩토리의 네트워킹 구조가 속도를 저해하는 요소가 아니라 오히려 가속하는 촉매제 역할을 수행하게 되죠.

NVIDIA 소프트웨어, AI 팩토리 운영과 배포 혁신

NVIDIA Mission Control은 NVIDIA Blackwell 기반 DGX 시스템용으로 개발된 AI 데이터센터 운영과 오케스트레이션 소프트웨어입니다. 이는 Rubin 기반 NVIDIA DGX 시스템을 통해 기업이 인프라 관리와 운영을 자동화할 수 있도록 지원하는데요.

NVIDIA Mission Control은 배포 구성부터 시설 통합, 클러스터, 워크로드 관리에 이르기까지 인프라 운영의 모든 측면을 가속화합니다.

지능형 통합 소프트웨어를 통해 기업은 NVIDIA Rubin의 냉각과 전력에 대한 제어력을 향상시키고, 인프라 복원력을 확보할 수 있습니다. NVIDIA Mission Control은 신속한 누수 감지 기능으로 대응 속도를 높이고, 혁신적이고 효율적인 NVIDIA의 최신 기술에 대한 활용범위를 확대하며, 자율 복구 기능을 통해 AI 팩토리 생산성을 극대화합니다.

NVIDIA DGX 시스템은 NVIDIA Nemotron-3 오픈 모델, 데이터, 라이브러리 제품군과 같은 NVIDIA NIM 마이크로서비스를 포함한 NVIDIA AI Enterprise 소프트웨어 플랫폼도 지원합니다.

DGX SuperPOD가 제시하는 산업용 AI의 미래

DGX SuperPOD는 오랫동안 대규모 AI 인프라의 청사진 역할을 해왔는데요. Rubin 플랫폼의 등장은 수천 단계에 걸쳐 추론하고 획기적으로 낮은 비용으로 지능을 제공하는 차세대 AI 팩토리 시스템의 발판이 될 것으로 예상합니다. 기업들은 차세대 최첨단 모델, 멀티모달 시스템, 에이전틱 AI 애플리케이션 구축을 위한 강력한 동력을 얻게 될 것이죠.

DGX Vera Rubin NVL72, DGX Rubin NVL8 시스템을 탑재한 NVIDIA DGX SuperPOD는 올해 하반기에 출시될 예정입니다.

 

여기에서 소프트웨어 제품 정보 관련 약관을 확인할 수 있습니다.