OCP Global Summit에서 NVIDIA는 차세대 기가와트급 AI 팩토리를 위한 핵심 기술들을 공개했습니다.
이번 행사에서 NVIDIA는 점점 늘어나는 AI 추론 수요에 대응하기 위해 설계된 NVIDIA Vera Rubin NVL144 MGX 세대의 오픈 아키텍처 랙 서버 사양을 소개했습니다. 이 서버는 50개 이상의 MGX 파트너들이 함께 준비 중이며, 576개의 Rubin Ultra GPU를 연결하는 NVIDIA Kyber와의 통합을 통해 성능 확장을 극대화합니다.
또한, 20개 이상의 업계 파트너들이 NVIDIA Kyber 랙 아키텍처를 지원하기 위한 새로운 실리콘, 부품, 전력 시스템과 함께, 차세대 800VDC(볼트 직류) 기반 데이터 센터를 위한 기술들을 선보였습니다.
Foxconn은 대만 가오슝에 800VDC 기반으로 구축 중인 40메가와트 규모의 데이터 센터, Kaohsiung-1의 세부 사항을 공개했습니다. CoreWeave, Lambda, Nebius, Oracle Cloud Infrastructure, Together AI를 포함한 여러 선도 기업들도 800볼트 기반 데이터 센터 설계에 적극 참여하고 있습니다. Vertiv는 공간, 비용, 에너지 효율을 모두 고려한 800VDC MGX 참조 아키텍처를 선보였으며, 전력과 냉각을 통합한 완전한 인프라 설계를 제시했습니다. HPE는 NVIDIA Kyber뿐만 아니라, Spectrum-X Ethernet 플랫폼의 확장 기술인 NVIDIA Spectrum-XGS Ethernet 에 대한 제품 지원도 함께 발표했습니다.
기존의 415V 또는 480V AC 3상 시스템에서 800VDC 인프라로 전환하면 데이터 센터의 확장성과 에너지 효율이 크게 향상되며, 자재 사용을 줄이고 전력 처리 용량도 높일 수 있습니다. 이러한 이유로 전기차와 태양광 산업에서는 이미 800VDC 인프라가 널리 활용되고 있습니다.
한편, Meta가 설립한 Open Compute Project(OCP)는 수백 개의 컴퓨팅 및 네트워킹 기업이 참여하는 업계 컨소시엄으로, 급증하는 컴퓨팅 수요에 대응하기 위한 하드웨어 기술 재설계를 중심으로 협업하고 있습니다.
Vera Rubin NVL144: AI 팩토리를 위한 확장형 설계
Vera Rubin NVL144 MGX 컴퓨트 트레이는 에너지 효율적이고 100% 액체 냉각 방식의 모듈형 설계를 제공합니다. 중앙 인쇄회로기판(midplane)은 기존 케이블 기반 연결을 대체해 조립과 유지보수를 더욱 빠르게 할 수 있으며, 대용량 컨텍스트 추론을 위한 NVIDIA Rubin CPX와 800GB/s 속도의 NVIDIA ConnectX-9 네트워킹을 위한 모듈형 확장 슬롯을 갖추고 있습니다.
NVIDIA Vera Rubin NVL144는 가속 컴퓨팅 아키텍처와 AI 성능 면에서 획기적인 도약을 이루었습니다. 고도화된 추론 엔진과 AI 에이전트의 요구를 충족하도록 설계되었습니다.
이 시스템은 설계의 핵심이 MGX 랙 아키텍처에 내재되어 있으며, 50개 이상의 MGX 시스템 및 부품 파트너들의 지원을 받게 됩니다. NVIDIA는 업그레이드된 랙과 컴퓨트 트레이의 혁신을 OCP 컨소시엄에 오픈 스탠다드로 기여할 계획입니다.
컴퓨트 트레이와 랙에 대한 이 표준은 파트너들이 모듈 방식으로 조합하고 아키텍처를 기반으로 보다 빠르게 확장할 수 있도록 지원합니다. Vera Rubin NVL144 랙 설계는 에너지 효율적인 45도 액체 냉각, 고성능을 위한 새로운 액체 냉각 버스바, 그리고 전력 안정을 위한 기존 대비 20배 확장된 에너지 저장 용량을 특징으로 합니다.
MGX 기반 컴퓨트 트레이와 랙 아키텍처의 업그레이드는 AI 팩토리의 성능을 향상시키는 동시에 조립을 단순화하여 기가와트 규모 AI 인프라로의 신속한 확장을 가능하게 합니다.
NVIDIA는 여러 세대에 걸친 하드웨어에서 OCP 표준을 선도적으로 기여해 왔으며, 여기에는 NVIDIA GB200 NVL72 시스템의 핵심 전기·기계 설계 일부도 포함됩니다. 동일한 MGX 랙 풋프린트는 GB300 NVL72를 지원하며, 고성능과 빠른 배포를 위해 Vera Rubin NVL144, Vera Rubin NVL144 CPX, Vera Rubin CPX 또한 지원할 예정입니다.
NVIDIA Kyber, 고밀도 AI 컴퓨팅을 위한 랙 서버 혁신
NVIDIA NVLink Fusion 생태계 확장
차세대 AI 팩토리를 위한 오픈 생태계 구축
20개가 넘는 NVIDIA 파트너들이 오픈 스탠더드 기반의 랙 서버 공급에 참여함으로써, 미래의 기가와트급 AI 팩토리를 가능하게 하고 있습니다.
-
실리콘 공급업체: Analog Devices, Inc. (ADI), AOS, EPC, Infineon, Innoscience, MPS, Navitas, onsemi, Power Integrations, Renesas, Richtek, ROHM, STMicroelectronics and Texas Instruments
-
전력 시스템 부품 공급업체: BizLink, Delta, Flex, GE Vernova, Lead Wealth, LITEON and Megmeet
-
데이터 센터 전력 시스템 공급업체: ABB, Eaton, GE Vernova, Heron Power, Hitachi Energy, Mitsubishi Electric, Schneider Electric, Siemens and Vertiv
NVIDIA와 Open Compute Project에 대한 더 많은 정보는 10월 13일부터 16일까지 San Jose Convention Center에서 열리는 OCP Global Summit에서 확인할 수 있습니다.