공동 설계된 AI 인프라 구축을 위한 가이드인 NVIDIA Vera Rubin DSX AI 팩토리 레퍼런스 디자인, 그리고 NVIDIA Vera Rubin DSX와 완벽하게 호환되는 NVIDIA Omniverse DSX Blueprint가 정식 출시됐습니다! 이제 대규모 설계, 구축, 운영을 위한 물리적으로 정확한 AI 팩토리 디지털 트윈 구현이 가능해집니다.
업계 선도 기업들은 이러한 대규모 AI 팩토리 구축의 계획, 건설, 운영을 지원하기 위한 레퍼런스 디자인과 블루프린트 개발에 참여하고 있는데요. 여기에는 케이던스(Cadence), 다쏘시스템(Dassault Systèmes), 이튼(Eaton), 제이콥스(Jacobs), 엔스케일(Nscale), 파이드라(Phaidra), 프로코어(Procore), PTC, 슈나이더 일렉트릭(Schneider Electric), 지멘스(Siemens), 스위치(Switch), 트레인 테크놀로지스(Trane Technologies), 버티브(Vertiv) 등이 포함됩니다.
NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “AI 시대에 인텔리전스 토큰은 새로운 화폐이며, AI 팩토리는 이를 생성하는 인프라입니다. NVIDIA Vera Rubin DSX AI 팩토리 레퍼런스 디자인과 Omniverse DSX Blueprint를 통해 세계에서 가장 생산적인 AI 팩토리를 구축할 수 있는 기반을 제공합니다. 초기 수익 창출까지의 시간을 앞당기고, 규모와 에너지 효율을 극대화할 것입니다”라고 말했습니다.
전력 효율을 극대화하는 AI 팩토리 구축
훈련과 추론에 대한 수요 증가에 대응하기 위한 대규모 AI 팩토리 구축은 복잡한 작업인데요. 인프라, 전력, 냉각, 네트워킹, 소프트웨어, 컴퓨팅 전반에 걸친 정밀한 조율이 필요합니다.
NVIDIA Vera Rubin DSX AI 팩토리 레퍼런스 디자인은 컴퓨팅, NVIDIA Spectrum-X™ 이더넷 네트워킹, 스토리지를 아우르는 전체 AI 팩토리 인프라 스택의 설계, 구축, 운영 방안을 제시합니다. 이를 통해 반복과 확장이 가능한 구조로 최적화된 클러스터 성능을 구현하죠. 또한 레퍼런스 디자인에 포함된 문서는 업계 파트너들이 전력, 냉각, 제어 시스템을 설계, 구축, 운영할 수 있도록 모범 사례를 제공합니다. 하드웨어와 소프트웨어의 원활한 통합과 확장 가능한 배포를 지원합니다.
Vera Rubin DSX 소프트웨어 스택은 개방형, 모듈형, 조합형 구조를 갖추고 있습니다. 따라서 클러스터 하드웨어를 전력, 냉각 시스템과 연결해 가용 에너지 와트당 AI 토큰 성능을 극대화하는데요. 이러한 유연한 설계를 바탕으로 AI 팩토리 구축 기업과 데이터센터 제공업체는 필요한 만큼의 구성 요소를 자유롭게 배포할 수 있습니다.
Rubin DSX는 파트너사가 이를 기반으로 개발할 수 있는 다양한 소프트웨어 라이브러리를 제공합니다.
- DSX Max-Q는 AI 팩토리와 생태계 파트너가 고정된 전력 예산 내에서 NVIDIA 시스템의 컴퓨팅 처리량과 와트당 토큰 성능을 극대화할 수 있도록 지원합니다.
- DSX Flex는 AI 팩토리를 전력망 서비스와 연결해 전력 사용량을 동적으로 조정합니다. 그리고 하이브리드 현장 발전과 수요를 조정해, 에너지를 절감하고 전력망 안정성을 유지하죠.
- DSX Exchange는 IT, 운영 기술, 운영 에이전트 간에 컴퓨팅, 네트워크, 에너지, 전력, 냉각 설비 신호를 확장 가능하고 안전하게 통합할 수 있도록 지원합니다.
- DSX Sim은 NVIDIA DSX Air 플랫폼을 활용해 GPU, 네트워킹, 파트너 인프라를 모델링함으로써 AI 팩토리를 고정밀도 디지털 트윈으로 검증합니다. 또한 DSX SimReady는 상세한 3D 구조, 물류, 시스템 동작을 연결해 초기 수익 창출까지의 시간을 단축하고 초기 성능을 보장합니다.
AI 팩토리 설계와 시뮬레이션 가속
상세한 아키텍처가 있더라도 대규모 AI 팩토리를 설계, 구축, 운영하는 것은 어렵습니다. 기존 설계 방식은 전체 시스템 모델링, 전력 사용의 유연성과 효율성 확보, 착공 전 설계 검증 측면에서 한계가 있죠.
NVIDIA Omniverse DSX Blueprint는 대규모 AI 팩토리의 설계와 운영을 위한 개방형 종합 프레임워크를 제공합니다. 현재 build.nvidia.com에서 정식 출시됐습니다. Omniverse DSX는 Vera Rubin DSX AI 팩토리 레퍼런스 디자인과 완전한 호환성을 제공합니다. 이를 통해 개발자는 AI 팩토리의 물리적으로 정밀한 디지털 트윈을 구축하고, 운영을 실시간으로 시뮬레이션하며, 구축 또는 배포 전에 성능을 최적화할 수 있습니다.
Omniverse DSX는 전력, 냉각, 네트워킹, 운영을 단일 환경으로 통합해 수익 창출 기간을 단축하고, AI 효율성을 높입니다. 기업은 NVIDIA Omniverse™ 라이브러리를 사용해 레이아웃, 전력 토폴로지, 열적 거동, 운영 정책을 시뮬레이션하고, 생산 중단 없이 하드웨어나 워크로드 변경사항을 평가할 수 있죠.
새로운 레퍼런스 디자인과 Blueprint를 도입하는 업계 선도 기업들
신뢰할 수 있고 확장 가능한 전력과 냉각 시스템은 모든 AI 팩토리의 핵심입니다. 이는 지능형 시스템이 변화하는 컴퓨팅 수요에 실시간으로 적응하는 동시에 효율성과 가동 시간을 극대화할 수 있도록 지원하죠. 에너지부터 소프트웨어에 이르기까지 폭넓은 파트너 생태계는 DSX를 도입해, AI 팩토리의 전체 수명주기를 복원력, 정밀성, 효율성을 기반으로 공동 설계된 최적화 시스템으로 구축하고 있습니다.
다쏘시스템은 CATIA 소프트웨어 기반의 모델 기반 시스템 엔지니어링(Model Based Systems Engineering, MBSE) 플랫폼에 새로운 레퍼런스 디자인과 Blueprint를 통합해 AI 팩토리 버추얼 트윈(Virtual Twin) 구축을 지원하고 있습니다. 이를 통해 신뢰성과 효율성을 높이는 동시에 첫 수익 창출까지의 시간을 단축하고 있죠. 슈나이더 일렉트릭은 자사의 ETAP 플랫폼을 통합해 사용자가 전력 분배 시스템을 시뮬레이션하고 최적화할 수 있도록 지원합니다.
케이던스는 NVIDIA GB300 NVL72 시스템의 SimReady 모델을 자사의 리얼리티 데이터센터 디지털 트윈 플랫폼(Reality Data Center Digital Twin Platform)과 통합해 열과 유체 데이터 시뮬레이션을 수행합니다. 이를 통해 AI 팩토리 설계와 운영을 최적화하고, NVIDIA Vera Rubin 시스템 모델링을 위한 협력도 이어가고 있습니다. 지멘스는 AI 인프라를 위해 고밀도 컴퓨팅과 전력, 냉각, 자동화 간의 균형을 맞추는 프레임워크를 개발하고 있습니다.
제이콥스는 Omniverse DSX Blueprint를 활용한 새로운 데이터센터 디지털 트윈 솔루션(Data Center Digital Twin solution)을 개발해, 건설사와 운영사가 계획, 설계, 구축, 운영 단계에서 AI 팩토리를 최적화할 수 있는 디지털 트윈을 제공합니다. PTC는 DSX 액셀러레이터(DSX Accelerator)를 위한 자사의 윈드칠(Windchill) 제품 수명주기 관리(product lifecycle management, PLM) 솔루션에 Blueprint를 통합해, 엔지니어링과 제품 설계 데이터를 실시간 고정밀 시뮬레이션과 연결하고, 파트너와 공급업체의 자재 명세서를 관리합니다. 프로코어는 NVIDIA Omniverse 라이브러리와 DSX Blueprint를 자사 프로코어 플랫폼(Procore Platform)에 통합해 건설 수명주기 전반에 걸친 연속적인 디지털 스레드를 구현하고 있습니다.
스위치는 Omniverse DSX Blueprint를 활용해 실시간 텔레메트리 수집, Rubin DSX 레퍼런스 디자인 사양에 맞춰 지속적으로 업데이트되는 디지털 트윈, 전력·냉각·워크로드의 자동 최적화를 지원하는 EVO AI 팩토리(EVO AI Factories)와 LDC EVO 운영체제(LDC EVO operating system)를 구축하고 있습니다. 엔스케일과 캐터필러(Caterpillar)는 세계 최대 규모의 AI 팩토리 중 하나인 웨스트버지니아의 멀티 기가와트급 부지에서 DSX Vera Rubin 레퍼런스 디자인을 구현하고 있죠.
코어위브(CoreWeave)는 NVIDIA DSX Air를 활용해 클라우드에서 AI 팩토리 디지털 트윈을 구축하고 테스트하고 있으며, 실제 구축보다 훨씬 이전부터 운영 리허설을 수행함으로써 검증 시간을 단축하고 있습니다.
NVIDIA의 파트너 생태계는 장비와 하드웨어의 SimReady 에셋을 제공해, AI 팩토리 운영사가 실제 구축에 앞서 설계를 시뮬레이션하고, 검증하며, 개선할 수 있도록 지원합니다. 이튼, 슈나이더 일렉트릭, 지멘스, 트레인 테크놀로지스, 버티브는 자사 발전기, 전기 장비, 냉각 시스템의 SimReady 에셋을 DSX 설계와 엔지니어링 기업에 제공해 실제 환경에 구축하기 전에 전체 설계를 검증하고 시뮬레이션할 수 있도록 지원하고 있죠.
버티브는 Omniverse DSX Blueprint를 활용해 AI 팩토리 구축을 가속하고 와트당 AI 출력 향상을 목표로 설계된 조립식 통합 데이터센터 인프라 솔루션인 버티브 원코어 Rubin DSX(Vertiv OneCore Rubin DSX)를 구축하고 있습니다. 트레인 테크놀로지스는 기가와트급 AI 팩토리의 열 관리 최적화를 위해 Blueprint를 활용해 냉각 설비의 전력 소비를 줄이고 효율성을 높이고 있습니다.
파이드라는 자사의 새로운 자율 학습 AI 에이전트에 DSX Max-Q를 통합해, 안전성을 유지하고 수익 창출을 위한 토큰 생산에 필요한 전력을 확보하고 있는데요. 동시에 냉각 부하 급증을 줄여 약 10% 더 높은 컴퓨팅 성능을 제공하고 있습니다.
글로벌 에너지 선도 기업, Omniverse DSX Blueprint로 전 세계 전력망 현대화
현재 에너지는 AI 인프라 구축의 가장 큰 병목 요인이죠. 3,000억 달러 이상의 장비 공급 적체가 발생하고, 미국 내 계통 연계 대기열(interconnection queues)에는 200기가와트 이상의 프로젝트가 대기 중입니다.
이를 해결하기 위해 NVIDIA는 전력 공급을 가속화하고 전력망 안정성을 강화하기 위해 주요 에너지 공급업체와 협력하고 있습니다.
- 에메랄드 AI(Emerald AI)는 자사의 컨덕터(Conductor) 플랫폼에 DSX Flex를 통합해 AI 팩토리가 전력을 실시간으로 관리할 수 있도록 지원하고 있습니다. 필요에 따라 전력 수요를 증감하고, 유연한 부하를 새로운 전용 발전 설비와 연계해 조정하는 것인데요. 이렇게 전력 공급업체가 신뢰할 수 있는 소프트웨어 기반 부하 제어를 통해 더 크고 빠른 전력망 연결을 승인할 수 있도록 지원합니다.
- GE 버노바(GE Vernova)는 전력망부터 AI 팩토리에 이르는 전체 전력 스택에 걸쳐 디지털 트윈 기능을 확장하고 있습니다. 이는 NVIDIA DSX 레퍼런스 아키텍처와 연동해 전력과 컴퓨팅 모델링을 통합함으로써, 대규모 AI 팩토리를 위한 인프라 구축을 더욱 빠르고 정확하며 예측 가능하게 합니다.
- 히타치(Hitachi)는 NVIDIA와 협력해 기가와트급 AI 팩토리를 위한 전력망 계획을 가속화하며, 효율적이고 안정적으로 전력을 공급하고 있습니다. 이를 위해 피지컬 AI, 전력 시스템, 자동화 분야의 전문성과 첨단 컴퓨팅 플랫폼을 결합하고 있죠.
- 지멘스 에너지(Siemens Energy)는 자사 노에드라(Noedra) 디지털 트윈 플랫폼에 NVIDIA RAPIDS™ 라이브러리, NVIDIA Metropolis 플랫폼, NVIDIA Isaac Sim™ 프레임워크를 활용해 전력망 상태를 실시간으로 모니터링하고, 고장 발생 전에 위험을 예측하며, 예기치 않은 정전을 줄이고 있습니다.
