지난 주 실리콘밸리에서 열린 AI Infrastructure Summit에서 NVIDIA의 Accelerated Computing 담당 부사장 Ian Buck이 과감한 새로운 비전을 공개했습니다. 이는 기존의 데이터센터를 완전히 통합된 AI 팩토리로 전환하는 것을 목표로 하는 비전이기도 한데요.
이러한 이니셔티브의 일환으로, NVIDIA는 전 세계의 파트너와 기업에 공유할 수 있는 레퍼런스 디자인을 개발하고 있는데요, 이는 AI 추론 시대에 최적화된 고성능이면서도 에너지 효율적인 인프라 구축을 위한 NVIDIA Omniverse Blueprint를 제공하는 것이 목표입니다.
사실 이미 NVIDIA는 건축 설계, 전력망 통합, 전력, 냉각, 오케스트레이션 등 인프라의 모든 계층에서 수많은 기업들과 협력하고 있습니다.
따라서 이는 단순히 칩과 시스템을 넘어서 새로운 산업 용도의 제품군으로 확장하는 자연스러운 진화라고 할 수 있는데요, 이러한 제품은 워낙 복잡하고 상호 연결되어 있기 때문에, 어느 한 기업만으로는 구축할 수 없습니다.
NVIDIA는 산업과 기술 파트너들과 함께 오랜 기간 쌓은 인프라 전문성을 다시 활용하여 이 새로운 AI 팩토리를 구축하고 있지요.
특히 이 중 Jacobs는 디자인 통합자(design integrator)로서, 인프라의 물리적 및 디지털 계층을 조율해 원활한 오케스트레이션을 지원합니다. 레퍼런스 디자인의 구현은 바로 AI 팩토리의 디지털 트윈(digital twin)으로 구체화되는데요, 이 디지털 트윈은 데이터센터 내부의 IT 시스템부터 내부 및 외부 전력, 냉각 시스템의 운영 기술까지 통합하게 됩니다.
특히 새로운 이니셔티브는 디지털 트윈을 한층 확장해, 지역 전력 생산, 에너지 저장 시스템, 냉각 기술, 운영을 위한 AI 에이전트까지 아우르게 되는데요.
한편, 전력 및 냉각 분야에서 오랜 기간 협력해 온 Schneider Electric, Siemens, Vertiv가 AI 작업 부하에 최적화된 고효율·고탄력 환경 설계에 중요한 역할을 하고 있습니다. 또한 Siemens와 Siemens Energy는 내부 전력 공급에 핵심적 역할을 하며, 신속하고 지속적인 전력 공급을 통해 기가와트 규모의 에너지 수요를 충족할 수 있도록 지원하고 있습니다. GE Vernova도 전력 생산 및 랙 수준의 전력화에 협력하고 있죠.
게다가 Cadence, Emerald AI, E Tech Group, phaidra.ai, PTC, Schneider Electric with ETAP, Siemens, Vertech 등 여러 인프라 설계, 시뮬레이션, 오케스트레이션 전문 기업도 NVIDIA와 함께 시스템 차원에서의 변화를 이끌고 있습니다.
이 비전의 핵심에는 투입하는 모든 전력이 곧바로 인공지능 생성에 직접 기여할 수 있도록 최적화하는 과제가 있습니다.
현재 데이터센터들은 종종 컴퓨팅 플랫폼과 별개로 설계되어, 전력 분배, 냉각, 시스템 오케스트레이션에서 비효율이 발생합니다. NVIDIA와 파트너들은 이러한 기존 모델을 뒤집고 있으며, 인프라와 기술 스택을 동시에 설계함으로써, 전력, 냉각, 컴퓨팅, 소프트웨어가 통합된 시스템 최적화를 실현하고 있습니다.
이 과정에서 시뮬레이션이 매우 중요한 역할을 담당하는데요, 기업들은 Omniverse를 통해 AI 팩토리 디지털 트윈을 활용하여, 실제 부품이 준비되기 전에 필요한 에셋을 시뮬레이션할 수 있습니다.
이러한 디지털 트윈은 단지 사전 최적화에만 그치지 않고, 실제 시설 운용 시에도 효과적으로 활용되는데, 오픈USD 프레임워크를 채택한 시뮬레이션 플랫폼은 전력, 냉각, 네트워킹 인프라 등 다양한 시설 운영 요소를 정밀하게 모델링할 수 있으므로, 더욱 똑똑하고 신뢰성 높은 시설을 설계할 수 있습니다.
그리고 이러한 복잡성은 시설 내부에만 국한되지 않고, AI 팩토리는 전력망, 수도, 교통 네트워크와도 긴밀히 연결되어야 하므로, 전 생애 주기에 걸친 정교한 조정과 시뮬레이션이 필요하게 됩니다.
실제로 이러한 노력은 이미 시작되었는데요, 올해 초 NVIDIA는 AI 팩토리 디지털 트윈을 위한 Omniverse Blueprint를 도입하였고, 플랫폼인 Cadence와 ETAP를 연결해 단일 물리적 사이트가 선정되기 전에도 기가와트급 시설을 모델링할 수 있게 하였습니다.
최근에는 Delta, Jacobs, Siemens, Siemens Energy와의 통합으로 전력, 냉각, 네트워킹 시스템의 통합 시뮬레이션 환경을 더욱 강화하였는데요, 이 Blueprint가 내년에 완성되면, 파트너들은 API와 시뮬레이션용 디지털 자산을 통해 시스템에 접속하여, 설계, 배포, 운용 등 전체 생애주기에 걸친 실시간 협업과 오케스트레이션이 가능해질 것입니다.
결국 이 덕분에 기존 데이터 센터가 각기 독립적으로 운영되던 것과 달리, AI 팩토리는 모듈성, 탄력성, 확장성을 두루 갖춰 설계됩니다.
한편, 최신 AI 인프라 혁신을 경험하고 싶으시다면, NVIDIA GTC Washington, D.C.에서 전문가 강연과 실습, 파트너 쇼케이스에 직접 참여해보세요.
소프트웨어 제품 정보에 대해서는 별도의 공지를 참고하시기 바랍니다.