최신 데이터센터의 설계, 시뮬레이션, 구축은 성능, 에너지 효율성, 확장성 등 여러 가지 사항을 고려해야 하는 매우 복잡한 작업입니다.
또한 컴퓨팅과 네트워크 설계, CAD(computer-aided design) 모델링, 기계, 전기와 열 설계 전반에 걸쳐 고도로 숙련된 엔지니어들로 구성된 팀을 필요로 하죠.
NVIDIA는 세계에서 가장 혁신적인 AI 슈퍼컴퓨터를 구축하고 있습니다. 이번 GTC에서 NVIDIA GB200 NVL72 수냉식 시스템을 기반으로 하는 최신 대형 클러스터가 공개됐죠. 이 클러스터는 각각 18개의 NVIDIA Grace CPU와 36개의 NVIDIA Blackwell GPU를 포함하는 2개의 랙으로 구성되며, 4세대 NVIDIA NVLink 스위치로 연결됩니다.
그리고 GTC에서 NVIDIA Omniverse에서 디지털 트윈으로 완전 가동되는 데이터센터 데모를 공개했습니다. NVIDIA Omniverse는 AI 기반 3D 파이프라인, 툴, 애플리케이션, 서비스를 연결, 구축하는 플랫폼입니다.
NVIDIA는 새로운 데이터센터를 최대한 빠르게 구축하기 위해 먼저 Omniverse로 연결된 소프트웨어 툴로 디지털 트윈을 구축했습니다. NVIDIA Omniverse API로 구동되는 케이던스(Cadence) 리얼리티(Reality) 디지털 트윈 플랫폼을 사용해 여러 CAD 데이터세트를 통합, 시각화해 OpenUSD(Universal Scene Description)에서 완전한 물리적 정확도를 갖춘 포토리얼리즘으로 구현했죠.
설계, 시뮬레이션, 최적화 효율성과 정확도 향상
새로운 GB200 클러스터는 NVIDIA의 레거시 데이터센터 중 한 곳의 기존 클러스터를 대체하고 있습니다. 기술 기업인 키네틱 비전(Kinetic Vision)은 디지털 구축을 시작하기 위해 나브비스(NavVis) VLX 웨어러블 라이다 스캐너로 시설을 스캔했고, 매우 정확한 포인트 클라우드 데이터와 파노라마 사진을 생성했다.
이후 프리뷰3D(Prevu3D) 소프트웨어를 사용해 기존 클러스터를 제거하고 포인트 클라우드를 3D 메시로 변환했습니다. 이를 통해 새로운 디지털 데이터센터를 시뮬레이션할 수 있는 물리적으로 정확한 시설의 3D 모델을 만들 수 있었습니다.
엔지니어는 케이던스 리얼리티 플랫폼을 사용해 여러 CAD 데이터세트를 결합하고 시각화해 정밀도와 사실감을 높였습니다. 케이던스 플랫폼과 Omniverse 통합으로 OpenUSD 기반 3D 툴, 워크플로우, 애플리케이션을 개발할 수 있는 강력한 컴퓨팅 플랫폼을 제공합니다.
Omniverse Cloud API는 패치 매니저(PATCH MANAGER)와 NVIDIA Air를 비롯한 더 많은 툴과의 상호 운용성을 추가했습니다. 팀은 패치 매니저로 클러스터와 네트워킹 인프라의 물리적 레이아웃을 설계해 케이블 길이 정확성과 라우팅 구성 적절성을 확인했습니다.
NVIDIA Modulus API와 NVIDIA Grace Hopper로 가속화된 케이던스 리얼리티 디지털 트윈 솔버를 사용해 공기 흐름을 시뮬레이션하고, 버티브(Vertiv), 슈나이더 일렉트릭(Schneider Electric) 등 파트너의 새로운 액체 냉각 시스템 성능을 시뮬레이션했습니다. GB200 트레이의 통합 냉각 시스템은 앤시스(Ansys)의 솔루션을 사용해 시뮬레이션 데이터를 디지털 트윈으로 불러와 시뮬레이션, 최적화됐죠.
데모는 디지털 트윈을 통해 사용자가 실제 시스템을 제작하기 전 데이터센터 설계를 완벽하게 테스트, 최적화, 검증할 수 있는 방법을 선보였습니다. 디지털 트윈에서 데이터센터의 성능을 시각화해 설계를 더욱 최적화하고 가상 시나리오를 계획할 수 있죠.
더불어 케이블 길이, 전력, 냉각, 공간과 같은 서로 다른 경계 조건의 균형을 통합 조정해 데이터센터와 클러스터 설계를 개선할 수 있습니다. 이로써 엔지니어와 설계 팀은 이전보다 훨씬 더 빠르고 효율적인 클러스터 온라인 상태 전환과 최적화를 할 수 있습니다.
NVIDIA Omniverse와 NVIDIA Blackwell에 대해 더 자세히 알아보세요.