HPC 데이터센터 운영자를 위한 가상 세계의 힘, NVIDIA Omniverse

NVIDIA Omniverse로 복잡한 시설의 설계자, 건설자, 운영자가 가상 세계의 힘을 활용하도록 지원합니다
by NVIDIA Korea

NVIDIA Omniverse 데모를 SC22에서 선보였습니다! 해당 데모는 데이터센터의 배후에서 개방형 개발 플랫폼을 사용해 복잡한 슈퍼컴퓨팅 시설의 설계, 개발을 향상시키는 방법을 보여줍니다.

전 세계 700만 데이터센터를 지원하는 기술이 빠르게 변화하고 있습니다. 덕분에 IT 조직은 최신 기술로 기하급수적으로 증가하는 데이터를 처리하면서 비용을 절감할 수 있죠.

시뮬레이션과 디지털 트윈은 데이터센터 설계자, 건설자, 운영자가 매우 효율적이고 높은 성능을 갖춘 시설을 만드는 데 도움을 줍니다. 하지만 AI 슈퍼컴퓨팅 시설의 모든 구성 요소를 정확하게 나타낼 수 있는 디지털 트윈을 구축하는 것은 거대하고 복잡한 작업입니다.

NVIDIA Omniverse 시뮬레이션 플랫폼은 협업 가상 설계 프로세스를 간소화해 복잡한 문제를 해결하도록 지원합니다.

Omniverse는 처음으로 데이터센터 운영자가 핵심 타사 컴퓨터 지원 설계, 시뮬레이션과 모니터링 애플리케이션의 실시간 데이터 입력을 집계해 전체 데이터 세트를 실시간으로 보고 작업할 수 있도록 지원합니다.

이번 데모에서는 Omniverse를 통해 사용자가 실시간 모니터링과 AI에 연결된 가속 컴퓨팅, 시뮬레이션 및 운영 디지털 트윈의 힘을 어떻게 활용할 수 있는지 시연했는데요. 이를 통해 시설 설계를 간소화하고 건설 및 배포를 가속화하며, 지속적인 운영을 최적화할 수 있습니다.

이번 데모의 또 다른 하이라이트는 NVIDIA Air입니다. NVIDIA Air는 Omniverse와 함께 작동하며, 데이터센터의 중앙 신경 시스템인 네트워크를 시뮬레이션 하도록 설계된 데이터센터 시뮬레이션 플랫폼입니다. NVIDIA Air를 활용하면 전체 네트워크 스택을 모델링할 수 있어 가동 전에 네트워크 하드웨어와 소프트웨어를 자동화하고 검증할 수 있습니다.

설계 및 시뮬레이션 향상을 위한 디지털 트윈 생성

NVIDIA 최신 AI 슈퍼컴퓨터 중 일부를 계획하고 구축하는 과정에서 오토데스크 레빗(Autodesk Revit), PTC 크레오(Creo), 트림블 스케치업(Trimble SketchUp)과 같은 타사 산업 도구에서 여러 엔지니어링 CAD 데이터 세트를 수집했습니다. 이를 통해 디자이너와 엔지니어는 완전 충실도(full fidelity)를 갖춘 USD(Universal Scene Description) 기반 모델을 볼 수 있었고, 실시간으로 협업해 설계를 반복할 수 있었습니다.

패치 매니저(Patch Manager)는 네트워크 도메인에서 케이블링, 자산 및 물리적 레이어의 점대점 방식(point-to-point)의 연결을 계획하는 기업용 소프트웨어 애플리케이션입니다. 패치 매니저가 Omniverse에 연결되면 포트 간 연결, 랙(rack) 및 노드(node) 레이아웃, 케이블링의 복잡한 토폴로지(topology)를 라이브 모델에 직접 통합할 수 있습니다. 이를 통해 데이터센터 엔지니어는 모델의 종속성과 전체 모습을 확인할 수 있습니다.

엔지니어들은 컴퓨터 유체 역학 소프트웨어인 케이던스 6시그마DCX(Cadence 6SigmaDCX)를 사용해 공기 흐름과 열 전달을 예측했습니다. 엔지니어는 NVIDIA Modulus로 훈련된 AI 대리 모델을 사용해 실시간에 가까운 “what-if” 분석을 수행할 수 있으며, 이를 통해 복잡한 열과 냉각의 변화를 시뮬레이션하고 그 결과를 즉시 확인할 수 있습니다.

또한 NVIDIA Air를 사용하면 프로토콜, 모니터링, 자동화를 포함한 정확한 네트워크 토폴로지를 시뮬레이션하고 사전에 검증할 수 있습니다.

머신 러닝 데이터센터 구축이 완료되면, Omniverse 내부 디지털 트윈에 센서, 제어시스템, 원격측정기를 연결해 운영 상황을 실시간으로 모니터링할 수 있습니다. 엔지니어는 완벽하게 동기화된 디지털 트윈을 통해 전력 피크 또는 냉각 시스템 오류와 같은 일반적인 위험 상황을 시뮬레이션할 수 있습니다. 또한 운영자는 에너지 효율 향상, 탄소 발자국 감소와 같은 주요 우선 순위에 최적화된 AI 추천 변경사항과 같은 혜택을 누릴 수 있습니다. 디지털 트윈을 이용하면 물리적인 데이터센터에 구축하기 전에 소프트웨어 및 구성 요소 업그레이드를 테스트하고 검증할 수 있습니다.

NVIDIA의 SC22 특별 연설에서 자세한 내용을 확인하고, 여기에서 NVIDIA Omniverse에 대해 알아보세요.