AI와 HPC 플랫폼 NVIDIA HGX, 차세대 슈퍼컴퓨터 탑재로 과학적 탐구 촉진

by NVIDIA Korea

NVIDIA HGX 고성능컴퓨팅(HPC) 플랫폼이 영국 에든버러대학교에서 호스팅 되는 DiRAC의 차세대 슈퍼컴퓨터 ‘투르사(Tursa)’에 탑재됩니다. DiRAC은 천문학, 우주론, 입자 물리학과 핵 물리학에 대한 HPC 기반 연구를 추진하는 영국의 통합 슈퍼컴퓨팅 시설입니다.

전산 입자 물리학에 최적화된 투르사는 NVIDIA A100 Tensor Core GPU, NVIDIA HDR 200Gb/s InfiniBand 네트워킹NVIDIA Magnum IO 소프트웨어를 포함한 NVIDIA HGX 플랫폼 기술로 가속화될 4대의 차세대 DiRAC 슈퍼컴퓨터 중 세 번째 모델입니다. 네 번째 DiRAC 슈퍼컴퓨터에는 NVIDIA InfiniBand 네트워킹 기술이 적용됩니다.

트루사는 연구진들이 대형 강입자 충돌기(Large Hadron Collider)와 같은 대규모 입자 물리학 실험의 데이터를 해석하는데 필요한 아원자 입자 성질에 대한 초고정밀 계산을 수행하도록 지원합니다.

NVIDIA의 네트워킹 담당 수석 부사장 길라드 샤이너(Gilad Shainer)는 “DiRAC는 연구진이 우주의 신비를 탐구하는데 상당한 기여를 하고 있습니다. DiRAC와의 협력은 NVIDIA GPU, DPU 및 InfiniBand in-network 컴퓨팅 가속 엔진의 탁월한 성능을 활용하는 다양한 워크로드에 걸쳐 최첨단 기술 기반의 과학적 탐구를 촉진시킬 것입니다”라고 설명했습니다.

에든버러대학교의 이론 물리학 교수이자 DiRAC-3 슈퍼컴퓨터 구축 프로젝트를 이끌고 있는 루이지 델 데비오(Luigi Del Debbio)는 “트루사는 과학적 모델링과 시뮬레이션에 대한 새로운 가능성을 열어주는 고유의 연구 과제를 해결하도록 설계됐습니다. NVIDIA 가속 컴퓨팅 플랫폼은 네트워크 대역폭과 플롭(flops)의 균형을 정밀하게 조정하여 우리 연구에 필요한 최고의 성능을 구현함으로써 새로운 발견을 가속화하도록 합니다”라고 말했죠.

아토스(Atos)로 구축되어 올해 말 가동될 예정인 트루사 슈퍼컴퓨터에는 448개의 NVIDIA A100 Tensor Core GPU가 탑재되며, 노드 당 4개의 NVIDIA HDR 200Gb/s InfiniBand 네트워킹 어댑터가 포함됩니다. NVIDIA Magnum IOe GPUDirect RDMA은 래티스 퀀텀 크로모다이내믹스(Lattice Quantum ChromoDynamics)를 사용하는 초대규모 과학 애플리케이션을 위한 최고 수준의 노드 간 대역폭과 확장성을 구현합니다.

DiRAC에서 운영하는 4대의 슈퍼컴퓨터는 각각 캠브리지대학교, 더럼대학교, 에든버러대학교와 레스터대학교에서 호스팅됩니다.

캠브리지대학교의 CSD3, 그리고 더럼대학교의 COSMA-8

NVIDIA는 지난 4월 GTC 21에서 CSD3(Cambridge Service for Data Driven Discovery)가 NVIDIA HGX A100 GPU, BlueField DPU와 NVIDIA HDR 200Gb/s InfiniBand가 포함된 새로운 4 페타플롭(PF) Dell-EMC 시스템을 통해 성능을 개선하고, 영국내 연구 커뮤니티에 안전한 멀티테넌트 베어메탈 HPC, AI와 데이터 분석 서비스를 지원한다고 발표했는데요. CSD3는 세계 500대 슈퍼 컴퓨터 중 하나가 될 것으로 예상되며, 캠브리지의 DiRAC 데이터 인텐시브 서비스(DiRAC Data Intensive Service)는 CSD3 시스템의 일부입니다.

또한, NVIDIA는 영국내 유수의 우주과학자들이 우주 기원 연구에 사용하게 될 더럼대학교의 새로운 COSMA-8 슈퍼컴퓨터는 Dell 기술을 기반으로 하며, NVIDIA HDR 200Gb/s InfiniBand 네트워킹으로 가속화된다고 설명하기도 했습니다.

한편, 레스터대학교에서 호스팅될 네 번째 슈퍼컴퓨터에 대한 보다 자세한 내용은 올해 말 공개될 예정입니다.