전세계 고성능컴퓨팅의 기준 높인 엔비디아와 ARM의 협력

by NVIDIA Korea

NVIDIA가 Arm사와의 협력을 통해 지난 18개월간 고성능컴퓨팅(HPC) 분야에서 Arm 기반 플랫폼의 성능을 25.5배 향상시켰습니다.

Arm 네오버스 N1 코어는 Ampere 컴퓨팅 기반의 알트라(Altra)와 같은 시스템온칩(SoC)의 성능을 작년 디자인 대비 약 2.3배 높였는데요. NVIDIA의 A100 Tensor Core GPU는 단일 세대에서 역대 최고의 성능 향상을 달성했고, 최신 Arm 기반 플랫폼은 코어, 입출력 레인과 메모리 속도를 개선했습니다.

이를 통해 2개의 Ampere 컴퓨팅 기반 알트라 SoC와 2개의 A100 GPU로 구성된 NVIDIA의 HPC용 Arm 기반 레퍼런스 디자인은 연구원들이 2019년 6월에 사용했던 듀얼-SoC 서버 대비 25.5배에 달하는 성능을 구현했습니다. NVIDIA와 Arm은 GPU로 가속화된 Arm 기반 레퍼런스 플랫폼에 한해서만 1년 만에 2.5배의 성능 개선을 달성했는데요.

이 같은 성과는 코로나19 팬데믹 상황에서 그로맥스(GROMACS), 램스(LAMMPS), MILC, NAMD, 퀀텀 에스프레소(Quantum Espresso)와 같이 신약 개발의 핵심이 되는 주요 HPC 애플리케이션의 성능을 높일 예정입니다. 이 외에도 Arm 기반 시스템 운영체제에서 실행될 수 있는 다양한 애플리케이션은 NVIDIA의 GPU 가속 소프트웨어 허브인 NGC 컨테이너에서 이용할 수 있습니다.

분자역학, 양자화학 등의 분야에서 한계를 극복해 나가고 있는 기업과 연구원들은 이러한 애플리케이션들을 활용해 기초과학뿐 아니라 헬스케어 등과 같은 분야의 발전을 이끌 수 있습니다.

Arm과 HPC의 결합

최신 레퍼런스 아키텍처는 2U 크기의 서버 플랫폼인 Ampere 컴퓨팅 기반 마운틴 제이드(Mt. Jade)의 에너지 효율적인 처리량과 이미 전 세계의 주요 슈퍼컴퓨터를 가속화하고 있는 NVIDIA의 HGX A100가 결합된 것이다. 이 아키텍처는 Marvell ThunderX2와 NVIDIA V100 GPU를 기반으로 지난해 첫 선을 보인 디자인의 후속작입니다.

마운틴 제이드는 Arm 네오버스 N1 코어를 기반으로 각각 80개의 코어가 탑재된 암페어 알트라 SoC 2개로 구성되어 있으며, 모두 최대 3GHz 속도로 실행됩니다. 2개의 A100 GPU에는 무려 192개의 PCIe 4세대 레인과 최대 8TB의 메모리가 제공됩니다.

1119 블로그 [이미지] 마운틴 제이드 서버 플랫폼은 192개의 PCIe 4세대 레인을 지원한다
마운틴 제이드 서버 플랫폼은 192개의 PCIe 4세대 레인을 지원합니다
이러한 조합으로 차세대 슈퍼컴퓨터용 노드의 성능이 극대화됐는데요. Ampere 컴퓨팅은 이미 기가바이트(Gigabyte), 레노버(Lenovo), 위윈(Wiwynn) 등 9개의 기존 장비 및 디자인 제조업체와 시스템 통합업체의 지원을 받고 있습니다.

Arm HPC 생태계의 부상

Arm HPC 유저 그룹은 생태계 확대를 위해 AWS, HPE, 율리히 슈퍼컴퓨팅센터(Juelich Supercomputing Center), 일본 이화학연구소(RIKEN), 미국 오크리지국립연구소(Oak Ridge National Laboratory)와 샌디아국립연구소(Sandia National Labs) 등의 글로벌 유수기관과 슈퍼컴퓨팅 2020 행사 이전에 30여 차례 이상 가상회의를 개최했습니다.

그리고 올해 6월 Arm은 슈퍼컴퓨팅 분야에서 가장 큰 도약을 이뤄냈는데요. 바로 일본 후가쿠(Fugaku) 시스템이 후지쯔(Fujitsu)의 Arm 기반 A64FX CPU를 사용해 415.5페타플롭(PF)이라는 놀라운 성능 기록을 세우며 세계에서 가장 빠른 슈퍼컴퓨터 상위 500대 리스트에서 1위로 등극한 것입니다.

후가쿠 시스템은 상위 500대 리스트에 오른 4개의 Arm 기반 슈퍼컴퓨터 중에 하나가 됐죠.  Arm의 차세대 네오버스 디자인에 내장된 기술인 Arm SVE(Scalable Vector Extension)을 최초로 사용한 슈퍼컴퓨터이기도 합니다.

AWS는 이미 유전체학, 금융 리스크 모델링, 유체역학과 같은 클라우드 HPC 작업을 Arm 기반 그래비톤2 프로세서에서 수행하고 있습니다.

Arm과 함께 HPC 분야 성장을 가속화하는 NVIDIA

Arm의 HPC 분야 성장은 스마트폰 및 슈퍼컴퓨터 분야에 종사하는 1,300만여 개발자들로 구성된 방대한 생태계를 기반으로 합니다. NVIDIA는 세계 최고의 AI 선도기업으로 자리매김하기 위해 Arm을 인수함으로써 이러한 생태계를 확장하는 것을 목표로 하고 있습니다.

NVIDIA는 AI, HPC, 네트워킹과 그래픽 소프트웨어 분야에 걸쳐 Arm을 지원해 생태계를 확대하고 있습니다. 작년 슈퍼컴퓨팅 행사에서 젠슨 황 NVIDIA창립자 겸 CEO는 IBM 파워(POWER)와 x86아키텍처에 대한 지속적인 지원 외에도 HPC 분야에서 Arm의 성장을 가속화한다는 계획을 발표했습니다.

1119 블로그 [이미지] 엔비디아는 Arm 생태계에 대한 지원을 확대했다
NVIDIA는 Arm 생태계에 대한 지원을 확대합니다
이후, Arm 지적재산권(IP)을 사용해 클라우드, 임베디드 및 엔터프라이즈 애플리케이션 전반에서 안전한 네트워킹과 스토리지 작업을 가속화하는 BlueField-2 DPU를 발표했는데요. NVIDIA는 10년이 넘는 기간 동안 로보틱스 및 임베디드 시스템용 Jetson Nano 모듈과 같은 제품에 Arm 디자인을 적극 사용해왔습니다.