NVIDIA 기술로 에너지 효율 높인 AI 증강 하이브리드 슈퍼컴퓨터

전통적 디지털 시뮬레이션과 가속 하이브리드 컴퓨팅을 위해 고안된 불세쿼나 XH3000이 NVIDIA CPU와 GPU, 네트워킹 테크놀로지를 만나 HPC와 AI, 양자 애플리케이션에 새로운 차원의 성능을 제공합니다
by NVIDIA Korea

아토스(Atos)가 차세대 고성능 컴퓨터를 선보이며 본격적인 엑사스케일 AI의 시대로 진입했습니다.

불세쿼나(BullSequana) XH3000은 아토스가 특허를 보유하고 있는 4세대 수냉식 HPC 디자인과 NVIDIA 테크놀로지를 결합해 한층 진화한 성능과 에너지 효율을 제공합니다.

이 시스템은 Arm 또는 x86 컴퓨팅 아키텍처의 선택을 사용자에게 맡기고 NVIDIA Grace와 인텔(Intel), AMD, 사이펄(SiPearl) 프로세서 버전으로 제공될 예정인데요. 가속 컴퓨팅의 경우 NVIDIA Tensor Core GPU 4개가 탑재된 노드를 지원합니다.

불세쿼나 XH3000은 또한 NVIDIA Quantum-2 InfiniBandNVIDIA ConnectX-7 InfiniBand, 이더넷(Ethernet) 어댑터 등의 네트워크 옵션을 유연하게 채택합니다. 이를 통해 컴퓨팅 노드를 10엑사플롭(exaflops)급의 혼합정밀 AI가 가능한 HPC 시스템으로 확장할 수 있죠.

하이브리드 HPC+AI+양자 시스템

그 결과 가장 까다롭다는 HPC 시뮬레이션과 AI 작업, 더 나아가 새롭게 부상 중인 양자 컴퓨팅의 워크로드까지 실행할 수 있는 유연한 하이브리드 컴퓨팅 플랫폼이 탄생했습니다.

불세쿼나 XH3000이 공개된 가상 행사에서 로돌프 벨머(Rodolphe Belmer) 아토스 CEO는 이 시스템이 “엑사스케일이라는 관문을 통과해 미래의 주요 과학과 산업상 혁신을 가능하게 할 것”이라고 전망했는데요.

유럽과 인도, 남미의 슈퍼컴퓨팅 부문에서 선두를 달리는 아토스는 70개국 이상에 걸쳐 고객을 보유하고 있으며, 본사와 더불어 제조와 R&D 기반 시설이 위치한 프랑스에서는 유명 기업으로 명성을 떨치고 있습니다.

광범위한 협업

불세쿼나 XH3000을 위한 최적화는 EXAIL의 최초 프로젝트였습니다. 2021년 11월에 출범을 알린 EXAIL은 NVIDIA와 아토스가 합작하는 Excellence AI Lab을 의미하는데요.

NVIDIA HPC/슈퍼컴퓨팅 영업 및 사업개발 부문의 존 조세파키스(John Josephakis) 부사장은 시스템 개발팀의 성과를 치하하는 영상 메시지에서 이렇게 말했습니다.

“NVIDIA의 AI/HPC 테크놀로지와 아토스의 저명한 전문성을 합작 연구소에서 결합한 이 플랫폼은 슈퍼컴퓨팅과 산업용 HPC에 산재한 과제들의 해결에 유의미한 인사이트를 훨씬 신속히 도출할 수 있게 해줄 것입니다”

EXAIL은 기후, 헬스케어와 유전체학, 양자 컴퓨팅, 엣지 AI/컴퓨터 비전, 사이버 보안 등의 분야에서 연구를 계속하고 있습니다. 해당 연구진은 헬스케어용 NVIDIA Clara와 보안용 NVIDIA Morpheus 등의 애플리케이션 프레임워크를 비롯해 양자 컴퓨팅용 NVIDIA cuQuantum SDK, 수백 개의 과학/기술 애플리케이션을 구동하는 NVIDIA HPC SDK에 액세스할 수 있습니다.

장기적이고 생산적인 관계

아토스가 율리히 슈퍼컴퓨팅 센터(Jülich Supercomputing Center)에 구축한 쥬얼스 부스터(JUWELS Booster)는 유럽 최초로 NVIDIA Ampere 아키텍처를 채택한 슈퍼컴퓨터입니다. NVIDIA A100 Tensor Core GPU 3,744개를 갖추고 2.5엑사플롭급의 혼합정밀 AI 성능을 제공하죠.

NVIDIA와 아토스의 연구진은 기후 변화에 대한 이해의 깊이를 더하고자 세계에서 가장 빠른 슈퍼컴퓨터 Top500 중 8위에 올라 있는 쥬얼스 부스터에서 AI 모델들을 실행할 계획입니다. 율리히 센터 연구자들의 경우 2021년 4월에 이 시스템을 활용해 최첨단 양자 회로 시뮬레이션을 진행하기도 했죠.

지난해 아토스는 NVIDIA DGX SuperPOD와 스웨덴 최대의 슈퍼컴퓨터를 기반으로 하는 베르셀리우스(BerzeLiUs)의 개발을 주도했습니다. 이와 더불어 유럽과 인도, 남미에 NVIDIA DGX 기반 슈퍼컴퓨팅 인프라도 제공해왔는데요.

현재는 이탈리아의 대학간 컨소시엄인 시네카(CINECA)에 슈퍼컴퓨터 레오나르도(Leonardo)를 구축하고 있습니다. NVIDIA Quantum InfiniBand 네트워크에 NVIDIA A100 GPU 14,000개를 탑재해 세계에서 가장 빠른 속도를 자랑할 이 AI 슈퍼컴퓨터는 10엑사플롭급 혼합정밀 AI 성능의 달성이 가능할 것으로 기대를 모읍니다.

이번 불세쿼나 XH3000의 공개를 계기로 NVIDIA와 아토스의 협업이 열어갈 무궁무진한 미래를 다시 한번 확인할 수 있었습니다.