유럽의 슈퍼컴퓨팅 전문가 연례 행사인 ISC에서 선보인 것처럼 오늘날의 거대한 도전에 직면하고 있는 연구자들은 슈퍼컴퓨팅으로 주목받고 있는데요.
일부 연구자들은 새로운 에너지원을 실험하기 위해 디지털 트윈을 구축하고 있고, 또 다른 일부는 인간의 두뇌를 깊숙이 들여다보기 위해 AI+HPC를 사용합니다.
NVIDIA 가속 컴퓨팅 담당 부사장 이안 벅(Ian Buck)은 ISC 특별 연설에서 “연구자들은 매우 민감한 장비를 사용하거나 하이브리드 양자 시스템에 대한 시뮬레이션을 가속화하여 고성능 컴퓨팅(HPC)을 최첨단으로 끌어올리고 있습니다”라고 말했습니다.
10개의 AI 엑사플롭스(Exaflops) 제공
예를 들면, 로스 알라모스 국립연구소(LANL)의 새로운 슈퍼컴퓨터 베나도(Venado)는 재료 과학, 재생에너지와 같은 분야에서 작업을 진행하기 위해 10 엑사플롭의 AI 성능을 제공할 것입니다.
LANL 연구원들은 NVIDIA GPU, CPU와 DPU를 사용해 다중 물리(computational multi-physics) 애플리케이션의 속도를 30배 향상하는 것을 목표로 하죠.
베나도는 NVIDIA Grace Hopper 슈퍼칩을 사용하여 이전 GPU보다 최대 3배 더욱 빠른 워크로드를 실행할 것입니다. 또한 NVIDIA Grace CPU 슈퍼칩을 통해 가속되지 않은 애플리케이션에서 기존 CPU의 와트당 성능을 두 배 향상시킵니다.
기세를 올리는 BlueField
LANL 시스템은 호스트 CPU에서 통신, 스토리지 작업을 오프로드하고 가속화하기 위해 NVIDIA BlueField DPU를 채택한 최신 제품 중 하나입니다.
또한 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center)는 BlueField-2 DPU를 론스타(Lonestar)6의 NVIDIA Quantum InfiniBand 네트워크에 추가하고 있습니다. 이는 워크로드를 안전하게 격리하는 동시에 베어메탈 성능으로 여러 사용자와 애플리케이션을 호스팅하는 클라우드 네이티브 슈퍼컴퓨팅을 위한 개발 플랫폼이 될 것이죠.
이안 벅은 “이것이 차세대 슈퍼컴퓨팅과 HPC 클라우드를 위해 선택한 아키텍처입니다”라고 설명했습니다.
유럽에서의 엑사스케일
유럽에서 NVIDIA와 사이펄(SiPearl)은 Arm에서 엑사스케일 컴퓨팅을 구축하는 개발자 생태계를 확장하기 위해 협력하고 있습니다. 이 작업은 해당 지역의 사용자가 NVIDIA 가속 컴퓨팅 및 네트워킹 기술과 함께 사이펄의 레아(Rhea), 향후 Arm 기반 CPU를 사용하는 시스템으로 애플리케이션을 이식하는 데 도움이 될 것이죠.
쓰쿠바 대학의 일본 컴퓨테이셔널 과학 센터는 NVIDIA Quantum-2 InfiniBand 플랫폼에서 NVIDIA H100 Tensor Core GPU와 x86 CPU를 페어링하고 있습니다. 이 새로운 슈퍼컴퓨터는 기후학, 천체물리학, 빅데이터, AI 등의 분야를 다룰 것입니다.
이 새로운 시스템은 NVIDIA 기술을 채택한 최신 슈퍼컴퓨터 TOP500 목록에서 71%에 포함될 예정입니다. 또한 목록에 있는 새 시스템의 80%는 NVIDIA GPU, 네트워크 또는 둘 다를 사용하며, NVIDIA의 네트워킹 플랫폼은 TOP500 시스템에서 가장 인기 있는 인터커텍트입니다.
HPC 사용자는 NVIDIA 기술을 채택할 것입니다. 이는 시뮬레이션, 머신 러닝, 실시간 에지 처리와 같은 기존 슈퍼컴퓨팅 워크로드와 양자 시뮬레이션, 디지털 트윈과 같은 새로운 워크로드에도 최고의 애플리케이션 성능을 제공하기 때문이죠.
Omniverse로 강화
이안 벅은 이러한 시스템의 기량을 보여주며, 영국 원자력청(Atomic Energy Authority, UKEA)과 맨체스터대학의 연구원들이 NVIDIA Omniverse에서 구축하고 있는 가상 핵융합 발전소의 데모를 소개했습니다. 디지털 트윈은 전체 발전소, 로봇 구성요소, 핵융합 플라즈마의 동작까지 실시간으로 시뮬레이션하는 것을 목표로 합니다.
3D 디자인 협업 및 세계 시뮬레이션 플랫폼인 NVIDIA Omniverse를 사용하면, 떨어져 있는 연구원들이 서로 다른 3D 애플리케이션을 사용하여 실시간으로 프로젝트를 진행할 수 있습니다. 이는 물리 기반 정보 AI 모델을 만들기 위한 프레임워크인 NVIDIA Modulus로 작업 향상을 목표로 합니다.
이안 벅은 “미래의 청정 재생 에너지원을 위한 길은 굉장히 복잡한 작업”이라고 언급했습니다.
의료 이미징을 위한 AI
이안 벅은 연구원들이 AI와 함께 의료 분야의 발전을 위한 슈퍼컴퓨터인 NVIDIA Cambridge-1에서 인간 두뇌의 10만 개의 합성 이미지 라이브러리를 생성하는 방법도 설명했습니다.
킹스 칼리지 런던(King’s College London)의 한 팀은 의료 이미징을 위한 AI 프레임워크인 MONAI를 사용했는데요. 이는 실제와 같은 이미지를 생성해 연구원들이 파킨슨병과 같은 질병이 어떻게 발전하는지 볼 수 있도록 도웁니다.
이안 벅은 “이것이 HPC+AI의 좋은 예이며, 과학과 연구 커뮤니티에 실질적인 기여를 하고 있습니다”라고 말했습니다.
엣지에서의 HPC
HPC 작업은 점점 슈퍼컴퓨터 센터를 넘어 확장되고 있습니다. 관측소, 인공위성과 새로운 종류의 실험실 기기는 실시간으로 데이터를 스트리밍하고 시각화해야 하죠.
예를 들면 로렌스 버클리 국립 연구소(Lawrence Berkeley National Lab)의 라이트시트(lightsheet) 현미경 작업은 NVIDIA Clara Holoscan을 사용해 CPU에서 며칠이 소요되는 작업을 나노미터 단위로 실시간으로 볼 수 있도록 합니다.
NVIDIA는 슈퍼컴퓨팅을 엣지로 갸져오기 위해 모든 과학적 발견을 가속화하는 확장성이 뛰어난 이미징 소프트웨어 버전 HPC Holoscan을 개발하고 있습니다. 이는 Jetson AGX 모듈과 어플라이언스에서 쿼드 A100 서버까지 가속화된 플랫폼에서 실행될 것입니다.
이안 벅은 “연구원들이 이 소프트웨어로 무엇을 할 수 있을지 기대됩니다”라고 말했습니다.
양자 시뮬레이션 가속화
이안 벅은 빠르게 채택되고 있는 GPU에서 양자 회로 시뮬레이션을 가속화하기 위한 소프트웨어 개발 키트인 NVIDIA cuQuantum에 대해 얘기했습니다.
이미 수십 개의 조직이 여러 분야의 연구에서 cuQuantum을 사용하고 있고, 주요 양자 소프트웨어 프레임워크에 통합되어 사용자가 추가 코딩 없이 GPU 가속에 액세스할 수 있습니다.
최근 AWS가 브라켓(Braket) 서비스에서 cuQuantum을 사용할 수 있다고 발표했습니다. 그리고cuQuantum이 어떻게 양자 머신 러닝 워크로드에서 최대 900배 향상된 속도를 제공하는 동시에 비용을 3.5배 절감할 수 있는지 시연했죠.
이안 벅은 “양자 컴퓨팅은 엄청난 잠재력을 가지고 있으며, 가치 있는 양자 컴퓨팅에 더 가까이 다가가기 위해서 GPU 슈퍼컴퓨터에서 양자 컴퓨터를 시뮬레이션하는 것이 필수적이며, 우리는 이 일의 선두에 서게 되어 정말 기쁩니다”고 말했습니다.