고성능 컴퓨팅(HPC)의 최고 권위인 고든 벨 상(Gordon Bell Prize) 최종 후보 5개 팀이 NVIDIA 기반 슈퍼컴퓨터를 활용해 다양한 분야에서 혁신적인 성과를 달성했습니다. 여기에는 기후 모델링, 재료 과학, 유체 시뮬레이션, 지구물리학, 전자 설계 등이 포함돼 있습니다.
이번 SC25에서 발표된 최종 후보자들의 프로젝트는 물리 시뮬레이션, 고정밀 연산, 기타 첨단 슈퍼컴퓨팅 기술을 활용해 과학 분야의 AI와 HPC 혁신을 이끌고 있습니다. 그리고 기상 예측, 반도체 설계, 우주 탐사 등 다양한 분야의 발전을 가속화하고 있죠. 이들의 연구 결과는 아카이브(ArXiv)를 통해 공개적으로 확인할 수 있습니다.
이들의 연구를 지원하는 슈퍼컴퓨터는 다음과 같습니다.
- 알프스(Alps): 스위스 국립 슈퍼컴퓨팅 센터(Swiss National Supercomputing Centre, CSCS)에 구축됐으며, 1만 개 이상의 NVIDIA GH200 Grace Hopper 슈퍼칩으로 구동됩니다.
- 펄머터(Perlmutter): 국립에너지연구과학컴퓨팅센터(National Energy Research Scientific Computing Center, NERSC)에 구축됐으며, NVIDIA 가속 컴퓨팅으로 구동됩니다.
- 주피터(JUPITER): 유럽 최초의 엑사스케일(exascale) 슈퍼컴퓨터로, 율리히 슈퍼컴퓨팅 센터(Jülich Supercomputing Centre, JSC)에 구축됐으며, NVIDIA Grace Hopper 플랫폼과 Quantum-X800 InfiniBand 네트워킹으로 구동됩니다.
NVIDIA Grace Hopper 플랫폼 기반의 주피터 슈퍼컴퓨터 랙의 랜더링 이미지 (자료제공: 율리히 연구센터)
CSCS 소장 Thomas Schulthess는 “CSCS는 단순히 오픈 사이언스를 지원하는 수준을 넘어, 이를 가속하고 있습니다. 올해 고든 벨 최종 후보 5개 팀이 기후 모델링, 재료 과학, 유체 역학, 디지털 트윈 분야에서 이뤄낸 놀라운 성과는 알프스 슈퍼컴퓨터가 없었다면 불가능했을 과학적 발견입니다. 계산 성능의 한계를 뛰어넘는 것은 대담한 목표를 현실로 만들고, 미래를 새롭게 정의할 과학 혁신으로 이어집니다”고 말했습니다.

아래에서 다섯 최종 후보 팀의 프로젝트를 자세히 확인해 보세요.
ICON: 지구를 킬로미터 단위로 구현하다
막스 플랑크 기상연구소(Max Planck Institute for Meteorology), 독일 기후컴퓨팅센터(DKRZ), CSCS, JSC, 취리히 연방공과대학(ETH Zurich), NVIDIA가 공동 개발한 ICON 지구 시스템 모델의 혁신적인 구성은 기상 예측의 정확도를 높이고, 지구의 작동 원리에 대한 심층적인 이해를 돕습니다.
ICON은 지구 전체 시스템을 킬로미터 단위 해상도로 모델링해 대기, 해양, 육지를 따라 이동하는 에너지, 물, 탄소의 흐름을 매우 세밀하게 포착합니다. 또한 전례 없는 시간 압축 성능을 갖춰 24시간 동안 약 146일 분량의 시뮬레이션을 수행할 수 있어, 수십 년 앞을 예측하는 효율적인 기후 시뮬레이션을 지원합니다.
ICON 모델을 활용한 이산화탄소 플럭스(flux) 시뮬레이션
막스 플랑크 기상학 연구소의 계산 인프라와 모델 개발 그룹 리더인 Daniel Klocke는 “ICON 모델에 지구 시스템의 핵심 요소들을 1킬로미터라는 전례 없는 해상도로 통합함으로써, 연구자들은 지역 규모에서 지구 시스템의 온전한 정보를 관찰하고, 미래 온난화가 인류와 생태계에 미치는 영향을 더욱 깊이 이해할 수 있습니다”고 말했습니다.
ORBIT-2, 기상·기후 모델링을 위한 엑사스케일 비전 파운데이션 모델
NVIDIA, 오크리지 국립연구소(Oak Ridge National Laboratory) 등 다수 기관의 협력으로 개발돼 알프스 슈퍼컴퓨터에서 구동되는 ORBIT-2는 기상, 기후 다운스케일링을 위한 AI 파운데이션 모델로, 뛰어난 확장성과 정밀도를 보여줍니다.
ORBIT-2는 엑사스케일 컴퓨팅과 알고리즘 혁신을 기반으로 공간 초고해상도 다운스케일링 기술을 통해 기존 기후 모델이 직면한 한계를 극복합니다. 이 기술은 저해상도 데이터를 기반으로 고해상도 데이터를 생성하죠. 이를 통해 연구팀은 도시 열섬, 극한 강우, 몬순(monsoon) 패턴의 미세한 변화와 같은 국지적인 현상까지 포착하고 예측할 수 있습니다.
오크리지 국립연구소 AI 프로그램 디렉터 겸 데이터·AI 시스템 부문 책임자인 Prasanna Balaprakash는 “NVIDIA의 첨단 슈퍼컴퓨팅 기술 덕분에 ORBIT-2는 NVIDIA 플랫폼 기반으로 AI와 HPC의 접점에서 탁월한 확장성, 안정성, 영향력을 달성할 수 있었습니다”고 밝혔습니다.
QuaTrEX, 나노스케일 디바이스 모델링 기반 트랜지스터 설계 혁신
취리히 연방공과대학 연구팀은 차세대 트랜지스터 설계를 가속화할 수 있는 QuaTrEx 알고리즘 패키지를 통해 나노스케일 전자 디바이스 모델링을 발전시켰습니다.
NVIDIA GH200 슈퍼칩 기반의 알프스 슈퍼컴퓨터에서 구동되는 QuaTrEx는 FP64 성능과 극한의 병렬 컴퓨팅 효율성으로 4만 5천 개 이상의 원자로 구성된 디바이스를 시뮬레이션할 수 있죠. 이를 통해 반도체 산업의 핵심 역할을 수행하는 NREFT 트랜지스터를 더욱 빠르고 정확하게 설계할 수 있습니다.
나노리본(nanoribbon) 트랜지스터 내 전자 흐름 시뮬레이션 (자료제공: 취리히 연방공과대학)
취리히 연방공과대학 연산 나노전자공학 교수인 Mathieu Luisier는 “QuaTrEx 개발 과정에서 알프스 슈퍼컴퓨터에 대한 접근은 결정적인 역할을 했으며, 불과 몇 달 전만 해도 상상할 수 없던 규모의 디바이스를 시뮬레이션할 수 있게 됐습니다”고 설명했습니다.
MFC 플로우 솔버, 우주선 시뮬레이션 규모 신기록 달성
다수의 소형 엔진을 탑재한 우주선 설계에는 정교한 시뮬레이션이 필수입니다. 이는 엔진 배치가 밀집되면 배기가 로켓 기체를 가열할 수 있기 때문이죠.
조지아 공과대학교(Georgia Institute of Technology)가 NVIDIA 등과 협력해 개발한 오픈소스 솔버 MFC는 알프스 슈퍼컴퓨터에서 실행됩니다. 이전 세계 기록과 동일한 정확도를 유지하면서도 4배 빠른 유동 시뮬레이션 속도와 5배 이상의 에너지 효율성 향상을 달성했죠.
알프스에서 풀스케일 실행을 기준으로, MFC는 주피터에서 이전 세계 기록 대비 10배 더 큰 규모로 구동될 것으로 예상됩니다. 이는 우주 탐사를 위한 핵심 부품을 더 빠르고 정확하게 설계할 수 있는 기반을 마련랍니다.
전산 유체역학을 활용한 로켓 엔진 시뮬레이션 (자료제공: 조지아 공과대학교)
조지아 공과대학교 전산과학공학과 조교수 Spencer Bryngelson은 “새로운 정보 기하학적 정규화 기법이 NVIDIA GH200 슈퍼칩의 통합 가상 메모리와 혼합 정밀도 기능과 결합되면서, 복잡한 전산 유체 흐름 시뮬레이션의 효율이 획기적으로 향상됐습니다. 이를 통해 전례 없는 규모의 로켓 엔진 플룸(plume) 시뮬레이션이 가능해졌죠”라고 말했습니다.
쓰나미 조기 경보를 위한 디지털 트윈
텍사스대학교 오스틴(University of Texas at Austin), 로렌스 리버모어 국립연구소(Lawrence Livermore National Laboratory), 캘리포니아대학교 샌디에이고(UC San Diego)는 완전한 물리 모델을 기반으로 실시간 확률적 쓰나미 예측을 제공하는 세계 최초의 디지털 트윈을 개발했습니다.
태평양 북서부 캐스케이디아(Cascadia) 섭입대에 적용된 이 디지털 트윈은 기존에 512개의 GPU로 50년이 걸리는 복잡한 계산을 알프스와 펄머터 슈퍼컴퓨터에서 단 0.2초만에 수행하며, 100억 배의 속도 향상을 달성했습니다.
텍사스대학교 오스틴 기계공학 교수 Omar Ghattas는 “실시간 센서 데이터를 정밀 물리 기반 모델링과 불확실성 정량화와 함께 즉각적으로 결합해, 재난이 닥치기 전에 사람들이 행동할 수 있도록 한 것은 이번이 처음입니다. 이 프레임워크는 다양한 재난 상황에서 예측 기반, 물리 기반의 비상 대응 시스템을 구축하는 토대를 제공합니다”고 설명했습니다.
NVIDIA CUDA-X 라이브러리는 쓰나미 디지털 트윈, ICON, MFC 프로젝트에서 복잡한 시뮬레이션의 성능과 효율을 극대화하는 데 핵심적인 역할을 수행했습니다. 또한 ICON은 작업을 단일 연산이 아닌 그래프로 정의할 수 있게 해주는 NVIDIA CUDA 그래프를 활용했습니다.
최신 슈퍼컴퓨팅 혁신에 대한 더 자세한 내용은 11월 20일(현지시간)까지 진행되는 SC25 현장에서 NVIDIA와 함께 확인할 수 있습니다.
