얼마 전 함부르크에서 진행되었던 ISC 컨퍼런스에서 NVIDIA는 화학·소재 발견부터 암흑 물질 탐색에 이르기까지 과학 분야의 AI를 가속화하는 새로운 소프트웨어를 공개했습니다.
NVIDIA DAQIRI 라이브러리와 새로운 NVIDIA ALCHEMI NIM 마이크로서비스 — 그리고 곧 출시될 NVIDIA cuPhoton 참조 코드 — 는 CPU에서 수 시간 또는 수 일이 걸리던 작업을 실시간 GPU 가속 파이프라인으로 전환합니다.
이 소프트웨어들은 AI와 고성능 컴퓨팅을 포함한 다양한 애플리케이션 분야에서 획기적으로 높은 성능을 제공하는 도구와 라이브러리 모음인 NVIDIA CUDA-X의 일부이기도 한데요.
이러한 성능 향상은 크고 실질적인 영향을 미칩니다. 다양한 학문 분야에서 과학자들은 AI와 가속 컴퓨팅을 활용해 계측기와 관측 조사를 통해 어느 때보다 빠르게 데이터와 인사이트를 생성하고 있습니다.
예를 들어, NVIDIA GB200 NVL72 시스템에서 실행되는 cuPhoton은 관측소와 망원경에서 수집한 천문학 표준 파일 형식인 FITS 데이터의 로딩, 읽기, 처리, 분석을 가속화합니다. 얼리 액세스 단계에서 cuPhoton은 Rubin 관측소의 시공간 레거시 조사(LSST)로 수집된 FITS 이미지의 로딩 및 읽기를 14,900배 가속화했죠. 또한 32개의 NVIDIA Grace Blackwell 슈퍼칩을 사용해 신호 처리 및 분석을 최대 8,400배 빠르게 수행했습니다.
이는 역대 최대 규모의 디지털 카메라인 LSST 카메라에서 더 빠른 인사이트를 도출할 수 있음을 의미합니다. LSST 카메라는 수십억 개의 먼 은하 이미지와 빛을 거의 반사하지 않는 희미한 근거리 천체를 포착합니다.
실험실 벤치부터 망원경까지, 새로운 소프트웨어
새로운 소프트웨어는 암흑 물질, 소재 시뮬레이션 등의 연구를 가속화합니다.
NVIDIA cuPhoton은 망원경, X선, 레이저 실험에서 수집된 다차원 데이터에서 인사이트를 추출하려는 과학자를 위한 레퍼런스 코드입니다. 페타바이트 규모의 데이터를 로드·처리·분석·시각화하도록 설계되었으며, 다른 NVIDIA CUDA-X 기술과 함께 사용해 천체물리학·천문학 분야의 종단 간 가속 파이프라인을 구축할 수 있습니다.
Princeton 대학교 연구자들은 NVIDIA와 협력해 cuPhoton을 개발했으며, Harvard 대학교와 함께 관측소 및 암흑 에너지 조사에서 수집된 대규모 데이터의 처리·분석에 활용할 예정입니다.
NVIDIA DAQIRI(Data Acquisition for Integrated Real-time Instruments의 약자)는 고속 검출기와 센서에서 데이터를 실시간으로 NVIDIA 소프트웨어로 스트리밍하는 고성능 네트워킹 라이브러리입니다. 기존 시스템은 고정된 하드웨어에 종속되어 계측기가 저장 속도보다 빠르게 데이터를 생성할 경우 데이터가 유실될 수 있습니다. DAQIRI는 스트림이 도착하는 즉시 처리해 이를 방지합니다.
CERN openlab 프레임워크 내에서 CERN·시카고 대학교·런던 대학교 유니버시티 칼리지 과학자들이 개발한 A-GHOST 연구 프로젝트는 DAQIRI를 사용해 CERN ATLAS 실험에서 기록된 충돌 데이터에 실시간으로 AI를 적용합니다. A-GHOST는 저장 용량 제한으로 ATLAS가 일반적으로 폐기하는 데이터 — 전체의 99% 이상 — 를 분석하여 그렇지 않으면 놓칠 수 있는 잠재적으로 흥미로운 신호를 포착합니다.
NVIDIA ALCHEMI는 배터리 소재, 촉매, OLED 디스플레이, 뷰티 제품 등 다양한 분야에 걸쳐 화학·소재 발견을 가속화하는 도메인별 마이크로서비스와 툴킷의 모음입니다.
NVIDIA는 지난 3월 배치 형상 이완(BGR)과 배치 분자 동역학(BMD)을 위한 두 가지 ALCHEMI NIM 마이크로서비스를 출시했습니다. AI 가속 도구인 BGR은 분자와 소재의 가장 안정된 구조를 탐색하고, BMD는 시간 경과에 따른 움직임을 시뮬레이션하여 연구자들이 수백만 개의 분자와 소재를 동시에 시뮬레이션할 수 있게 합니다.
또한 ALCHEMI는 곧 광범위하게 사용되는 Vienna Ab initio Simulation Package(VASP)를 위한 마이크로서비스를 포함할 예정입니다. 연구자들이 더 높은 GPU 처리량으로 소재 시뮬레이션을 실행할 수 있도록, 단일 GPU에서 NVIDIA Multi-Process Service를 통해 여러 VASP 계산을 동시 실행하며 형상 최적화 — 소재 내 원자의 가장 안정된 배열을 찾는 과정 — 에서 3배의 속도 향상을 달성합니다.
아울러 개발자와 연구자들은 ALCHEMI Toolkit을 사용해 머신 러닝 원자 간 퍼텐셜이라 불리는 AI 서로게이트 모델의 학습을 가속화하고, 맞춤형 고성능 원자 시뮬레이션 워크플로우를 손쉽게 구축할 수 있습니다.
NVIDIA ALCHEMI로 과학적 방법을 쉬지 않고 실행하는 Lila Sciences
생명 과학, 화학, 소재 과학을 위한 과학적 초지능 플랫폼과 자율 실험실을 구축 중인 Lila Sciences는 NVIDIA와 함께 지난 3월 새너제이 NVIDIA GTC에서 ALCHEMI 기반 고정밀 자석 시뮬레이션을 선보였습니다.
Lila Sciences는 BGR용 ALCHEMI NIM 마이크로서비스를 활용해 고처리량 소재 스크리닝을 50배 가속화하여 합성 가능성이 높은 안정적인 후보를 식별했습니다. 이어 얼리 액세스 단계의 ALCHEMI VASP 마이크로서비스를 사용해 최종 후보의 자기 특성 계산을 30% 향상시켰습니다.
속도 향상 효과는 복합적으로 나타납니다. TensorNet을 위한 ALCHEMI의 특화 커널은 학습·추론에서 6배의 속도 향상과 3배의 메모리 절감을 제공해, 기존에 몇 주가 걸리던 시뮬레이션을 며칠 만에 완료할 수 있게 했습니다.
한 번에 하나의 실험을 실행하는 대신, 이 접근법은 GPU 메모리에서 여러 소재를 동시에 평가하며 다음 분야에 적용할 수 있습니다:
- 소재 발견 — 규모에 맞게 새롭고 안정적인 조성물을 스크리닝
- 에너지 — 화학물질과 연료 생산을 위한 활성·지구 풍부 촉매 발굴
- 전자기학 — 복잡한 자기 거동의 이해 및 예측
ALCHEMI는 시뮬레이션 레이어에 위치하여 나머지 루프를 구동하는 물리 과학 데이터를 생성합니다.
또한 Lila Sciences는 NVIDIA Megatron-LM과 NVIDIA Nemotron을 학습에 활용하고 — Nemotron 3 Nano·Nemotron 3 Super 오픈 모델, NeMo RL·NeMo Gym 라이브러리 포함 — , 분자 생성에는 NVIDIA BioNeMo를, 추론 서빙에는 NVIDIA Triton과 NIM 마이크로서비스를, 디지털 트윈에는 NVIDIA Omniverse 라이브러리를 활용하는 등 NVIDIA의 전체 스택으로 과학적 발견을 가속화하고 있습니다.
Lila Sciences 공동 창업자 겸 CTO Andy Beam은 이렇게 말했습니다. “이 작업은 어떤 개인 과학자도 혼자서는 달성할 수 없는 규모로 발견을 가속화하기 위해 조립된 강력한 컴퓨팅 스택의 활용을 잘 보여줍니다.”
출시 정보
NVIDIA ALCHEMI Toolkit과 Toolkit-Ops는 GitHub와 PyPI에서 다운로드할 수 있습니다. ALCHEMI NIM 마이크로서비스는 NVIDIA NGC 카탈로그에서 다운로드할 수 있습니다. VASP용 ALCHEMI NIM 마이크로서비스는 올여름 중 출시될 예정입니다.
DAQIRI는 현재 GitHub에서 바로 이용할 수 있으며, cuPhoton은 올여름 출시될 예정입니다.
NVIDIA AI for science에 대해 더 알아보세요.
