NVIDIA AI가 HPC 연구를 가속화하는 방법

과학자와 연구자들은 NVIDIA 기술을 활용해 코드 생성, 기상, 유전학, 재료 과학 등 다양한 분야에서 HPC 작업에 생성형 AI를 적용하고 있습니다
by NVIDIA Korea

생성형 AI는 국가와 기업 연구소에서 비즈니스, 과학을 위한 고성능 컴퓨팅(HPC)을 가속화하며 기반을 다지고 있습니다.

샌디아 국립 연구소(Sandia National Laboratories)는 세계 최대 규모의 슈퍼컴퓨터에서 사용하도록 설계된 병렬 프로그래밍 언어인 코코스(Kokkos)로 코드를 자동으로 생성하는 것을 목표로 하고 있는데요.

이는 야심찬 시도라고 할 수 있습니다. 여러 국립 연구소의 연구진들이 개발한 이 특수 언어는 수만 대의 프로세서에서 작업을 수행하는 데 필요한 미묘한 부분까지도 처리할 수 있습니다.

샌디아 국립 연구소의 연구진들은 검색 증강 생성(retrieval-augmented generation, RAG)을 사용해 코코스 데이터베이스를 생성하고 AI 모델과 연결하고 있습니다. 이들은 다양한 RAG 접근 방식을 실험하면서 초기 테스트에서 긍정적인 결과를 보여주고 있는데요.

과학자들이 평가하게 될 RAG 옵션 중에는 NeMo Retriever와 같은 클라우드 기반 서비스도 있습니다.

샌디아 국립 연구소의 익스트림 스케일 컴퓨팅(extreme scale computing) 수석 매니저인 로버트 훅스트라(Robert Hoekstra)는 “NVIDIA는 HPC 소프트웨어 개발자의 작업을 획기적으로 가속화하는 데 필요한 다양한 툴 세트를 제공합니다”고 말했습니다.

이러한 모델 조정과 RAG를 통한 코파일럿 구축은 시작에 불과합니다. 연구진들은 궁극적으로 기후, 생물학, 재료 과학과 같은 분야의 과학 데이터로 훈련된 파운데이션 모델의 활용을 목표로 하고 있습니다.

기후 변화에 대한 선제적 대응

일기 예보 분야의 연구원과 기업들은 기상, 기후 연구를 위한 서비스와 소프트웨어 세트인 NVIDIA Earth-2의 생성형 AI 모델인 코디프(CorrDiff)를 채택하고 있습니다.

코디프는 기존 대기 모델의 25km 해상도를 2km까지 조정할 수 있죠. 또한, 결합할 수 있는 예측 수를 100배 이상 확장해 예측 신뢰도를 향상시킬 수 있습니다.

미국 버지니아주 비엔나에 위치한 스파이어(Spire)는 자체 소형 위성 네트워크에서 데이터를 수집하는 기업입니다. 스파이어의 머신 러닝과 모델링 책임자인 톰 고완(Tom Gowan)은 “이는 유망한 혁신입니다. 우리는 이러한 모델을 글로벌과 지역 AI 예보에 활용해 더욱 풍부한 인사이트를 제공할 계획입니다”고 말했는데요.

톰 고완은 최근 인터뷰에서 생성형 AI를 통해 더 빠르고 정확한 예보가 가능해지고 있다고 말했습니다. “기상학 분야가 정말 큰 도약을 이룬 것처럼 느껴집니다. 이제 NVIDIA와의 파트너십을 통해 우리는 훈련과 추론 모두에서 가장 안정적이고 빠르며 효율적인 세계 최고의 GPU를 이용할 수 있습니다.”

스파이어 AI 기상 예측

 

스위스에 본사를 둔 메테오매틱스(Meteomatics)는 최근 자사의 일기 예보 사업에도 NVIDIA의 생성형 AI 플랫폼을 사용할 계획이라고 발표했습니다.

메테오매틱스의 창립자 겸 CEO인 마틴 펜글러(Martin Fengler)는 “NVIDIA와의 협력은 에너지 기업들이 날씨 변동에 대한 빠르고 정확한 인사이트를 통해 재생 에너지 운영을 극대화하고 수익성을 높이는 데 도움이 될 것”이라고 말했죠.

의료 서비스 개선을 위한 유전자 생성

아르곤 국립 연구소(Argonne National Laboratory)의 과학자들은 이 기술을 사용해 코로나19의 원인이 되는 바이러스를 더 잘 이해하도록 돕는 유전자 염기서열을 생성하고 있습니다. 수상 이력까지 있는 GenSLM 모델은 실제 SARS-CoV-2 변종과 매우 유사한 시뮬레이션을 생성했죠.

아르곤 국립 연구소의 수석 연구원인 아르빈드 라마나단(Arvind Ramanathan)은 블로그에서 “게놈의 여러 부분이 어떻게 공진화하는지 이해하면, 바이러스가 새로운 취약성이나 새로운 형태의 저항성을 개발할 수 있는 단서를 얻을 수 있습니다”고 전했다.

GenSLM은 NVIDIA A100 Tensor 코어 GPU 기반 슈퍼컴퓨터를 통해 1억 1천만 개 이상의 게놈 서열을 훈련했습니다. 이러한 슈퍼컴퓨터에는 아르곤 국립 연구소의 폴라리스 시스템(Polaris system), 미국 에너지부(U.S. Department of Energy)의 펄머터(Perlmutter), NVIDIA의 Selene 등이 있습니다.

신소재를 제안하는 마이크로소프트(Microsoft)

마이크로소프트 연구는 생성형 AI가 재료 과학 분야의 작업을 가속화하는 방법을 보여줍니다.

마이크로소프트의 매터젠(MatterGen) 모델은 원하는 특성을 나타내는 새롭고 안정적인 물질을 생성하는데요. 이 접근 방식을 통해 화학, 자기, 전자, 기계 등의 기타 원하는 특성을 지정할 수 있습니다.

마이크로소프트 연구팀은 NVIDIA A100 GPU를 사용해 애저(Azure) AI 인프라에서 매터젠을 훈련했습니다. 그들은 “우리는 매터젠이 재료 설계를 위한 AI의 중요한 진전이라고 생각합니다”고 말했죠.

카본3D(Carbon3D)와 같은 기업들은 이미 상업용 3D 프린팅 작업에서 재료 과학에 생성형 AI를 적용하며 기회를 찾고 있습니다.

이는 연구자들이 생성형 AI를 통해 HPC와 과학 분야에서 할 수 있는 일의 시작에 불과합니다. 현재 사용 가능한 NVIDIA H200 Tensor 코어 GPU와 곧 출시될 NVIDIA Blackwell 아키텍처 GPU는 새로운 차원의 작업을 실현시킬 것으로 기대됩니다.

물리 법칙을 따르는 AI 모델 구축을 위한 Earth-2 플랫폼의 핵심 구성 요소인 NVIDIA Modulus에 대해 알아보세요. 그리고 거대 언어 모델(LLM)을 조정하고 훈련하는 NeMo 라이브러리인 NVIDIA Megatron-Core와 같은 도구에 대해서도 자세히 알아보세요.