오늘날 연구에 요구되는 백만 배 수준의 발전을 위해서는 제트 연료가 필요합니다.
과거 시스템의 내연 기관에 해당하는 무어의 법칙에만 의존해서는 극복할 수 없는 급증하는 연산 요구사항과 함께 데이터도 계속 증가하고 있기 때문인데요.
그래서 연구원들이 필요로 하는 기하급수적 가속을 위해 3개의 추진기를 함께 묶었습니다.
속도 향상과 스케일 아웃
가속 컴퓨팅은 첨단 기술의 세 가지 모터 중 하나입니다. 지난 10년 동안 발전한 5세대 GPU와 그 위에 구축한 전체 소프트웨어 스택 덕분에 성능이 1,000배 향상됐죠.
두 번째 엔진은 스케일링으로 거의 100,000배의 발전을 이뤘습니다. 데이터센터가 컴퓨팅의 새로운 단위가 됐기 때문입니다.
예를 들어, 2015년에는 한 개의 케플러(Kepler) GPU로 널리 쓰이는 컴퓨터 비전 모델인 ResNet-50을 훈련시키는 데 거의 한 달이 걸렸는데요. 이제는 수천 개의 NVIDIA Ampere 아키텍처GPU를 탑재한 세계에서 가장 강력한 산업용 슈퍼컴퓨터인 Selene으로 동일한 모델을 30분 이내에 훈련시킬 수 있습니다.
NVIDIA는 Megatron 소프트웨어, 멀티 GPU와 멀티 노드 처리를 위한 Magnum IO , 네트워크 내 컴퓨팅을 위한 SHARP와 같이 스케일링을 지원하는 많은 핵심 기술을 개발했습니다.
딥 러닝의 시작
현 시대에 세 번째이자 가장 변혁적인 힘은 AI입니다.
작년에 딥 러닝은 1밀리초 동안 3억 5백만 개의 원자 시뮬레이션을 가능하게 해 SARS-CoV-2 바이러스의 내부 작동 방식을 확인할 수 있었는데요. 이는 15년 전 20나노초 동안 100만 개 원자를 대상으로 한 당시의 최첨단 시뮬레이션에서 1000만 배 이상 증가한 수치입니다.
AI와 고성능 컴퓨팅의 결합이 과학계를 휩쓸고 있는 이유가 여기에 있습니다. 연구원들은 작년에 AI+HPC 작업에 관해 거의 5,000개의 논문을 아카이브(arXiv)에 발표했는데, 이는 5년 전의 100개 미만에서 급등한 수치입니다.
가장 최근 발표된 논문 중에는 NVIDIA 연구원이 작성한 논문도 있는데요. 이 논문은 신경망을 고전 물리학 방정식과 결합해 기존 시뮬레이션 대비 1,000배의 속도 향상을 제공하는 방법을 제시했습니다.
약물 발견 가속화
오늘날 가속 컴퓨팅, 대규모 스케일과 AI의 결합은 과학과 산업의 컴퓨팅을 발전시키고 있습니다.
질병 치료를 위한 약물 발견을 가속화하는 것보다 더 중요한 노력은 없을 것입니다. 단백질 구조의 작동 방법 확인은 먼저 3D로 해독한 다음 건강한 세포의 감염을 막는 화합물을 식별해야 하는 어려운 작업입니다.
X선과 전자 현미경을 사용하는 전통적인 방법으로는 약 25,000개의 인간 단백질 중 17%만을 해독했는데요. 작년에 딥마인드(DeepMind)는 알파폴드(AlphaFold) 시스템에서 AI 모델의 앙상블을 활용해 20,000개 이상의 인간 단백질의 3D 구조를 예측하는 큰 도약을 이뤄냈습니다.
마찬가지로 NVIDIA, 칼텍(Caltech), 스타트업 엔토스(Entos)의 연구원들도 머신 러닝과 물리학을 결합한 OrbNet을 통해 분자 시뮬레이션 속도를 수십 배나 높였습니다. 이러한 노력을 통해 엔토스는 단백질과 약물 후보 간의 화학 반응 시뮬레이션을 1,000배 가속화하여, 기존에 3개월 이상 걸렸을 작업을 3시간 만에 완료할 수 있었죠.
기후 변화 이해
다른 분야도 비슷한 상황입니다. 과학자들은 우리가 변화하는 날씨 패턴에 적응하고 재난에 더 잘 대비할 수 있도록 지구 기후 시뮬레이션을 킬로미터 단위 해상도로 곧 실행할 수 있기를 희망하고 있는데요.
그러나 구름과 폭풍 패턴을 정확하게 추적하려면 1미터 해상도로 작업해야 하고, 이를 위해서는 무려 1000억 배 이상의 컴퓨팅 성능이 필요하죠.
무어의 법칙대로라면 2060년 전에는 불가능할 것입니다. 따라서 수백만 배의 도약을 추구하는 과학자들은 가속화된 컴퓨팅과 대규모 AI로 지구의 디지털 트윈을 구축하고 있습니다.
이 작업을 가속화하기 위해 NVIDIA는 기후 변화 예측, 완화, 적응을 위한 세계에서 가장 강력한 AI 슈퍼컴퓨터인 Earth-2 구축 계획을 발표했습니다. Earth-2는 Omniverse에서 지구의 디지털 트윈을 만들 것입니다.
산업의 디지털 트윈 활용
연구원들은 이미 이러한 기술을 활용해 공장과 도시의 디지털 트윈을 구축하고 있습니다.
예를 들어, 지멘스 에너지(Siemens Energy)는 클라우드의 수십 개의 GPU에서 실행되는 NVIDIA Modulus AI 프레임워크를 사용해 전체 발전소를 시뮬레이션했는데요. 증기의 부식 효과로 인한 기계적 고장을 예측하여 다운타임을 줄이고 비용을 절약하며 조명을 계속 켜둘 수 있습니다.
디지털 트윈은 농장이나 병원의 효율성을 높이고 모든 산업에 혁신을 가능하게 하는 일종의 시뮬레이션 기술입니다. 이것이 바로 NVIDIA가 Modulus를 개발한 이유입니다. Modulus는 AI 기반의 물리적으로 정확한 시뮬레이션을 쉽게 생성할 수 있도록 해줍니다.
이는 최첨단 컴퓨팅 엔진을 통해 다음 백만 배 이상의 도약을 가능하게 하는 또 하나의 도구입니다.
데이터센터 규모에서 AI로 가속화된 컴퓨팅은 기후 변화 이해, 약물 발견, 산업 혁신 촉진 등과 같은 문제를 해결하기 위해 성능을 백만 배 향상시킬 것입니다.
더 자세한 내용은 아래 NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)의 키노트에서 확인하세요.