가속 컴퓨팅은 에너지 효율적인 컴퓨팅이라는 것은 누구나 인정하는 사실입니다.
미국 에너지부의 개방형 과학을 위한 선도적인 시설인 국립 에너지 연구 과학 컴퓨팅 센터(NERSC)는 주요 고성능 컴퓨팅 및 AI 애플리케이션 4가지에 대한 결과를 측정했습니다.
NVIDIA GPU를 사용하는 세계 최대 규모의 슈퍼컴퓨터 중 하나인 Perlmutter의 CPU 전용 노드와 GPU 가속 노드에서 애플리케이션이 얼마나 빠르게 실행되고 얼마나 많은 에너지를 소비하는지 기록했습니다.
결과는 명확했습니다. NVIDIA A100 Tensor 코어 GPU로 가속화된 에너지 효율은 평균 5배 증가했습니다. 일기 예보 애플리케이션은 9.8배의 이득을 기록했습니다.
메가와트 절약하는 GPU
4개의 A100 GPU가 탑재된 서버에서 NERSC는 듀얼 소켓 x86 서버에 비해 최대 12배의 속도 향상을 달성했습니다.
즉, 동일한 성능 수준에서 GPU 가속 시스템은 CPU 전용 시스템보다 한 달에 588메가와트시의 에너지를 덜 소비합니다. 연구원들은 한 달 동안 4방향 NVIDIA A100 클라우드 인스턴스에서 동일한 워크로드를 실행하면 CPU 전용 인스턴스에 비해 4백만 달러 이상을 절약할 수 있습니다.
실제 애플리케이션 측정
이 결과는 합성 벤치마크가 아닌 실제 애플리케이션의 측정을 기반으로 한 것이기 때문에 의미가 있습니다.
이러한 성능 향상은 펄뮤터를 사용하는 8,000명 이상의 과학자들이 더 큰 과제를 해결할 수 있다는 것을 의미하며, 더 많은 혁신의 문을 열어줄 것입니다.
과학자들은 새로운 친환경 에너지원을 찾기 위해 아원자 상호작용을 조사하는 등 Perlmutter의 7,100개 이상의 A100 GPU를 활용한 다양한 활용 사례 중 하나를 살펴보고 있습니다.
모든 규모의 과학 발전
NERSC가 테스트한 애플리케이션은 분자 역학, 재료 과학 및 일기 예보에 걸쳐 있습니다.
예를 들어, MILC는 원자의 입자를 하나로 묶는 기본 힘을 시뮬레이션합니다. 이는 양자 컴퓨팅을 발전시키고 암흑 물질을 연구하며 우주의 기원을 찾는 데 사용됩니다.
버클리GW는 더 효율적인 배터리와 전자 장치를 개발하기 위한 핵심 단계인 재료와 나노 구조의 광학적 특성을 시뮬레이션하고 예측하는 데 도움이 됩니다.
가속 컴퓨팅으로 효율성을 높인 NERSC 앱.
A100 GPU에서 8.5배의 효율성 향상을 달성한 EXAALT는 분자 역학의 근본적인 문제를 해결합니다. 이를 통해 연구자들은 다른 툴이 제공하는 일련의 스냅샷이 아닌 원자 움직임에 대한 짧은 비디오에 해당하는 시뮬레이션을 할 수 있습니다.
테스트의 네 번째 애플리케이션인 DeepCAM은 기후 데이터에서 허리케인과 대기의 강을 감지하는 데 사용됩니다. 이 애플리케이션은 A100 GPU로 가속화했을 때 에너지 효율성이 9.8배 향상되었습니다.
가속화된 컴퓨팅을 통한 비용 절감
NERSC의 결과는 가속 컴퓨팅을 통한 잠재적 절감 효과에 대한 이전의 계산을 반영합니다. 예를 들어, NVIDIA가 수행한 별도의 분석에서 GPU는 CPU보다 AI 추론에서 42배 더 나은 에너지 효율성을 제공했습니다.
즉, 전 세계에서 AI를 실행하는 모든 CPU 전용 서버를 GPU 가속 시스템으로 전환하면 연간 10조 와트시의 에너지를 절약할 수 있습니다. 이는 140만 가구가 1년에 소비하는 에너지를 절약할 수 있는 양입니다.
엔터프라이즈 가속화
가속 컴퓨팅을 통해 에너지 효율을 개선하기 위해 과학자가 될 필요는 없습니다.
제약 회사들은 GPU 가속 시뮬레이션과 AI를 사용하여 신약 개발 프로세스를 가속화하고 있습니다. BMW 그룹과 같은 자동차 제조업체는 전체 공장을 모델링하는 데 이를 사용하고 있습니다.
이러한 기업들은 가속 컴퓨팅과 AI를 기반으로 한 산업용 HPC 혁명의 선두에 서 있는 기업들 중 하나로, 엔비디아의 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 이러한 기업들을 가속 컴퓨팅의 선두주자로 꼽았습니다.