세계에서 가장 빠른 슈퍼컴퓨터로 가속화되는 컴퓨팅 – 서밋

by NVIDIA Korea

세계에서 가장 빠른 슈퍼컴퓨터로 가속화되는 컴퓨팅 – 서밋

 

이 시스템은 지금까지 만들어진 것중에서 가장 강력한 과학 도구라 말할 수 있습니다. 또한 컴퓨팅의 새로운 패러다임이라 부를 수 있겠죠. 바로 지난 주 금요일에 발표된 오크리지 국립 연구소(Oak Ridge National Laboratory)의 서밋(SUMMIT)이 바로 그 주인공입니다.

 

총 27,648개의 볼타 텐서 코어(Volta Tensor Core) GPU를 탑재한 이 거대한 머신은 초당 3 exaops, 혹은 30억 회의 계산을 처리할 수 있습니다.  이는 불과 5년 전에 나온 미국 최초의 슈퍼컴퓨터였던 타이탄(Titan)보다 무려 100배 이상 빠른 속도입니다. 그리고 그 컴퓨팅 파워의 95%는 엔비디아의 GPU로부터 비롯됩니다.

 

미국방부를 위해 제작된 이 시스템은 현대에서 가장 큰 과학적 도전 과제들을 해결할 수 있도록 설계된 슈퍼컴퓨터입니다. 고정밀 과학 시뮬레이션에 200페타플롭의 컴퓨팅 파워를 제공할 수 있는 고에너지 물리학, 재료 발견, 건강 관리 및 기타 분야에서 세계 최고 수준의 과학자들의 작업을 가속화할 것입니다.

 

오크리지 국립 연구소(Oak Ridge National Lab)의 엔비디아 젠슨 황 CEO는 서밋을 공개하는 자리에서 “이 놀라운 슈퍼컴퓨터가 의미하는 것은  비단 빠른 성능을 넘어서는 매우 놀라운 것입니다. 서밋은 전 세계의 위대한 과학자들을 끌어들이는 웅장한 과학 도구가 될 것입니다”라고 소감을 밝혔습니다.

 

이것은 말 그대로 과학적 시간 머신입니다.

 

오크리지 연구소 팀은 거의 10년 전에 새로운 종류의 컴퓨팅이 필요하다는 것을 미국에서 처음으로 깨달았습니다. 하나의 트랜지스터를 다른 트랜지스터 위에 겹쳐 놓는 오래된 패러다임은 필요한 효율을 제공하지 못했지요.

 

연구팀은 위험을 감수하고 모든 노드에 하나의 GPU가 있는 세계에서 가장 빠른 슈퍼컴퓨터인 타이탄을 개발하였고 그 결과는 매우 놀라웠습니다. 현재 GPU 기반으로 550개 이상의 HPC 애플리케이션과, 그리고 가장 널리 사용되는 15개의 애플리케이션이 가속화되고 있습니다. 그들의 연구는 슈퍼컴퓨팅의 영역을 재정의하였습니다.

 

 

컴퓨팅 역사의 다음 챕터를 쓰다

 

서밋은 이러한 컴퓨팅 역사의 다음 챕터입니다. ORNL 뿐만 아니라 모든 컴퓨팅에 적합합니다. 엔비디아의 연구팀은 DOE와 11년 넘게 함께 협력하면서 Volta GPU 및 NVLink 고속 상호 연결 기술을 포함한 첨단 기술에 대해 연구해 왔습니다. 노드 당 하나의 GPU 대신 서밋에서는 6개의 텐서 코어 GPU가 있으며 타이탄보다 10배에 이르는 시뮬레이션 성능을 제공합니다.

 

타이탄이 세상에 시뮬레이션 가속화에 영감을 불어넣은 것처럼 서밋은 인공지능을 활용하여 시뮬레이션과 함께 손을 잡도록 세계 과학자들에게 영감을 불어 넣을 것입니다. 서밋에 힘을 실어주는 기술은 이미 PC에서 서버, 워크스테이션, 거대한 클라우드 컴퓨팅 시스템에 이르기까지 모든 분야에서 과학자들의 작업 속도를 높이고 있습니다.

 

젠슨 황 CEO는 “서밋은 새로운 종류의 컴퓨터입니다. 세계에서 가장 큰 인공지능 슈퍼컴퓨터, 즉 배우고 있는 머신이라 할 수 있습니다. 이 소프트웨어는 사람이 쓸 수 없는 놀라운 소프트웨어를 작성할 수 있습니다”

 

새로운 서밋을 소개하는 엔비디아 젠슨 황 CEO
새로운 서밋을 소개하는 엔비디아 젠슨 황 CEO

 

AI 및 고성능 컴퓨팅의 융합

 

서밋은 인공지능을 위해 만들어진 새로운 세대의 기계와 DNA를 공유할 것이지만, 다른 어떤 것과도 같은 속도로 작동할 것입니다. 연구원은 서밋의 성능을 초당 15배, 즉 초당 10억 건 이상으로 끌어 올리기 위해 반 정밀도(FP16)로 알려진 간단한 계산을 사용할 수 있습니다.

 

그것은 엄청난 것입니다. 모든 계산이 단일 입자의 모래로 표현된다면 휴스턴 아스트로돔을 모래로 350초 만에 채울 수 있습니다.

 

엔비디아 V100 GPU
엔비디아 V100 GPU

 

서밋은 과연 과학을 위해 무엇을 할 수 있을까?

 

서밋의 이러한 성능은 오늘날 과학자들이 경이로운 결과를 성취하게끔 합니다. 오크리지 국립 연구소는 이미 최첨단의 과학 놀이터이자 그 캠퍼스는 기계를 최고의 작업을 위해 열심히 노력하는 과학자들의 허브입니다.

 

그렇기 때문에 서밋은 이미 다음과 프로젝트를 가속화하는 일정을 가지고 있습니다:

 

암 연구: DOE와 국립 암 연구소는 암 분산 학습 환경(CANcer Distributed Learning Environment)이라 불리우는 프로그램을 개발하고 있습니다.  이들의 목표는 건강 데이터를 자동으로 추출, 분석 및 분류하여 유전자, 생물학적 마커 및 환경과 같은 질병 요인 사이에 이전에 숨겨진 관계를 밝힐 수 있는 도구를 개발하는 것입니다.

융합 에너지: 태양 에너지를 공급하는 에너지 원 퓨전(Fusion)은 오랫동안 깨끗하고 풍부한 에너지를 약속 받았습니다. 서밋은 핵융합로와 그 자기적으로 제한된 플라즈마를 모델링할 수 있게 될 것이며, 상업적 개발을 촉진할 것입니다.

질병과 중독: 연구원은 AI를 사용하여 인간 단백질과 세포 시스템의 기능과 진화 과정의 패턴을 확인합니다. 이러한 패턴은 우리가 알츠하이머 병, 심장 질환 또는 중독을 더 잘 이해하고 약물 발견 과정을 알리는 데 도움이 될 수 있습니다.

 

인류를 위한 다음 큰 도약

 

거대한 규모에서 머신러닝과 딥러닝 같은 기술들을 사용하면서 과학자들은 서밋과 함께 혁신을 만들어 낼 수 있을 것입니다. 이 같은 혁신들은 경제를 발전시키고, 인류의 건강을 향상시키며, 무한한 에너지를 전달하는 서밋에 대한 획기적인 발전을 이룰 수 있을 것입니다. 이것은 지구를 보다 나은 세상으로 만드는데 도움이 될 수 있으며 보다 빠른 슈퍼컴퓨터가 필요한 이유가 바로 이것입니다.

 

바로 이 때문에 세계 최초의 초고속 가속 슈퍼컴퓨터를 구축하는 다음과 같은 커다란 컴퓨팅 과제가 이미 설정되었습니다. 엔비디아는 이미 이  일을 오래 전부터 돕고 있었고 그 덕에 전 세계의 과학자들과 연구원들은 계속해서 레이스를 이어 나갈 수 있었습니다.

 

세계에서 가장 빠른 슈퍼컴퓨터를 소개하는 엔비디아 젠슨 황 CEO와 IBM의 Ginni Romett, 그리고 Energy Secretary Rick Perry
세계에서 가장 빠른 슈퍼컴퓨터를 소개하는 엔비디아 젠슨 황 CEO와 IBM의 Ginni Romett, 그리고 Energy Secretary Rick Perry

 

세계에서 가장 빠른 슈퍼컴퓨터에 관한 5가지 사실

 

  • 200 페타플롭스: 지구 상에 있는 모든 사람이 1초 당 계산을 수행하면 1초에 정상 회담을 수행하는 데 1년이 걸립니다.
  • 인공지능에서 3 exaops: 지구 상에 있는 모든 사람이 1초 당 계산한 경우 서밋이 1초 안에 할 수 있는 일을 수행하는 데 15년이 걸립니다.
  • 초기 테스트에서 genomics팀은 PC에서 30년이 걸리는 문제를 불과 1시간 만에 해결하였습니다.
  • 캐비닛 공간의 5,600평방 피트는 크기가 두 개의 테니스 코트와 비슷합니다.
  • 서밋의 무게는 실제 상용 제트기와 비슷합니다.