AI 기반 슈퍼컴퓨터의 미래를 NVIDIA에 묻다

Arm 아키텍처 기반 전세계 HPC 선두업체들의 쿠다(CUDA) 활용으로 엑사스케일(exascale) 슈퍼컴퓨터 구축이 가속될 것입니다.
by NVIDIA Korea

엔비디아가 Arm CPU를 지원하기로 발표했습니다. 이로써, 고성능 컴퓨팅산업이 에너지 효율성 높은 인공지능(AI) 기반의 엑사스케일(exascale) 슈퍼컴퓨터를 구축할 수 있는 새로운 길을 마련하게 됐습니다.

올해 말까지 엔비디아의 AI와 HPC 소프트웨어 스택 전체를 Arm 에코시스템(Arm® ecosystem)에 제공하는 작업을 추진합니다. 이는 600개 이상의 HPC 애플리케이션과 전체 AI 프레임워크를 가속화하는 작업이죠. 해당 스택에는 엔비디아 쿠다-X AI(CUDA-X AI™) 전체와 HPC 라이브러리, GPU 가속화 AI 프레임워크, 오픈에이씨씨(OpenACC) 지원과 프로파일러를 갖춘 PGI 컴파일러와 같은 소프트웨어 개발 툴이 포함됩니다.

스택 최적화 작업이 완료되면, 엔비디아는 x86, 파워(POWER), 그리고 Arm을 비롯한 대표적인 CPU 아키텍처 전체를 가속화하게 됩니다.

엔비디아 창업자 겸 CEO 젠슨 황(Jensen Huang)은 “슈퍼컴퓨터는 과학적 발견에 필수적인 장비이며 엑사스케일 슈퍼컴퓨팅이 성공적으로 구축되면, 인간 지식의 한계가 크게 확장될 것입니다. 기존의 컴퓨트 스케일링(compute scaling)이 종료되면서, 모든 슈퍼컴퓨터가 전력 제약을 받게 되죠. 엔비디아의 쿠다(CUDA) 가속 컴퓨팅과 Arm의 에너지 효율적인 CPU 아키텍처의 결합으로 HPC 업계는 엑사스케일을 구현할 수 있는 힘을 얻게 될 것입니다”라고 말했습니다.

Arm CEO 사이먼 시거스(Simon Segars)는 “Arm은 본사 에코시스템과의 협력을 통해 전례 없는 컴퓨트 성능 향상과 엑사스케일 급의 기능을 Arm 기반 시스템 온 칩(SoC)에 제공하고자 노력하고 있습니다”라며, “Arm 아키텍처에 쿠다 가속을 지원하기 위한 엔비디아와의 협업은 HPC 업계에 주요한 이정표가 될 것입니다. HPC 업계는 이미 Arm 기술을 활용해 세계에서 가장 복잡한 연구과제를 추진하고 있죠”라고 덧붙였습니다.

최근 발표된 ‘그린 500(Green500)’ 리스트에 따르면 세계에서 가장 에너지 효율성이 우수한 25대 슈퍼컴퓨터 중 22대가 엔비디아 제품을 사용하고 있답니다.

엔비디아 GPU가 탑재된 슈퍼컴퓨터의 경우 무거운 처리 업무를 에너지 효율이 높은 병렬처리 쿠다 GPU로 넘길 수 있습니다. 엔비디아와 멜라녹스(Mellanox)의 협업으로 전체 슈퍼컴퓨팅 클러스터에서 처리가 최적화되며, 엔비디아의 SXM 3D-패키징과 엔비디아 NV링크 인터커넥트 기술(NVIDIA NVLink® interconnect technology) 발명으로 초고밀도 스케일업(scale-up) 노드의 구현이 가능하다는 점 등이 이러한 결과를 가능하게 하는 주요 요인입니다.

엔비디아의 Arm 기반 HPC 시스템 지원은 10여 년 이상의 협업 역사를 바탕으로 합니다. 엔비디아는 휴대용 게임, 자동차, 로보틱스, 그리고 임베디드 AI 컴퓨팅 등에 사용되는 몇몇 자사 SoC 제품에 Arm을 사용하고 있습니다.

글로벌 기업들의 평가는 다음과 같습니다

“본사 고객들은 가장 까다로운 워크로드를 운영하기 위해 고성능의 Arm 기반 프로세서를 찾고 있습니다. 엔비디아가 쿠다와 엔비디아 중심으로 구축된 다채로운 에코시스템을 Arm으로 이전한다는 소식을 매우 기쁘게 생각합니다. 이로써 본사의 Arm 기반 서버를 위한 소프트웨어 에코시스템 구축 작업이 속도를 내게 되고, 효율성과 성능을 위해 엔비디아 GPU가 적용된 획기적인 암페어(Ampere) 플랫폼이 구현될 것입니다”

— 르네 제임스(Renee James), 암페어 컴퓨팅(Ampere Computing) 회장 겸 CEO

“아토스(Atos)는 몽블랑(Montblanc) 프로젝트와 엑사스케일 슈퍼컴퓨터, 불 세쿠아나 X(Bull Sequana X)에 적용되는 Arm 컴퓨팅 블레이드 설계를 통해 증명된 ARM 에코시스템의 선구자입니다.  Arm에 큰 힘을 실어줄 엔비디아의 주요 발표를 지지하게 되어 기쁘게 생각합니다. 이번 발표로 에너지 효율을 최적화하면서 AI와 시뮬레이션 세계의 융합이 가속화될 것입니다”

— 피에르 바나베(Pierre Barnabé), 아토스(Atos) 빅 데이터 & 사이버보안 부문 총괄 및 부사장(SEVP)

“크레이(Cray)에서는 AI와 애널리틱스를 모델링과 시뮬레이션으로 통합하는 시스템, 다양한 프로세서 아키텍처를 구현하고, 종종 요구되는 시스템, 그리고 과학, 엔지니어링 및 디지털 전환에 필요한 데이터 집약적 워크로드 용으로 구축된 시스템 등을 엑사스케일 시대 비전으로 보고 있습니다. Arm 플랫폼에서 엔비디아 쿠다, 쿠다-X HPC 와 AI 소프트웨어 스택을 활용하고, 본사 XC, 미래 샤스타(Shasta) 슈퍼컴퓨터 전반에서 Arm 프로세서를 지원할 수 있게 이미 구현된 크레이 시스템 관리와 프로그래밍 환경(컴파일러, 라이브러리, 툴 등)과 밀접하게 통합함으로써 슈퍼컴퓨터에서 이러한 본사 비전을 실현하기 위해 엔비디아와 함께 일하게 된 것을 기쁘게 생각합니다”

— 피터 운가로(Peter Ungaro), 크레이 사장 겸 CEO

“유럽은 고성능 컴퓨팅 분야에서 유로HPC(EuroHPC)를 통해 협업하여 연구와 혁신, 그리고  산업 성장을 발전시키고 있습니다. CSC는 Arm에서 HPC와 AI를 위한 엔비디아의 GPU 가속 컴퓨팅 플랫폼을 미래 엑사스케일 이전 솔루션의 잠재적 구성요소로 테스트하는데 많은 관심을 갖고 있답니다.”

— 킴모 코스키(Kimmo Koski), CSC 매니징 디렉터

“유럽 프로세서 이니셔티브(European Processor Initiative,  EPI)는 유럽연합에 자체의 하이엔드, 저전력, 일반용도와 가속기 솔루션을 제공하는 것을 목표로 하고 있습니다. EPI와 EPI의 산업 브랜드인 시펄(SiPearl)은 엔비디아가 제공하는 새로운 가능성을 매우 긍정적으로 보고 있죠. EPI Arm 기반 마이크로프로세서와 엔비디아 가속기 간의 결합은 미래의 유럽 엑사스케일 모듈형 슈퍼컴퓨터의 구성요소를 갖추는데 안성맞춤이 될 수 있습니다”

— 필립 노통(Philippe Notton), EPI 본부장(GM)

“엔비디아와 Arm 모두 고성능 컴퓨팅 고객에게 우수한 에너지 효율성을 제공하는 기술을 활용합니다. 엔비디아의 Arm 지원으로 HPE 아폴로(Apollo) 70에 대한 본사 최신 개발이 보완되죠. HPE 아폴로 70은 Arm 기반의 특정 목적용 HPC 시스템으로 이제 엔비디아 GPU까지 지원하게 됐습니다. HPE 아폴로 70이 2U GPU 트레이와 다수의 에너지 효율적 쿨링 옵션을 지원하게 되면서, HPC 업계가 점점 더 지속하기 어려운 수준의 전력 소모에 대체하는데 본사가 더 많은 기여를 할 수 있게 됐습니다”

— 빌 맨넬(Bill Mannel), HPE, HPC 및 AI 그룹, 부사장 겸 총괄

“율리히 슈퍼컴퓨팅 센터(Jülich Supercomputing Centre)는 슈퍼컴퓨팅 선두에서 개발을 이끌며 모듈형 기술을 구축하여 유럽 연구자들에게 최고의 자원을 가장 효율적으로 제공함으로써 세계의 가장 힘든 과제를 해결할 수 있도록 지원하고 있습니다.  특히, 향후 계획된 엑사스케일 시스템과 대형 AI 연산의 부상의 관점에서 본다면, 엔비디아의 Arm 프로세서 지원은 많은 기대를 갖게 합니다. 이런 지원은 슈퍼컴퓨터의 진정한 모듈성과 미래의 구성 가능한 데이터센터를 구축하는데 필수적이죠. 이는 유럽의 슈퍼컴퓨팅 발전에 기여하게 될 것입니다

— 토마스 리퍼트(Thomas Lippert), 율리히 슈퍼컴퓨팅 센터 소장

“본사는 쿠다-X 플랫폼과 엔비디아 GPU를 마벨(Marvell) 썬더X2(ThunderX2) 서버 프로세서 제품군과 결합하기 위해 엔비디아 그리고 서버 OEM과 협력하게 된 것을 매우 기쁘게 생각합니다. 썬더X2의 동급 최강 64-비트 Armv8 성능과 엔비디아 GPU의 결합으로 획기적인 수준의 에너지 효율성과 애플리케이션 성능을 구현하여 엑사스케일 컴퓨팅에 세계 수준의 HPC와 AI 솔루션을 제공할 수 있을 것입니다”

— 매트 머피(Matt Murphy), 마벨(Marvell) 사장 겸 CEO

“HPC 네트워크의 리더로서, 본사의 인피니밴드(InfiniBand)와 이더넷(Ethernet) 기술은 1세대 Arm 기반 시스템을 포함해서 세계 최대 슈퍼컴퓨터의 상당수를 연결합니다. 본사의 첨단 초당 200기가 HDR, 연산 네트워킹 기술을 배치하여 HPC와 AI 워크로드를 최적화하고, 차세대 Arm 기반 슈퍼컴퓨터를 슈퍼 커넥트(super-connect)하기 위해 엔비디아와의 지속적인 협력에 많은 기대를 걸고 있습니다”

— 이왈 월드만(Eyal Waldman), 멜라녹스 테크놀로지스(Mellanox Technologies) 창립자 겸 CEO

“본사는 지난 10 여 년간 일본에서 가장 강력한 ABCI 슈퍼컴퓨터를 포함한 대형 슈퍼컴퓨터에 엔비디아의 GPU를 적용하는데 앞장서 왔습니다. 리켄 연구소는 현재 차세대 Arm 기반의 후가쿠(Fugaku) 슈퍼컴퓨터를 구축하고 있으며, Arm 기반 시스템에서 곧 엔비디아의 GPU 가속 플랫폼을 사용할 수 있어 기쁩니다”

— 사토시 마츠오카(Satoshi Matsuoka) 리켄 연구소(Riken Center for Computational Sciences) 소장 겸 도쿄공업대학 교수