NVIDIA는 NVIDIA A100 Tensor Core GPU가 탑재된 AI 슈퍼컴퓨터와 대학 교육 지원 프로그램으로 전 세계 대학과 연구기관을 지원합니다.
미국 미네소타 대학(University of Minnesota)은 최신 가속 슈퍼컴퓨터인 에이게이트(Agate)를 구축 중이며, 이번 학기가 마무리되기 전까지 7페타플롭(Petaflop)의 성능을 제공할 예정인데요. 미네소타 슈퍼컴퓨팅 연구소(MSI)에 설치되는 에이게이트는 NVIDIA HDR 200Gb/s InfiniBand 네트워크로 265개의 NVIDIA A100 Tensor Core GPU를 연결합니다. 이를 통해 MSI는 사회 경제적 경향부터 천체에 관한 연구까지 완벽하게 진행할 예정이죠. 에이게이트는 지난 1월부터 MSI 기존 시스템의 13만 8,612개의 GPU 가속 작업을 실행해 온 1,000명의 주요 조사관을 위해 일하는 약 4,500명의 사용자를 지원할 예정입니다.
미네소타 대학의 연구 컴퓨팅 책임자인 제임스 윌겐부쉬(James Wilgenbusch)는 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise)가 구축하고 있는 가속 슈퍼컴퓨터 에이게이트에 대해 “기초과학과 인문학을 아울러 모든 분야에 관련된 연구원들과 학생들은 해당 슈퍼컴퓨터를 곧바로 사용하길 바라고 있습니다”라고 말했습니다.
윌겐부쉬는 “지질학, 역사학, 정치학, 마케팅 분야를 비롯해 생명과학과 인문과학 분야에서 연간 사용자 증가율이 가장 높은 것으로 나타납니다. 해당 분야의 관계자들은 방대한 양의 비정형 데이터를 이해하고자 노력하고 있습니다”라고 말했죠.
코로나 19 해결을 돕는 AI 슈퍼컴퓨터
미네소타 보건부(Minnesota Department of Health)는 MSI 시스템의 일부를 활용해 접촉자 추적, 코로나 19 바이러스의 변이 추적을 위한 게놈 염기서열 분석을 진행하며 코로나 19 대응에 앞장서고 있습니다.
윌겐부쉬는 미니애폴리스 신문의 한 기사를 가리키며 “이와 같은 협업은 혁신과 생명 구조를 위한 대학의 역할을 대중에게 더욱 분명하게 보여주는 사례입니다”라고 강조했습니다.
가상 GPU를 통한 인디애나 대학 강의 지원
미국 인디애나 대학(Indiana University)은 총 616개의 NVIDIA A100 GPU로 구성된 AI 슈퍼컴퓨터 2대를 구축하고 있습니다. 휴렛 팩커드 엔터프라이즈가 구축한 빅 레드(Big Red) 200은 9개의 인디애나 대학 캠퍼스를 지원할 예정이며, 델 테크놀로지스(Dell Technologies)가 구축한 제트스트림-2(Jetstream-2)는 코넬 대학(Cornell University)과 하와이 대학(University of Hawaii)을 아울러 여러 협력 기관에서 사용될 예정입니다.
제트스트림-2는 프로세서의 일부를 제공하는 A100의 기능을 활용해 수백 명의 학생과 함께 수업을 진행하는데요. 이들은 각각 GPU 성능을 활용해 이미지 분류 등의 인기 있는 AI 기술을 익히게 됩니다. 인디애나 대학의 한 연구원은 지난해 11월 가상 GPU 기능을 벤치마킹한 논문을 발표했습니다.
인디애나 대학의 퍼베이시브 테크놀로지 인스티튜트(Pervasive Technology Institute) 최고운영책임자(COO) 및 모두를 위한 AI(AI-for-everyone) 이니셔티브 리더인 위노나 스냅차일즈(Winona Snapp-Childs)는 “전체 학생을 한 번에 훈련할 수 있어 더 많은 사람들에게 액세스를 제공할 수 있게 됐습니다”라고 말했습니다.
다양한 연구를 지원하고 있는 GPU 가속 시스템
현재 2,500명 이상의 학생들이 인디애나 대학의 GPU 가속 시스템을 사용하고 있습니다. 작년 한 해 동안 178개 학과에 걸친 약 10억 달러 규모의 기록적인 대학 연구 계약, 보조금 관련 작업의 40% 이상이 해당 시스템에서 이뤄졌죠.
스냅차일즈는 “많은 펀딩 기관에서 다양한 학문 분야에 걸쳐 머신 러닝의 중요성을 인지하고 있습니다”며 “AI와 가속 컴퓨팅은 과학의 경계를 넓히는 데 도움이 됩니다. 이러한 기술이 연구에 보편화되고 필수가 되면서 향후 5년에서 10년 동안 우리 연구의 절반을 처리하게 될 것입니다”라고 덧붙였습니다.
이러한 연구 작업은 다양한 분야를 폭넓게 지원합니다. 연구원들은 소셜 네트워크에서 코로나 19에 관한 잘못된 정보를 추적하는 것부터 수확을 개선하기 위한 쌀의 게놈 연구까지 모든 분야에서 AI를 활용하고 있습니다.
슈퍼컴퓨팅을 가속하는 델타(Delta)
일리노이 대학교(University of Illinois) 어바나-샴페인(Urbana-Champaign)의 국립 슈퍼컴퓨팅 애플리케이션 센터(NCSA)는 800개 이상의 NVIDIA A100 GPU를 탑재한 AI 슈퍼컴퓨터인 델타를 통해 가속 컴퓨팅 사용을 확장하고 있습니다.
델타를 감독하는 NCSA의 수석 연구원 겸 책임자인 윌리엄 그로프(William Gropp)는 “우리는 전산 고고학, 디지털 농업과 같은 신흥 연구 분야에서 새로운 컴퓨팅 방법과 하드웨어를 활용하는 동시에 연구원들이 고급 시스템을 보다 광범위하고 유용하게 사용하도록 지원할 것입니다”라고 강조했습니다.
국립과학재단(National Science Foundation)은 델타를 통해 GPU 기반 컴퓨팅을 활용하며 연구를 가속하고 있습니다. 해당 연구는 장애가 있는 사용자들이 델타를 비롯한 미래형 시스템에 쉽게 접근하도록 돕는 이니셔티브를 포함합니다.
미국 플로리다 대학(University of Florida)의 AI 활용 사례
미국 플로리다 대학은 하이퍼게이터(HiPerGator) AI 시스템를 통해 가속 컴퓨팅을 활용하고 있습니다. 최근 기사에서 조 글로버(Joe Glover) 학장은 헨리 포드(Henry Ford)의 조립 라인이 많은 미국인들에게 자동차를 보급했듯이, 하이퍼게이터 시스템은 많은 이들에게 AI 기술을 보급할 것이라고 설명했죠. 미국 플로리다 대학은 향후 약 100명의 AI 중심 교수진을 추가로 구성해 전반적인 교육과정에 머신 러닝을 적용하고, 2030년까지 약 3만 명의 AI 활용이 가능한 졸업생을 배출하는 것을 목표로 하고 있습니다.
하이퍼게이터 AI는 HDR 200Gb/s 인피니밴드 네트워크로 1,120개의 A100 GPU를 연결하고 있으며, 최근 발표된 세계에서 가장 빠른 슈퍼컴퓨터 상위 500개 목록에서 22위에 올랐습니다. 하이퍼게이터 AI는 NVIDIA DGX 시스템을 레고와 같은 방식으로 스태킹(stacking)하는 방법인 NVIDIA DGX SuperPOD 레퍼런스 아키텍처를 사용한 덕분에 단 몇 주 만에 구축됐습니다.
AI 슈퍼컴퓨팅의 광범위한 활용사례
이 밖에도 AI 슈퍼컴퓨터는 미국과 유럽에 걸친 주요 대학과 연구기관에서 활용되고 있습니다.
- 캘리포니아 대학교 버클리 캠퍼스(University of California, Berkeley) 연구원들은 6,144개의 A100 GPU를 탑재한 세계에서 5번째로 빠른 시스템인 펄머터(Perlmutter)를 도입했습니다.
- 케임브리지 대학교(University of Cambridge)는 델 EMC 파워엣지(PowerEdge)를 기반으로 구축된 클라우드 네이티브 슈퍼컴퓨터인 CSD3를 선보였으며, 현재 영국에서 가장 빠른 교육 시스템이자 세계에서 가장 에너지 효율적인 시스템인 그린500(Green500) 리스트 3위에 등재됐습니다.
- 에든버러 대학교(University of Edinburgh)는 영국 DiRAC 연구 그룹이 운영하는 4개의 시스템 네트워크 중 최신 버전이자 448개의 A100 GPU를 탑재한 시스템을 구축하고 있습니다.
- 린셰핑 대학교(Linköping University)는 현재 스웨덴에서 가장 큰 슈퍼컴퓨터인 베르셀리우스(BerzeLiUs)의 본거지입니다. 베르셀리우스는 국가 AI 이니셔티브를 지원함과 더불어 싱가포르 난양 공과 대학교(Nanyang Technical University) 연구원들과 공유될 예정입니다.
딥 러닝 인스티튜트(DLI) 교육용 키트와 대학 앰배서더 프로그램 활용사례
NVIDIA는 AI 기술의 저변 확대를 위해 DLI 교육기관을 운영 중입니다. AI 기술 구현에 필요한 핵심 기술, 애플리케이션 도메인과 관련된 기초 및 심화 과정의 핸즈온 교육 과정들을 제공하고 있습니다. 또한 학생, 교수진, 연구자들이 DLI 교육에 무료로 액세스할 수 있는 두 가지 프로그램을 제공하고 있습니다.
첫 번째 프로그램은 딥 러닝, 가속 컴퓨팅, 로보틱스에 관한 교육 자료를 무료로 다운받을 수 있는 교육용 키트입니다. 최근에는 데이터 사이언스, 그래픽스, Omniverse에 대한 교육용 키트가 출시됐습니다. 교육용 키트에는 강의 자료, GPU 클라우드 리소스, 자기주도형 DLI 과정에 대한 액세스 권한 등 대학 커리큘럼을 향상시킬 수 있는 자료가 포함돼 있습니다. 교육자들은 DLI 홈페이지에서 별도 자격 인증 과정 없이 해당 교육용 키트를 다운받을 수 있습니다.
두 번째는 대학 앰배서더 프로그램으로, 자격을 갖춘 교수진과 연구자들이 학생, 교직원들에게 DLI 워크숍을 무료로 가르칠 수 있는 인증을 받는 프로그램입니다. 1인당 500달러(한화 약 59만 원) 상당의 DLI 교육 프로그램을 앰버서더십 취득 시 교내 무료로 도입이 가능합니다. 교육 자료, 실습 노트북, 글로벌 과정 인증서 및 실습에 활용할 수 있는 고성능의 GPU 클라우드 워크스테이션을 함께 추가 비용 없이 지원하고 있습니다. 현재 전세계 300개가 넘는 대학 기관에서 앰배서더십을 취득했으며, 국내에서는 서울대, KAIST, 한양대, 연세대, GIST 등 국내 20개 이상의 대학교에서 이미 DLI 앰배서더 프로그램을 도입하거나 도입을 검토 중에 있습니다.
NVIDIA의 대학 교육 지원 프로그램과 전 세계적으로 분포돼 있는 고성능 시스템인 슈퍼컴퓨터는 머신 러닝, 가속 컴퓨팅을 통해 과학 분야의 발전을 전폭적으로 지원하고 있습니다.