엔비디아 젠슨 황 CEO의 GTC 2020 키노트 주요 발표 내용 요약 정리와 영상

엔비디아 젠슨 황 CEO는 미국 캘리포니아에 위치한 자신의 집에서 9개의 에피소드로 발표한 2020 GTC 키노트에서, 멜라녹스(Mellanox) 인수건과 한껏 기대를 받고 있는 엔비디아 차세대 GPU 아키텍처 암페어(Ampere), 그리고 새로운 소프트웨어 기술에 기반한 다양한 신제품들에 대해 발표했습니다.

이 키노트는 원래 지난 3월 미국 새너제이에서 개최될 엔비디아의 세계 최대 GPU 컨퍼런스(GPU Technology Conference) GTC에서 생방송으로 전달할 예정이었으나 코로나 팬데믹으로 연기되었었죠.

젠슨 황 CEO는 먼저 “코로나19에 맞서 용감하게 싸우고 있는 모든 분들께 감사드립니다”며 발표를 시작했습니다.

스트럭츄라 바이오테크놀로지(Structura Biotechnology), 텍사스 대학교, 미국 국립보건원(National Institutes of Health)가 재구성한 코로나바이러스의 스파이크 단백질의 3D 구조 모습

젠슨 황 CEO는 연구원들과 과학자들이 함께 GPU와 인공지능(AI) 컴퓨팅을 활용해 팬데믹을 치료·완화·억제·추적하며 해결할 수 있다고 설명했습니다. 언급한 내용은 다음과 같습니다.

옥스퍼드 나노포어 테크놀로지스(Oxford Nanopore Technologies)는 7시간 만에 바이러스 유전자를 시퀀싱(sequencing)했습니다.
플로틀리(Plotly)는 바이러스의 실시간 감염률 추적을 실행합니다.
오크 리지 국립 연구소(Oak Ridge National Laboratory)와 스크립스 연구소(Scripps Research Institute)는 하루만에 10 억 개의 약물 조합을 스크리닝합니다.
스트럭츄라 바이오테크놀로지(Structura Biotechnology), 미국 오스틴의 텍사스 대학교와 미국 국립보건원(National Institutes of Health)은 코로나바이러스의 스파이크 단백질의 3D 구조를 재구성했습니다.

또한 엔비디아는 코로나19 대응을 위해 AI 기반 의료기기용 플랫폼인 ‘엔비디아 클라라’(Clara)를 대대적으로 업데이트하였습니다.

젠슨 황 CEO는 “엔비디아의 가속 컴퓨팅을 통해 생명을 구하는 연구진과 과학자들은 엔비디아의 목표에 완벽하게 부합합니다. 저희는 고성능 컴퓨터를 구축해 일반 컴퓨터가 다룰 수 없는 문제를 해결합니다”라고 말했습니다.

젠슨 황 CEO의 키노트의 핵심은 현재 글로벌 정보 경제의 견인차 역할을 하는 데이터센터가 변화하고 있는 방식과 지난달 엔비디아가 인수 완료한 멜라녹스의 비전을 제시하는 것이었습니다.

젠슨 황 CEO는 ‘데이터센터는 신생 컴퓨팅 장치’라고 언급하며 엔비디아는 실리콘밸리, CPU와 GPU가 연결하는 방식, 소프트웨어 전체 스택, 궁극적으로 나아가 전체 데이터센터의 성능을 가속화하고 있다고 덧붙였습니다.

키노트 영상 파트 1: 엔비디아와 멜라녹스

영상 소개: 엔비디아와 멜라녹스는 더욱 혁신적이고 강력한 데이터센터 구축을 위해 하나로 합쳤습니다.

키노트 영상 파트 2: RTX 그래픽

컴퓨터 그래픽 분야는 레이 트레이싱과 AI를 결합하여 눈부신 시각 효과를 구현해낸 엔비디아 RTX와 함께 새로운 세대로 접어들었습니다. 특히 엔비디아 옴니버스(NVIDIA Omniverse)는 여러 산업에 걸쳐 실시간 협업 기능을 제공합니다.

오늘날 세상에서 가장 중요한 애플리케이션을 위한 소프트웨어

젠슨 황 CEO는 엔비디아 GPU가 세 가지 중요한 측면, 즉 빅데이터(big data) 관리, 추천 시스템 생성, 실시간 대화형 AI 구축 부문을 가속화하기 위해 주요 소프트웨어 애플리케이션을 강화할 것이라고 말했습니다.

이러한 새로운 도구들은 머신 러닝의 효율적인 기술을 통해 데이터를 수집하는 기업들이 늘어나면서 등장하게 됐습니다. 젠슨 황 CEO는 “긍정적인 피드백을 통해 엔비디아는 수집된 데이터 양의 폭발적인 증가를 경험하고 있습니다”라고 전했습니다.

모든 기업들이 조직의 운용을 위해 아파치 스파크 3.0(Apache Spark 3.0) 기반 엔비디아 GPU 가속 지원을 하겠다며, 빅데이터 분석 엔진은 “현대 세상에서 가장 중요한 애플리케이션”이라고 설명했습니다.

아파치 스파크 3.0은 머신 런닝용 가속 플랫폼인 ‘래피즈’(RAPIDS)를 기반으로 데이터 추출, 변환, 로드 부문에서 전통적인 기준들을 다 넘어서고 있습니다. 특히 어도비 인텔리전트 서비스(Adobe Intelligent Services)는 아파치 스파크 3.0을 활용해 컴퓨팅 비용 절감을 90%나 달성했지요.

또한 아마존 세이지메이커(Amazon SageMaker), 애저 머신 런닝(Azure Machine Learning), 데이터브릭스(Databricks), 구글 클라우드 AI와 데이터프록(Dataproc)과 같은 세계적인 클라우드 분석 플랫폼의 선두 기업들은 엔비디아의 GPU를 통해 컴퓨팅 성능 가속화를 구현하고 있다고 소개되었습니다.

젠슨 황 CEO는 “엔비디아는 현재 데이터 양이 수십 혹은 수백 페타바이트지만 앞으로 엑사스케일 이상으로 기하 급수적으로 폭등하게 될 미래를 대비하고 있습니다”라고 말하였습니다.

또한 앞으로 빠르게 개인 인터넷 세상의 중추 역할을 하게 될 차세대 추천시스템 구축을 위한 엔드-투-엔드 프레임인 ‘엔비디아 멀린’(NVIDIA Merlin)을 공개했는데요, 멀린은 100테라바이트 데이터세트를 활용해 추천 시스템을 구축하는 데 필요한 시간을 4일에서 단 20분으로 단축시킵니다.

젠슨 황 CEO는 엔비디아 AI 플랫폼 기반으로 구축될 수 있는 실시간 멀티모덜(multimodal) 대화형 AI를 위한 새로운 엔드-투-엔드 플랫폼인 NVIDIA Riva 에 대해 자세히 설명했습니다. 그는 NVIDIA Riva 데모버전을 선보이며 인공지능 미스티(Misty)가 날씨에 대해 실시간으로 던지는 복잡한 여러 질문을 이해하고 친절하게 대답하는 것을 보여줬습니다.

또한 젠슨 황 CEO는 엔비디아 RTX가 SIGGRAPH 2018에서 출시된 이후 빠르게 발전한 실시간 레이 트레이싱을 분석하며, ‘엔비디아 옴니버스’(NVIDIA Omniverse)가 동일한 디자인 프로젝트의 서로 다른 과제를 맡아 다른 장소에서 다른 도구를 사용하는 여러 디자이너들이 동시에 협력할 수 있도록 만들었다며 이는 이제 초기 액세스 고객들이 사용할 수 있다고 말했습니다.

키노트 영상 파트 3: HPC & 데이터 분석

엔비디아 GPU 가속은 HPC, 데이터 처리, 그리고 과학 컴퓨팅 발전을 위한 포석입니다. 스파크(Spark) 3.0와 데이터브릭스(Databricks)를 위한 GPU 가속화를 소개합니다.

키노트 영상 파트 4: 추천 기능을 위한 시스템

추천 시스템은 인터넷의 엔진입니다. 이 새로운 어플리케이션 프레임워크는 개인화된 경험을 쉽게 만들 수 있도록 합니다.

키노트 영상 파트 5: 대화형 AI

다양한 산업 전반에 걸쳐 많은 회사들은 새로운 어플리케이션 프레임워크를 통해 대화형 AI를 실시간으로 구현할 수 있습니다.

데이터센터-스케일 컴퓨팅에 최적화된 시스템

엔비디아의 컴퓨팅 성능 가속화는 AI 훈련과 추론을 통합하고 유연하고 탄력적인 가속화를 가능하게 하면서, 새로운 종류의 데이터센터-스케일 컴퓨팅에 최적화된 새로운 GPU 아키텍처를 토대로 시작됩니다.

젠슨 황 CEO는 처음으로 공개한 엔비디아 A100은 엔비디아 암페어 아키텍처를 기반으로 하는 최초의 GPU로서 엔비디아 8세대 GPU의 최고 성능을 자랑하며, 데이터 분석, 과학 컴퓨팅과 클라우드 그래픽을 목표로 구축됐으며 전세계 고객을 위해 엔비디아 A100의 생산과 운송이 완벽하게 가동 중이라고 말했습니다.

젠슨 황 CEO는 “세계 최고의 서비스 제공업체와 시스템 빌더 18개의 기업들이 엔비디아 A100 GPU를 활용하고 있습니다. 이 중에는 알리바바 클라우드(Alibaba Cloud), 아마존웹서비스(Amazon Web Services), 바이두 클라우드(Baidu Cloud), 시스코(Cisco), 델 테크놀로지(Dell Technologies), 구글 클라우드(Google Cloud), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 마이크로소프트 애저(Microsoft Azure), 오라클(Oracle)이 있습니다”고 말했습니다.

젠슨 황 CEO는 엔비디아 암페어 아키텍처와 이를 기반으로 한 A100를 통해 컴퓨팅 성능이 최대 20배 빨라진다고 전했습니다.

A100의 5가지 핵심 기능은 다음과 같습니다.

540 억 개 이상의 트랜지스터를 통해 세계 최대의 7 나노 미터 프로세서를 갖췄습니다.
단정도 AI 훈련을 가속화하는 새로운 수학 형식 인 TF32가 탑재된 3 세대 텐서 코어(Tensor Core)입니다. 광범위하게 사용되는 엔비디아의 텐서 코어는 유연성, 속도, 사용 용이성 면에서 뛰어납니다.
AI 수학의 본질적으로 희박한 특성을 활용하여 고성능을 구현해 효율성을 높인 신기능을 갖추어 구조적 희소성(Structural sparsity)을 지원합니다.
MIG(Multi-Instance GPU) 기술을 사용하면 각각의 리소스를 갖춘 최대 7 개의 개별 GPU를 단일한 A100 GPU에서 동시에 운용시킬 수 있습니다.
GPU 간의 고속 연결을 2배로 늘려 A100 서버가 하나의 거대한 GPU로 작동할 수 있는 3 세대 NVLink 기술은 GPU간의 고속 연결속도를 2배로 향상시켜 A100 서버가 하나의 대용량 GPU의 역할을 할 수 있게 됩니다.

위의 모든 기능 때문에 A100는 엔비디아의 전세대 볼타(Volta) 아키텍처보다 6배 향상된 훈련 성능과 7배 향상된 추론 성능을 제공합니다.

키노트 영상 파트 6: 엔비디아 A100 GPU, HGX A100, & DGX A100

엔비디아 암페어(NVIDIA Ampere) 아키텍처의 혁신적인 데이터 분석 및 트레이닝, 추론 성능을 확인해보시기 바랍니다.

엔비디아 DGX 100, 5페타플롭스급 성능 달성

엔비디아는 엔비디아 A100를 기반으로 한 3세대 엔비디아 DGX AI 시스템이자 세계 최초의 5 페타플롭스 서버를 갖춘 ‘엔비디아 DGX A100’(NVIDIA DGX A100)을 제공합니다. DGX A100은 한 개의 시스템 당 최대 56개의 애플리케이션으로 분할되어 각각 독립적으로 운용될 수 있습니다.

코로나19 분석과 대응을 위한 미국 에너지부(Department of Energy)의 아르곤 국립 연구소(Argonne National Laboratory)의 DGX A100의 AI와 컴퓨팅 활용

엔비디아 DGX A100는 단일 서버가 AI 훈련 같은 계산 집약적 과제를 하기 위해 스케일 업(scale up)하거나 AI 배포나 추론을 위해 스케일 아웃(scale out)할 수 있다고 젠슨 황 CEO는 설명했습니다.

이 시스템의 초기 수혜자 중에는 코로나19 분석과 대응을 위해 클러스터 AI와 컴퓨팅을 활용할 계획을 하고 있는 미국 에너지부의 아르곤 국립 연구소(Argonne National Laboratory)와 플로리다 대학교, 독일 인공지능 연구소(German Research Center for Artificial Intelligence)가 있습니다.

클라우드와 파트너 서버 제조업체들은 A100를 HGX A100으로 사용할 수 있습니다.

젠슨 황 CEO는 “AI 훈련과 추론을 위한 5개의 DGX A100 시스템으로 구동되는 데이터센터는 불과 100만 달러의 비용으로 28kw의 전력만을 필요로 합니다. 그러나 일반적으로 데이터센터는 AI 훈련을 위한 50개의 DGX-1 시스템과 600개의 CPU 시스템을 기반으로 무려 1100만 달러의 비용이 들며 630kw의 전력을 소모합니다”며, “구매를 많이 할수록 비용 절감이 클 것입니다”라고 거듭 말했습니다.

이 뿐만이 아닙니다. 젠슨 황 CEO는 차세대 ‘DGX 슈퍼 POD’(DGX Super POD)도 언급했습니다. DGX 슈퍼 POD는 140개의 DGX A100 시스템과 멜라녹스 네트워크 기술이 결합돼 700페타플롭스급의 AI 성능을 제공하며, 이것은 전세계에서 가장 빠른 20대 컴퓨터 안에 든다고 덧붙였습니다.

엔비디아는 자체내 데이터센터를 4개의 DGX 슈퍼 POD로 확장함으로써, AI 컴퓨팅 성능을 2.8엑사플롭스 추가해 총용량을 4.6엑사플롭스로 구축해 세계에서 가장 빠른 AI 슈퍼 컴퓨터인 ‘새턴V 슈퍼컴퓨터’(SATURNV internal supercomputer)를 만들었습니다.

또한 젠슨 황 CEO는 강력한 실시간 클라우드 컴퓨팅의 최첨단 기술을 갖춘 ‘엔비디아 EGX A100’을 발표했습니다. EGX A100의 암페어 아키텍처 GPU는 3세대 텐서 코어와 새로운 보안 기능을 갖췄습니다. 엔비디아 멜라녹스 커넥트X-6 스마트NIC(ConnectX-6 SmartNIC)을 기반으로 안전하면서도 광속도를 갖춘 네트워크 기능이 탑재됐습니다.

엔비디아 로보틱스 미래 공장의 청사진을 보여주다

키노트에서 젠슨 황 CEO는 엔비디아가 로봇 소프트웨어 플랫폼인 엔비디아 ‘아이작’(Issac)을 지속적으로 발전시키고 있으며 세계 최대 자동차 업체 BMW가 공장의 물류운송을 돕기 위해 엔비디아 이삭 로보틱스를 선택했다고 발표했습니다.

BMW은 전 세계에 있는 50개의 공장에서 56초마다 자동차 한 대씩을 생산하고 있습니다. 공장에서는 40개의 다양한 자동차 모델, 수백가지의 다양한 옵션, 전 세계 2,000개의 공급업체에서 오는 3,000개의 부품을 다뤄야 하는데요, 이로써 BMW는 배달 서비스, 소매, 자율 모바일 로봇, 농업, 서비스, 물류, 제조와 헬스케어를 망라하는 엔비디아의 글로벌 로봇 에코시스템에 합류하게 됐습니다.

미래의 공장은 하나의 거대한 고효율 로봇 플랫폼에 기반할 것입니다. 젠슨 황 CEO는 “공장 내부에서 움직이는 모든 부품은 인공지능으로 작동될 것입니다. 앞으로 대량생산되는 모든 단일 물품들은 개인 맞춤형으로 변화할 것입니다”라고 말했습니다

키노트 영상 파트 7: 엔비디아 EGX A100 컨버지드 가속기

엔비디아와 멜라녹스는 안전한 AI 처리를 엣지 단계에까지 구현합니다. BMW는 공장 물류 자동화를 위해 엔비디아 아이작(Isaac) 로보틱스 플랫폼을 선택하였습니다. 아이작 SDK, 아이작 Sim, 젯슨 자비어(Jetson Xavier) NX devkit 등 엔비디아의 새로운 제품 소식을 확인해보세요.

자율주행 자동차를 선도하는 엔비디아 드라이브

젠슨 황 CEO에 따르면 자율주행 자동차는 컴퓨팅 분야에서 우리 시대의 가장 큰 도전 과제라며, 자율 주행 자동차는 엔비디아가 엔비디아 드라이브(NVIDIA DRIVE)를 통해 주력하여 개발하고 있는 분야라고 합니다.

엔비디아 드라이브는 엔비디아 암페어 GPU가 탑재된 새로운 ‘오린 SoC’(Orin SoC)를 활용해 전면 유리창에 5w ADAS 시스템을 제공하고 최대 2,000개의 TOPS 레벨5 로봇 택시 시스템으로 업그레이드하면서 에너지 효율성과 고성능을 달성했습니다.

이제 자동차 제조업체들은 자동차의 각 부분에 AI를 구축하기 위해 단일의 컴퓨팅 아키텍처와 단일의 소프트웨어 스택을 사용합니다.

젠슨 황 CEO은 “자동차 제조업체가 자동차 한 대 전체에 대해 단일의 아키텍처를 적용하고 소프트웨어 개발을 활용하는 것이 이제 가능해 졌습니다”라고 말했습니다.

엔비디아 드라이브 에코시스템은 현재 자동차, 트럭, 제1 자동차 공급업체, 차세대 모빌리티 서비스, 신생기업, 매핑 서비스, 시뮬레이션 모두에 활용될 수 있습니다.

젠슨 황 CEO는 엔비디아가 자율 자동차 전체를 관리하기 위해 엔비디아 드라이브 기술 제품군에 엔비디아 드라이브 RC(Drive RC)를 추가했다고 발표했습니다.

키노트 영상 파트 8: 자율주행 자동차

엔비디아 오린(Orin) 기반 디바이스는 ADAS부터 2+ 레벨의 오토파일럿(AutoPilot), 그리고 완전한 자율주행 로보택시에 이르기까지 다양합니다.

키노트 영상 파트 9: 키노트 마무리

새로운 암페어 아키텍처와, A100, GPU 가속화된 어플리케이션과 프레임워크(Spark 3.0, NVIDIA Merlin, NVIDIA Riva, RTX 서버, DGX A100, Mellanox ConnectX-6 DX SmartNIC, HGX A100, EGX A100, 그리고 DRIVE AGX Orin.키노트에서 발표한 모든 내용들을 요약하여 소개합니다. 각 제품에 대한 자세한 내용은 아래 블로그 링크를 통해 확인해보시기 바랍니다.