엔비디아, 전세계 GTC 통해 AI 산업혁명의 현주소 확인하다
*본 글을 엔비디아 젠슨황 CEO 가 직접 기고한 글입니다.
올해 실리콘밸리를 시작으로 서울, 베이징, 타이페이, 암스테르담, 도쿄, 멜버른, 뭄바이 등 4개 대륙, 8개 도시에서 개최된 GPU 개발자 컨퍼런스 ‘GTC(GPU Technology Conference)’. 그 현장에선 최근 미래 기술의 핵심 화두로 자리잡고 있는 딥 러닝을 중심으로 산업 전반에 혁명을 일으키고 있는 AI 기반 컴퓨팅이 그려갈 미래에 대한 수많은 논의와 교류가 이루어졌는데요.
GTC는 GPU의 대규모 병렬 처리 성능을 활용한 새로운 접근 방식의 HPC(고성능 컴퓨팅) 기술 발전을 지원하기 위해 2009년 시작됐으며, 최근에는 현대 인공지능(AI) 기술에 혁신적인 변화를 가져온 새로운 컴퓨팅 모델인 GPU 기반 딥 러닝의 중심지로 변모했습니다. 최근 2년 새 GPU 딥 러닝 개발자 수가 25배 급증하고, 약 1,500개의 AI 스타트업이 생겨나는 등 AI 분야의 폭발적인 성장이 전세계의 GTC 개최에 대한 수요로 이어진 것이죠.
새로운 시대를 여는 차세대 컴퓨팅
올해 전세계에서 개최된 일련의 GTC를 통해 AI 컴퓨팅 기술을 이용하여 학습하고, 생각하고, 사람들과 상호 작용하는 지능형 기계의 등장이 현실로 다가왔음을 확인할 수 있었죠. 이미 AI가 탑재된 자율주행차가 등장해 시범 주행에 나서고 있으며, 인공지능 로봇은 시행착오를 통해 스스로 운동 능력을 익히고 있습니다.
AI 컴퓨팅은 산업과 사회 전반에 거대한 변혁을 일으킬 것을 예고하고 있습니다. 컴퓨팅 기술이 진화하면서 새로운 기업들이 생겨나고, 새로운 제품이 제작되며, 우리의 일상을 변화시키죠. 컴퓨팅 기술의 역사를 돌이켜 봤을 때, 이러한 새로운 물결은 항상 컴퓨팅의 능력과 범위 모두를 확장시키는 혁신적인 컴퓨팅 모델을 토대로 하고 있음을 알 수 있습니다.
1995년의 PC-인터넷 시대는 저가의 마이크로프로세서(CPU), 표준 운영체제(Windows 95), 정보의 세계로 가는 새로운 포털(Yahoo!)의 합작으로 시작됐습니다. PC-인터넷 시대가 오자 약 십억 명의 사람들이 컴퓨터를 활용할 수 있게 됐고, ‘모든 책상과 가정에 컴퓨터를 보급한다’는 마이크로소프트 의 비전도 현실화됐습니다. 그로부터 10년 후에는 아이폰의 등장으로 ‘인터넷 통신’ 기기가 주머니 속으로 들어왔죠. 최근에는 ‘아마존 웹서비스(AWS)’를 분기점으로 본격적인 모바일-클라우드 시대가 도래했습니다. 애플리케이션의 세계가 일상 속으로 들어왔고, 모바일 컴퓨팅이 주는 자유를 약 30억 명의 사람들이 누리는 중이랍니다.
현재 우리는 GPU 딥 러닝이라는 새로운 컴퓨팅 모델로 점화된 AI 컴퓨팅의 새로운 시대를 눈앞에 두고 있습니다. 막대한 양의 데이터에서 패턴을 인식하도록 심층신경망을 훈련시키는 이 새로운 모델은 컴퓨터 과학에서 가장 복잡한 문제들을 효과적으로 해결해 보였죠. 이제는 소프트웨어가 자동적으로 작성되고 기계가 스스로 학습을 합니다. 곧 수천억 대의 기기에 지능이 주입될 것이며, AI가 모든 산업에서 혁명을 일으킬 것으로 기대되고 있습니다.
GPU 딥 러닝의 폭발적 성장
2012년, 토론토 대학의 알렉스 크리제브스키(Alex Krizhevsky)는 예시 이미지 백만 개를 자동으로 인식하도록 학습한 심층신경망을 만들었습니다. 엔비디아 GTX 580 GPU 두 개로 며칠 동안 학습한 ‘알렉스넷(AlexNet)’은 수십 년 간 정상의 위치에 있던 인간 전문가의 알고리즘을 모두 제치고 그 해의 이미지넷(ImageNet) 대회에서 우승했습니다. 같은 해, 신경망의 규모가 클수록 학습 능력도 향상된다는 것을 인식한 스탠포드 대학교의 앤드류 응(Andrew Ng) 박사와 엔비디아 연구 팀은 함께 협력하여 대규모 GPU 컴퓨팅 시스템으로 신경망을 훈련하는 방법을 개발했습니다.
이때부터 전세계 AI 연구자들의 이목이 GPU 딥 러닝으로 집중되기 시작했습니다. 구글, 페이스북, 마이크로소프트, 바이두 등 세계 유수의 IT 기업에서 최초로 이 기술을 패턴 인식에 도입했고, 2015년이 되자 인간의 능력을 뛰어넘는 ‘초인적인’ 성과가 나오기 시작했죠. 이제 컴퓨터의 이미지 인식은 인간의 능력을 상회합니다. 마이크로소프트 리서치(Microsoft Research)는 음성 인식 영역에서 GPU 딥 러닝을 사용, 대화마저도 ‘인간의 수준’에 도달하는 쾌거를 이룩했습니다.
이미지 인식과 음성 인식을 통해 GPU 딥 러닝은 기계가 학습하고, 인지하고, 생각하고, 문제를 풀 토대를 마련했습니다. GPU는 인간의 상상을 시뮬레이션하기 위한 엔진으로 출발해 지금까지 비디오 게임과 헐리우드 영화에서 놀라운 가상의 세계를 연출해왔습니다. 이제 엔비디아의 GPU는 딥 러닝 알고리즘을 실행하고, 인간의 지능을 시뮬레이션하며, 세계를 인식하고 이해할 수 있는 컴퓨터, 로봇, 자율주행차의 두뇌 역할을 담당합니다. 인간의 상상력과 지능이 서로 연관되어 있는 것처럼, GPU에는 컴퓨터 그래픽과 인공 지능이 공존하는 것입니다.
AI 컴퓨팅을 위한 엔드-투-엔드 플랫폼
새로운 컴퓨팅 모델로서의 GPU 딥 러닝은 소프트웨어의 개발과 실행 방식을 바꾸고 있습니다. 예전에는 소프트웨어 엔지니어가 프로그램을 만들고 세심하게 알고리즘을 제작했다면, 이제는 실존하는 대량의 데이터를 학습하는 알고리즘을 통해 소프트웨어가 스스로를 완성합니다. 프로그래밍은 코딩 지침에 불과하며, 딥 러닝이 신경망을 만들고 훈련시키는 역할을 담당합니다. 이러한 신경망을 데이터 센터에 배치할 경우, 새로 제시되는 방대한 데이터를 추론과 예측, 분류에 활용할 수 있다. 카메라, 자동차, 로봇과 같은 지능형 기기에 네트워크를 구축하여 세계를 이해하게 만드는 것이 가능해진 것입니다. 새로운 경험이 생기면 새로운 데이터가 생기며, 이를 통해 신경망을 훈련시키고 보다 좋은 결과물을 만들어 내며, 수십 억 대의 기기를 통해 학습한 결과는 네트워크에 연결된 모든 기기에 전송되어 그 인공지능이 더욱 정교해질 것입니다. 신경망은 GPU 처리와 대형 네트워크의 기하급수적인 발전에 힘입어 무어의 법칙보다 훨씬 빠른 속도로 지능을 쌓아갈 것입니다.
이전의 컴퓨팅 모델이 ‘명령 처리’를 중심으로 이루어진 반면, 새로운 모델은 대규모 ‘데이터 처리’에 초점이 맞춰져 있습니다. 엔비디아는 AI의 모든 면을 진보시키기 위한 엔드-투-엔드 AI 컴퓨팅 플랫폼 제작에 노력을 기울이고 있습니다.
엔비디아의 새로운 파스칼(Pascal) GPU는 20억 달러의 개발비와 수천 명의 엔지니어가 3년 동안 노력한 끝에 완성됐습니다. 이는 딥 러닝에 최적화된 최초의 GPU이기도 하다. 파스칼은 알렉스 크리제브스키가 논문에 사용했던 케플러(Kepler) GPU보다 65배 더 크고 빠르게 네트워크를 훈련시킬 수 있습니다. 파스칼 GPU 8개를 현존하는 가장 빠른 연결 기술인 ‘NVLink’로 연결한 컴퓨터 한 대는 기존 서버 250대보다 빠른 속도로 신경망을 훈련합니다.
전세계에서 매일 생성되는 방대한 양의 데이터를 AI를 통해 실시간 처리 및 대응하기 위해서는 클라우드 서비스에서 부담해야 할 작업 부하 또한 상당합니다. 엔비디아는 최근 데이터 센터에서의 추론 속도를 높이기 위해 테슬라(Tesla) P40 및 P4 GPU를 발표했다. P40은 데이터 센터의 추론 처리를 40배 가속화하며, 소 비 전력이 50와트에 불과한 P4는 일반적인 하이퍼스케일 데이터 센터에 흔히 사용되는 1U OCP 서버를 가속화하도록 설계됐습니다. 또한 엔비디아의 딥 러닝 플랫폼의 중추적인 역할을 소프트웨어가 맡고 있습니다. 훈련용 소프트웨어로는 쿠다(CUDA)와 cuDNN이 있으며. 추론 소프트웨어로는 최적화 추론 엔진인 ‘텐서RT(TensorRT)’가 발표된 바 있습니다. 텐서RT는 레이어 내부와 레이어 간의 연산을 융합하고, 기여도가 낮은 부분을 제거하고, 유효숫자를 FP16 또는 INT8로 줄이고, 그 밖의 다양한 기술을 활용해 정확성 저하 없이도 성능을 개선합니다.
언젠가 수십억 대의 지능형 기기에서 딥 러닝을 활용하여 지능적인 작업을 수행할 것입니다. 드론들은 자율적으로 창고 안을 돌아다니며 물품을 찾아 가져오며, 휴대용 의료 기기가 AI를 활용하여 현장에서 혈액 표본을 진단할 것입니다. 이 밖에도 지능형 카메라는 중요한 일이 발생한 경우에만 경고를 보내는 방법을 익힐 것입니다. 엔비디아는 이러한 지능형 IoT 기기를 위해 에너지 효율이 뛰어난 AI 슈퍼컴퓨터 ‘젯슨(Jetson) TX1’을 출시했습니다. 신용카드 크기의 모듈로 된 젯슨 TX1은 10와트의 전력만으로 1 테라플롭스(TeraFLOPS, FP16)의 성능을 냅니다. 또한 엔비디아의 가장 강력한 GPU와 같은 아키텍처를 사용해 같은 소프트웨어를 모두 활용할 수 있습니다.
다시 말해, 엔비디아는 GPU에서 딥 러닝 소프트웨어와 알고리즘까지, 훈련 시스템에서 차량 내 AI 컴퓨터까지, 클라우드에서 데이터 센터와 PC, 로봇까지 아우르는 엔드-투-엔드 AI 컴퓨팅 플랫폼을 제공하고 있죠.
모든 산업에 적용되는 AI 컴퓨팅
엔비디아의 엔드-투-엔드 플랫폼은 모든 산업에서 AI를 활용할 수 있게 만드는 첫 단계라 할 수 있으며, 현재 엔비디아 GPU 딥 러닝 중심의 AI 생태계는 전세계적으로 확산되고 있습니다. 그 과정에서 혁신적인 결과가 속속 발표되며 검색, 인식, 추천, 번역 등 소비자 인터넷 서비스에까지 AI를 도입하기 위한 경쟁이 촉발됐습니다. 알리바바, 아마존, IBM, 마이크로소프트 등 대표적인 클라우드 서비스 제공업체를 비롯한 크고 작은 기업들이 엔비디아 GPU 딥 러닝 플랫폼을 도입하고 있으며, 세계 최대의 엔터프라이즈 기술 기업들은 엔비디아 GPU를 기반으로 서버를 구축 중입니다.
• 인공지능 기반 교통 시스템: 전세계 10조 달러 규모의 교통 관련 산업은 AI가 변화시킬 수 있는 가장 거대한 산업 분야 중 하나라 할 수 있습니다. 자율주행 기술로 사고를 줄이고, 트럭과 택시 서비스의 생산성을 높이며, 새로운 이동 서비스를 개발할 수도 있습니다. 최근 바이두와 네덜란드 내비게이션 업체 톰톰(TomTom)이 자율주행 기술 개발에 엔비디아 드라이브 PX 2(DRIVE PX 2)를 도입한다고 발표한 바 있습니다. 엔비디아는 이들 기업과 HD 지도, AI 알고리즘, AI 슈퍼컴퓨터가 포함된 클라우드 기반 인공지능 자율주행차 플랫폼을 공동 개발하고 있습니다.
자율주행에는 주변 환경 및 일기 조건을 파악하고, 그에 따른 최상의 운행 계획을 수립하며, 나아가 지속적인 학습을 통해 복잡한 도로 상황을 포괄적으로 이해하는 것과 같은 고차원적인 인공지능 기술이 필요합니다. 고속도로에서의 오토크루즈(Autocruise) 운행에서부터 목적지까지의 자율주행, 운전자가 없는 완전 자율형 셔틀까지 다양한 자율주행 기술에는 개방성과 함께 확장성을 갖춘 아키텍처가 필요합니다.
엔비디아 드라이브 PX 2는 자율주행 구현에 모든 영역의 AI 기능을 활용할 수 있는 확장성을 갖춘 아키텍처입니다. 엔비디아는 GTC를 통해 지속적인 현지화 및 지도 데이터 구축을 통해 고속도로에서 자율주행을 할 수 있도록 설계된 ‘오토크루즈용 드라이브 PX 2(DRIVE PX 2 AutoCruise)’를 발표한 바 있습니다. 또한 감지, 위치측정, 계획, 동작을 포함한 자율주행의 모든 면을 다루는 자율주행 차량용 OS, ‘드라이브웍스 알파 1(DriveWorks Alpha 1)’도 함께 출시했습니다.
엔비디아는 지능형, 자율형 기계의 핵심이라 할 수 있는 시각 처리, AI, 고성능 컴퓨팅을 아우르는 혁신에 집중하고 있습니다. 엔비디아는 최초로 자율주행차와 자율형 로봇을 만들어 낸 AI 알고리즘을 보유하고 있으며, 이를 위한 강력한 성능의 실시간 컴퓨팅 플랫폼 기술 또한 확보하고 있습니다.
엔비디아는 올해 GTC에서 세계 최초의 AI 슈퍼컴퓨터 칩 ‘자비에(Xavier)’를 선보였습니다. 자비에 는 가장 발달한 서버급 CPU를 능가하는 70억 개에 달하는 트랜지스터 집적수를 자랑합니다. 또한 자비에는 드라이브 PX 2와 동급인 초당 20조 회의 딥 러닝 연산 성능을 20와트의 전력만으로 제공하는 것이 특징입니다.
• AI 엔터프라이즈 기술: 2조 달러 규모의 인지 컴퓨팅 부문에서 새로운 기회를 노리고 있는 IBM은 엔터프라이즈 부문에 AI 기술을 도입하기 위해 설계된 새로운 파워(POWER) 8 프로세서와 엔비디아 테슬라(Tesla) P100 기반의 서버를 발표했습니다. 소프트웨어 분야의 경우, SAP는 엔비디아 DGX-1 슈퍼컴퓨터 두 대를 최초 활용해 190개국 32만 명의 고객을 위한 머신 러닝 엔터프라이즈 솔루션을 적극 개발 중이라 발표한 바 있습니다.
• AI 도시 안전망 시스템: 감시 시스템 분야의 세계적인 리더 ‘하이크비젼(Hikvision)’은 AI를 사용해 도시 안전망을 강화하고 있습니다. 이 기업은 신경망 훈련에 엔비디아 DGX-1을 사용하며, 젯슨 TX1 프로세서 16개를 기반으로 ‘블레이드(Blade)’라 불리는 혁신적인 서버를 구축했습니다. 블레이드는 동급 성능의 CPU 21개 기반 서버에 비해 1/20 수준의 공간과 1/10 수준의 전력만을 사용합니다.
• AI 공장 자동화 시스템: 엔비디아는 올해 GTC에서 일본의 산업용 로봇 기업인 화낙(FANUC)이 엔비디아 AI 플랫폼을 기반으로 공장 자둥화 시스템을 구축할 것이라 발표했습니다. 심층신경망은 엔비디아 GPU로 훈련하고, GPU를 이용한 화낙의 포그(Fog) 컴퓨팅을 기반으로 로봇 여러 대를 구동하며 함께 학습하도록 하고, 각 로봇에는 실시간 AI로 작동할 GPU를 장착할 예정입니다.
• AI 기반의 4차 산업혁명: GPU 딥 러닝은 의료, 핀테크, 자동차, 소비자 웹 애플리케이션 등 다양한 분야에서 세계적으로 1,500개 이상의 AI 스타트업 기업이 탄생하는데 일조했습니다. 최근 캘리포니아 주의 도로에서 테스트를 허가 받은 ‘Drive.ai’는 운전의 모든 영역에 딥 러닝을 적용해 자율 주행 기술의 문제점을 보완하고 있습니다. 일본의 채이너(Chainer) 프레임워크 개발사인 프리퍼드 네트웍스(Preferred Networks)는 IoT용 딥 러닝 솔루션을 개발하는 중입니다. 런던의 ‘Benevolent.ai’는 DGX-1를 최초로 도입한 기업 중 하나이며, 파킨슨병, 알츠하이머, 희귀 암과 같은 질병을 치료하기 위해 딥 러닝을 활용한 약품 개발에 매진하고 있습니다.
모두를 위한 AI
AI는 몇 년 전까지만 해도 불가능하다고 생각했던 문제들을 해결할 수 있는 잠재력을 가지고 있습니다. 컴퓨터가 실제 데이터를 바탕으로 사람이 제작한 소프트웨어나 사람의 힘으로는 너무 복잡하거나 거대하다고 여겨지던 패턴들을 학습하고 인식할 수 있게 된 것입니다. GPU 딥 러닝은 이 컴퓨팅 모델을 실용화하고, 세계 최대 규모의 산업들이 직면한 난제 해결을 위해 적용하는데 크게 공헌했습니다. 자율주행 차량은 10조 달러 규모의 교통 관련 산업의 지형을 완전히 뒤바꿀 것이며, 의료 분야에서도 의사들이 AI를 활용해 조기에 질병을 발견하고, 인간 유전자를 이해해 암을 치료하며, 대량의 의학 데이터를 연구해 최적의 치료법을 추천할 수 있게 됐죠. AI가 증기, 대량 생산, 자동화에 이어 4차 산업 혁명을 이루게 될 경우, 지능형 로봇이 생산성 향상에 커다란 혁신을 가져오며 본격적인 대규모 소비자 주문 제작 시대를 불러올 것입니다. 다시 말해 모든 산업과 일상에 혁명적인 변화를 가져올 AI의 시대의 도래는 이미 현실로 다가오고 있습니다.