GPU: 인공지능의 발전을 가속화하는 새로운 컴퓨팅 모델
엔비디아의 CEO 겸 공동창립자인 젠슨 황(Jensen Huang)은 최근 ‘인공지능의 미래’를 주제로 하는 뉴욕대학교의 창립 기념 심포지엄에 참석했습니다. 인공지능 기술의 현황과 지속적인 발전을 논의하기 위해 관련 분야의 지도자들이 참석하는 자리였는데요,
젠슨 황 CEO는 다음과 같은 주제로 발표를 진행했습니다.
- 딥 러닝: 새로운 컴퓨팅 모델을 위한 새로운 소프트웨어 모델
- 인공지능 연구자들은 왜 GPU 가속 컴퓨팅을 도입하는가
- 인공지능의 대중화와 발전을 위해 지속적인 노력을 기울이는 엔비디아
그럼 지금부터 젠슨 황 CEO가 각 주제별로 어떤 내용을 청중들과 공유했는지 알아보도록 하겠습니다.
빅뱅과 같은 새로운 인공지능의 등장
인간이 컴퓨터를 발명하고 발전시켜오는 과정에서, 인공지능은 언제나 그 최종 목적지라 할 수 있었는데요, 인간과 유사한 방식으로 세상 사물들을 인식하고, 언어를 이해하며, 사례를 통해 학습하는 지능형 시스템을 구축하는 것은 지난 50년 동안 모든 컴퓨터 과학자들의 최대 목표였습니다.
인공지능은 얀 레쿤(Yann LeCun) 뉴욕대 교수의 나선형 뉴럴 네트워크와 지오프 힌튼(Geoff Hinton)의 역전파(back-propagation), 학습 및 훈련을 위한 확률 기울기 하강(Stochastic Gradient Descent) 접근, 그리고 앤드류 응(Andrew Ng)이 제창한 딥 뉴럴 네트워크(DNNs)를 가속하기 위한 대대적인 규모의 GPU 사용 등의 조합을 필요로 합니다. 이 모든 것은 현대 인공지능의 빅뱅이라 할 수 있는 딥 러닝의 발전에 기폭제가 되었죠.
당시 엔비디아는 애플리케이션을 가속화하기 위해 대규모 병렬 그래픽 프로세서를 사용하는 새로운 컴퓨팅 모델인 GPU 가속 컴퓨팅의 발전에 몰두하고 있었습니다. 과학자 및 연구자들은 약물의 효과를 확인하는 분자 규모의 시뮬레이션을 수행하고, 몸 속 장기를 CT 스캔의 빛 노출량에 따라 재구성된 3D로 시각화하며, 우주를 지배하는 법칙을 발견하기 위한 은하 규모의 시뮬레이션을 실행하기 위해 GPU에 빠져들기 시작했습니다. 양자 크로모 역학 시뮬레이션에 엔비디아 GPU를 사용하는 한 연구자는 “엔비디아의 기술 덕택에 인생의 역작을 일생 안에 진행할 수 있었다”며 감사를 표하기도 했다고 합니다. 엔비디아는 언제나 사람들에게 더 나은 미래를 만들 수 있는 힘을 제공하는 것을 목표로 삼아왔습니다. 이러한 엔비디아의 GPU는 슈퍼컴퓨터를 보다 대중화시켰고, 연구자들은 누구나 그 성능을 체감할 수 있게 되었습니다.
인공지능 연구자들은 2011년부터 엔비디아의 GPU를 사용해왔습니다. 구글 브레인(Brain) 프로젝트는 유튜브 영상을 통해 고양이와 사람을 구별하는 방법을 학습하는 놀라운 결과를 달성했지만, 이를 위해서는 2,000개의 CPU를 탑재한 거대한 구글 데이터 센터의 서버들이 필요했습니다. 전 세계적으로도 극소수의 컴퓨터만이 이러한 규모로 제작될 수 있죠. 하지만 엔비디아의 GPU 기술이라면 이야기가 달라집니다. 엔비디아 리서치의 브라이언 카탄자로(Bryan Catanzaro) 팀은 스탠포트 대학의 앤드류 응(Andrew Ng) 연구팀과 함께 GPU를 딥 러닝에 활용하기 위한 연구를 진행했습니다. 이를 통해 엔비디아는 12개의 엔비디아 GPU가 무려 2,000개의 CPU에 맞먹는 딥 러닝 성능을 발휘하는 것을 확인할 수 있었습니다. 현재 뉴욕대학교, 토론토대학교, 스위스 인공지능 연구소 등이 딥 뉴럴 네트워크를 GPU로 가속화하고 있습니다.
딥 러닝, 기적에 가까운 성능을 보여주다
토론토대학의 알렉스 크리제브스키(Alex Krizhevsky)는 2012년 이미지넷(ImageNet) 경진대회에서 우승을 차지했습니다. 컴퓨터 비전 코드를 전혀 사용하지 않았음에도 불구하고 그는 전문가가 직접 제작한 소프트웨어를 상대로 큰 격차로 승리했습니다. 그 비결은 딥 러닝을 활용해 자체적으로 이미지를 인식하도록 그들의 컴퓨터를 학습시켰던 것에 있었습니다.
그들은 AlexNet이라 불리는 신경 네트워크를 설계한 뒤, 수 조에 달하는 수학 연산을 엔비디아 GPU를 통해 처리하며 수많은 샘플 이미지들로 이를 훈련시켰고, 마침내 인간이 직접 코딩한 최고의 소프트웨어까지 간단히 제칠 수 있었습니다.
뿐만 아니라 구글과 마이크로소프트 모두 딥 러닝을 활용하여 이미지넷에 참가했으며, 인간에 의해 달성된 최고 기록을 경신한 바 있습니다. 얼마 후 마이크로소프트와 중국과학기술대학은 대학원생 수준의 IQ 테스트 점수를 달성한 DNN(딥 뉴럴 네트워크)을 발표했으며, 바이두는 하나의 알고리즘으로 영어와 중국어를 모두 학습하는 ‘딥스피치(Deep Speech) 2’라 불리는 딥 러닝 시스템을 발표하기도 했습니다. 그래서 이미지넷 2015의 우승은 모두 GPU 가속화된 딥 뉴럴 네트워크를 기반으로하며, 인간 수준의 정확성을 훨씬 뛰어넘는 딥 러닝 시스템을 채택하고 있었습니다.
딥 러닝은 2012년 이미 인간이 코딩한 소프트웨어를 앞질렀고, 2015년에는 ‘초인적인’ 수준의 지각 능력을 달성했다 할 수 있습니다.
새로운 소프트웨어 모델을 위한 새로운 컴퓨팅 모델
컴퓨터 프로그램은 순차적으로 실행되는 명령들을 포함하고 있습니다. 딥 러닝은 수십 억 개의 소프트웨어 뉴런과 수조 개의 커넥션이 병렬로 훈련되는, 근본적으로 새로운 소프트웨어 모델입니다. DNN 알고리즘을 실행하고 그 사례를 통해 학습하는 것으로, 이 컴퓨터는 기본적으로 자신의 소프트웨어를 직접 만들어 나간다고 볼 수 있습니다. 근본적으로 다른 소프트웨어 모델을 효율적으로 실행하기 위해서는 새로운 컴퓨터 플랫폼을 필요로 한데요, dlboost-3-webAccelerated 컴퓨팅과 GPU는 이를 위한 이상적인 접근이자, 프로세서입니다. 네이처(Nature)지가 최근 언급한 바와 같이, 딥 러닝이 지금과 같이 발전할 수 있었던 계기는 딥 러닝 프로그램에 적합한 것은 물론, 연구자들이 10~20배 빠르게 네트워크를 훈련할 수 있는 환경을 만든 ‘빠른 그래픽 처리 장치의 출현’ 즉 GPU 덕택이였습니다. 이 새로운 컴퓨팅 플랫폼을 형성하기 위한 필수적 요인들에는 성능, 프로그래밍 용이성, 그리고 접근성이 있습니다.
- 성능
엔비디아의 GPU는 태생적으로 병렬 작업에 최적화 되었기 때문에, DNN 속도를 10~20배 향상시키는 동시에 대량으로 반복되는 훈련 일정을 각각 주 단위에서 일 단위로 감소시킵니다. 비단 거기서 그치진 않습니다. 엔비디아는 인공지능 개발자들과의 협력을 통해 GPU 디자인, 시스템 아키텍처, 컴파일러, 알고리즘을 계속해서 향상시켰으며, 그 결과 3년 만에 딥 뉴럴 네트워크의 훈련 속도를 50배까지 끌어올렸습니다. 이는 무어의 법칙보다 훨씬 빠른 속도로, 향후 몇 년 안에 또 다시 10배가 향상될 것을 기대하고 있죠.
- 프로그램 용이성
인공지능은 현재 맹렬한 속도로 혁신 중에 있습니다. 때문에 각 프로그래밍의 용이성과 개발 생산성은 매우 중요합니다. 엔비디아 CUDA 플랫폼의 프로그래밍 용이성과 풍성함은 새로운 구성의 CNN, DNN, 딥 인셉션 네트워크, RNN, LSTM을 구축하고, 학습 네트워크를 강화함으로써 연구자들이 신속하게 혁신할 수 있도록 지원합니다.
- 접근성
개발자는 어디서나 개발을 진행하고, 또한 이를 어디든지 배포하고 싶어합니다. 엔비디아 GPU는 데스크톱, 노트북, 서버, 슈퍼컴퓨터를 포함하는 모든 PC OEM과 아마존, IBM, 마이크로소프트 등 클라우드에서 전세계적으로 사용할 수 있습니다. ICT 기업에서 연구기관, 스타트업에 이르기까지 모든 주요 인공지능 개발 프레임워크는 엔비디아의 GPU에 의해 가속화됩니다. AI 개발 시스템의 종류와 상관 없이, 모두 GPU 가속화에 의해 속도가 향상됩니다.
또한 엔비디아는 DNN이 어떤 종류의 지능형 시스템이든지 지원할 수 있도록 모든 컴퓨팅 폼팩터를 위한 GPU를 개발했습니다. 지포스(GeForce)는 PC를 위한, 테슬라(Tesla)는 클라우드 및 슈퍼컴퓨터를 위한 제품입니다. 젯슨(Jetson)은 로봇과 드론에 특화되어 있으며, 드라이브(DRIVE) PX는 자동차를 위해 제작되었습니다. 이 모든 것은 동일한 아키텍처를 공유하고, 딥 러닝을 가속화합니다.
모든 산업은 인공지능을 원한다
바이두, 구글, 페이스북, 마이크로소프트는 딥 러닝을 위해 엔비디아 GPU를 채택한 최초의 기업들입니다. 이러한 인공지능 기술은 당신의 말에 반응하고, 다른 언어로 음성 또는 텍스트를 번역하며, 이미지를 자동으로 인식하고 태그하는 것뿐 아니라 우리 각자의 관심사에 맞춰 뉴스피드, 엔터테인먼트, 맞춤형 제품 등을 추천합니다. 스타트업과 신생기업들은 이제 새로운 제품과 서비스를 만들고 개선하기 위해 경쟁적으로 인공지능을 활용하고 있습니다. 엔비디아와 딥 러닝을 위해 협력하는 기업의 숫자는 2년 전에 비해 무려 35배가 많아진 3,400여 곳에 달합니다.
또한 인공지능은 헬스케어, 생명과학, 에너지, 금융서비스, 자동차, 제조, 엔터테인먼트 등 다양한 산업에서 업계 데이터를 통해 통찰력을 얻는데 유용하게 활용될 것입니다. 그리고 페이스북, 구글, 마이크로소프트에서 모든 이가 사용할 수 있는 딥 러닝 플랫폼을 공개하면서 AI 구동 애플리케이션의 확산 또한 빨라질 것입니다. 이러한 추세에 비추어, 최근 IT전문매체 와이어드(Wired)는 ‘GPU의 폭발적 성장’을 예견하기도 했습니다.
- 자율주행자동차
안전을 위해 초인적인 능력을 지닌 인공지능의 도움을 받거나, 개인 모빌리티 서비스에 혁명을 불러오거나, 도심 주차공간을 확대하는데 필요성을 절감한다면, 자율주행자동차는 놀라운 사회적 이익을 가져올 수 있는 충분한 잠재력을 지니고 있습니다. 그만큼 운전이란 복잡하고, 예기치 않은 일이 발생할 수도 있습니다. 가령 얼어붙은 비가 도로를 스키장으로 만들고, 목적지까지의 도로가 폐쇄되기도 하며, 아이가 차량 앞으로 뛰어들 때도 있습니다. 이처럼 운전 중 발생할 수 있는 모든 가능한 시나리오를 예상하여 소프트웨어에 미리 입력하는 건 불가능합니다. 이것이 바로 자율주행 기술에 있어 딥 러닝의 가치가 더욱 빛을 발하는 이유입니다. 딥 러닝은 스스로 학습하고, 적응하고, 발전할 수 있습니다. 엔비디아는 현재 ‘드라이브(DRIVE) PX’라 불리는, 자율주행자동차를 위한 트레이닝 시스템과 차량용 인공지능 컴퓨터의 역할을 겸하는 엔드투엔드 딥 러닝 플랫폼을 구축하고 있습니다. 이는 초인적인 능력의 운전 도우미 컴퓨터나 무인 셔틀과 같은 미래 기술이 더 이상 공상과학 소설 속 이야기가 아님을 뜻하는 흥미로운 결과라 할 수 있습니다.
- 로봇
선도적인 로봇 제조 기업 FANUC는 최근 상자에서 무작위로 꺼낸 물체를 ‘선택’할 수 있도록 학습하는 조립 공정용 로봇을 시연했습니다. GPU 기반 이 로봇은 수많은 시행 착오에 의해 학습하는 과정을 거치는데요, 이러한 딥 러닝 기술은 최근 월스트리트 저널의 표제 기사 ‘인공지능과 함께 기술강국으로 부활하는 일본’으로 소개된 바 있는 프리퍼드네트웍스(Preferred Networks)에 의해 개발되었습니다.
- 헬스케어 & 생명과학
심층 유전체학(Deep Genomics)은 질병으로 이어질 수 있는 유전자 변형 방식을 이해하기 위해 GPU 기반 딥 러닝을 적용하고 있습니다. Arterys사는 GPU 기반 딥 러닝을 사용하여 의료 영상의 분석 속도를 향상시키고, 그 기술은 심장 질환을 진단하는 데 도움을 주는 GE 헬스케어의 MRI 머신과 함께 배포됩니다. 또 다른 기업인 Enlitic사는 종양이나 잘 보이지 않는 미세 골절 및 기타 질환을 식별하는 의료 영상을 분석하는데 딥 러닝을 활용합니다.
이들은 단지 몇 가지 추려낸 사례에 불과하며, 인공지능 기술의 GPU 활용과 관련하여 말 그대로 수천 개의 사례가 존재한다고 할 수 있습니다.
GPU로 가속화하는 인공지능: 새로운 컴퓨팅 모델
딥 러닝은 인공지능 기술에 혁명적인 변화를 촉발했습니다. 인공지능 기반의 딥 뉴럴 네트워크에 의해 구동되는 시스템은 일반적인 코딩으로 해결할 수 없는 복잡한 문제들을 해결할 수 있습니다. 이들은 데이터로부터 학습하고, 이를 활용하여 발전합니다. DNN은 심지어 비전문 프로그래머들에 의해서도 새로운 과제를 해결하도록 훈련될 수 있습니다. 딥 러닝의 발전과 도입은 현재 기하급수적인 속도로 진행되고 있으며, 사회에 미치는 영향 역시나 막대할 것으로 예상되고 있습니다. KPMG의 최근 연구는 컴퓨터 기반의 운전자 지원 기술이 20년 이내 교통사고를 80 % 절감할 것으로 전망하고 있는데요,이는 마치 매년 백만 명의 생명을 구하는 것과 다름 없으며, 딥 러닝 기반의 인공지능 기술은 이를 위한 기반을 제공할 것입니다.
물론 컴퓨터 산업에 미치는 영향도 마찬가지 입니다. 딥 러닝은 근본적으로 새로운 소프트웨어 모델입니다. 때문에 이를 구동하기 위해 프로그래머가 코딩 한 명령뿐만 아니라 딥 러닝 네트워크의 대규모 병렬 훈련을 효율적으로 수행할 수 있는 아키텍처 등 새로운 컴퓨터 플랫폼이 필요합니다. 엔비디아는 GPU 가속 컴퓨팅이 이를 실현하는 가장 빠른 지름길이란 것을 확신하고 있습니다. 포퓰러 사이언스(Popular Science)지가 최근 GPU를 ‘현대 인공지능을 완성할 핵심 전력’이라 평가했듯이 말입니다.