GTC에서 공개된 차세대 인공지능 및 고성능 컴퓨팅의 미래 여는 볼타 GPU 플랫폼

by NVIDIA Korea

현지시간 5월 10일 미국 캘리포니아 산호세 컨벤션센터에서 진행되는 엔비디아 GPU 테크놀로지 컨퍼런스(GPU Technology Conference, 이하 GTC)의 기조연설에서 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 인공지능 및 고성능 컴퓨팅의 발전을 선도할 가장 강력한 GPU 컴퓨팅 아키텍처인 볼타(Volta™)를 발표했습니다.

본 기조연설에서는 볼타 기반의 최초의 프로세서인 엔비디아® 테슬라®(NVIDIA® Tesla®) V100 데이터센터 GPU도 함께 발표됐는데요. 테슬라 V100 데이터센터 GPU는 인공지능 추론 및 트레이닝에서 요구되는 뛰어난 속도와 확장성을 지원하며, 고성능 컴퓨팅 및 그래픽 워크로드를 가속화합니다.

11111111
엔비디아 테슬라 V100 데이터센터 GPU

 

젠슨 황(Jensen Huang) CEO는 “인공지능은 인간 역사상 가장 위대한 기술 발전을 이끌고 있습니다”라고 이야기하며, “인공지능은 지능을 자동화하고 산업 혁명 후 유례 없는 새로운 사회적 진보를 가져올 것입니다”라고 말했습니다.

또한 “학습이 가능한 컴퓨터 소프트웨어를 구축하는 혁신적인 인공지능 접근법인 딥 러닝은 무한대의 프로세싱 파워를 요구합니다. 이러한 수요에 대응하기 위해 수천 명의 엔비디아 엔지니어들이 지난 3여년 간 볼타 개발에 매진해왔으며, 삶을 변화시키는 인공지능의 잠재력에 대한 업계의 인식을 제고시켜왔습니다”고 말했습니다.

엔비디아의 7세대 GPU 아키텍처인 볼타는 210억개 트랜지스터로 구축되었으며, CPU 100대와 같은 수준의 성능으로 딥 러닝을 구현합니다.

볼타의 테라플롭 피크 성능은 엔비디아의 현 세대 GPU 아키텍처인 파스칼®(Pascal®) 대비 5배, 2년 전 출시된 맥스웰®(Maxwell®) 아키텍처 대비 15배 향상됐습니다. 이는 무어의 법칙으로 예측된 수준을 4배 가량 넘어선 성능 개선입니다.

최근 인공지능 가속화에 대한 그 어느 때보다 큰 수요가 발생하고 있습니다. 개발자, 데이터 과학자, 연구진 등은 뉴럴 네트워크를 사용한 암 치료법을 개발하고, 자율주행 자동차로 도로 안전성을 강화하고, 보다 스마트한 고객 경험을 제공하는 등 각 분야에서 인공지능을 활용하고 있지요.

네트워크가 고도화됨에 따라, 데이터센터는 기하급수적으로 개선된 프로세싱 파워를 제공해야 합니다. 또한 자연어 가상 비서(VA), 맞춤화된 검색 및 추천 시스템 등 고도의 정확성을 갖춘 인공지능 기반 서비스의 신속한 도입을 위해 효율적인 확장성을 갖춰야 합니다.

볼타는 고성능 컴퓨팅 시스템에 새로운 통찰을 위한 연산 과학 및 데이터 과학에 뛰어난 플랫폼을 제공하며, 고성능 컴퓨팅을 위한 새로운 기준을 제시할 전망입니다. CUDA® 코어와 새로운 볼타 텐서 코어(Volta Tensor Core)를 통합 아키텍처에 결합시킴으로써, 테슬라 V100 GPU를 탑재한 1대의 서버는 기존 고성능 컴퓨팅에 필요한 수백 개의 일반 CPU를 대체할 수 있습니다.

 

첨단 기술

테슬라 V100 GPU는 100 테라플롭 장벽을 허무는 첨단 기술로, 엔비디아의 이전 세대 GPU을 뛰어넘는 딥 러닝 성능을 제공합니다. 자세한 내용은 다음과 같습니다.

 

  • 텐서 코어(Tensor Core)

인공지능 워크로드를 가속화기 위해 고안됐습니다. 640개의 텐서 코어를 장착한 V100는 CPU 100개의 성능에 준하는 120 테라플롭 딥 러닝 성능을 구현합니다.

  • 새로운 GPU 아키텍처

210억개 이상의 트랜지스터로 구성됐으며, CUDA 코어와 텐서 코어를 통합 아키텍처에 결합해 단일 GPU로 인공지능 슈퍼컴퓨터 급의 성능을 구현합니다.

  • NVLink™

CPU와 GPU, 또는 GPU 간의 초고속 연결을 지원하는 차세대 인터커넥트로, 이전 세대 NVLink 대비 최대 2배 가량의 성능을 제공합니다.

  • 900 GB/sec HBM2 DRAM

삼성과 협력을 통해 개발되었으며 이전 세대 GPU에 비해 50% 향상된 메모리 대역폭을 제공합니다. 볼타의 탁월한 연산 처리량을 지원하기 위해 필수적입니다.

  • 볼타 최적화 소프트웨어

CUDA, cuDNN, 텐서RT™(TensorRT™) 등 볼타에 최적화 된 소프트웨어는 선도적인 프레임워크와 애플리케이션에 쉽게 도입되어 인공지능 및 연구를 가속화 시킬 수 있습니다.

 

생태계의 다양한 볼타 지원

볼타는 다음과 같은 세계적인 선도적인 기업 및 단체를 포함한 산업 전반에서 폭넓게 지원되고 있습니다.

이에 따라 각 글로벌 기업들의 주요 인사들로부터 볼타의 성능 및 활용 방안에 대한 기대감을 들어볼 수 있었습니다.

 

매트 가먼(Matt Garman), 아마존 웹 서비스, 컴퓨트 서비스 부사장은 “엔비디아와 아마존 웹 서비스(Amazon Web Service)는 고객들이 연산집약적 인공지능 워크로드를 클라우드 상에서 구현할 수 있도록 오랫동안 협력해왔습니다.” 라고 이야기하며, “아마존 웹 서비스는 지난 2010년에 최초로 GPU에 최적화된 클라우드 인스턴스(instance)를 출시한 바 있으며, 지난 해 가장 강력한 클라우드 GPU 인스턴스를 도입한 바 있습니다. 아마존 웹 서비스는 현재 혁신성과 창의성으로 손꼽히는 수많은 인공지능 애플리케이션의 출발점으로, 볼타가 올해 출시되면 고객들이 아마존 웹 서비스의 차세대 범용 GPU 인스턴스 제품군를 통해 놀라운 성능의 새로운 애플리케이션을 계속해서 구축할 수 있기를 바랍니다. ”라고 말했습니다.

야친 장(Ya-Qin Zhang) 바이두 사장은 “엔비디아의 볼타 출시를 매우 축하합니다. 바이두(Baidu)는 바이두 클라우드(Baidu Cloud)부터 인텔리전트 드라이빙(Intelligent Driving)에 이르기까지 오픈 인공지능 플랫폼 구축을 위한 노력을 강화해왔습니다. 엔비디아와 함께, 바이두는 글로벌 인공지능 기술 개발 및 적용을 가속화하고 사회 전반에 걸쳐 더 많은 기회를 창출하고자 합니다.” 라고 전했습니다.

마이크 슈로퍼(Mike Schroepfer) 페이스북 최고 기술 책임자(CTO)는 “페이스북은 엔비디아와의 놀라운 협력을 진행해 왔으며, 페이스북의 카페2(Caffe2)와 파이토치(PyTorch)에 대한 엔비디아의 기여를 높이 평가하고 있습니다. 엔비디아의 새로운 고성능 볼타 그래픽 아키텍처가 가져올 인공지능 발전에 큰 기대를 걸고 있습니다” 라고 말했습니다.

브래드 칼더(Brad Calder), 구글 클라우드 플랫폼 엔지니어링 부사장은 “엔비디아의 GPU는 구글 클라우드 플랫폼(Google Cloud Platform) 고객들에게 상당한 성능 개선을 제공하고 있습니다. GPU는 구글의 인프라에서 중요한 부분이며 구글과 엔터프라이즈 고객들이 머신 러닝, 고성능 컴퓨팅, 데이터 분석에서 필요로 하는 확대된 계산 능력을 지원합니다. 볼타의 성능 개선은 더욱 강력한 GPU를 가져올 것이며, 구글 클라우드 플랫폼에 볼타 GPU를 채택할 계획입니다.”라고 전했습니다.

해리 셤(Harry Shum), 마이크로소프트 AI 및 리서치 그룹 수석 부사장 은 “마이크로소프트와 엔비디아는 마이크로소프트 애저(Azure) N-시리즈, 프로젝트 올림푸스(Project Olympus), 인지 툴킷(Cognitive Toolkit) 등 인공지능 기술 개발을 위해 수년 동안 협력해왔습니다. 새로운 볼타 아키텍처는 마이크로소프트 고객을 위해 새롭고 뛰어난 역량을 구현할 수 있을 것입니다.” 라고 말했습니다.

제프 니콜스(Jeff Nichols) 오크 리지 국립연구소, 컴퓨팅 및 계산 과학부 연구소 부소장은 “오크 리지 국립연구소(Oak Ridge National Laboratory)는 올해 여름, 선도적 차세대 컴퓨팅 시스템인 서밋(Summit)을 구축할 예정입니다, 서밋은 볼타 GPU로 구동되며 개발이 완료되는 2018년에는 미국 최고의 과학 연구용 수퍼 컴퓨터로 등극할 것입니다. 서밋은 미국이 과학 연구 선도주자로서의 지위를 지키고, 에너지부가 계산 과학과 인공지능 기반 연구를 통해 복잡다단한 과제를 해결할 수 있도록 지원할 것입니다.” 라고 말했습니다.

도슨 통(Dowson Tong) 텐센트 수석 부사장은 “위챗(wechat) 음성 기술, QQ와 Qzone의 사진/동영상 기술 등 텐센트의 수많은 제품과 텐센트 클라우드(Tencent Cloud) 기반 딥 러닝 플랫폼은 현재 상당부분 인공지능에 기반하고 있습니다. 볼타가 텐센트의 인공지능 개발자들에게 전례없는 컴퓨팅 파워를 제공하리라 기대하며, 텐센트 클라우드를 통해 고객들에게 이러한 역량을 전할 수 있게 되어 기쁩니다.”라고 밝혔습니다.

 

더욱 자세한 기술 설명은 여기를 클릭해서 확인하세요!