파스칼 기반 딥 러닝 플랫폼 ‘테슬라 P4, P40’ 발표 소식 ​

by NVIDIA Korea

파스칼 기반 딥 러닝 플랫폼 ‘테슬라 P4, P40’ 발표 소식

오늘 중국 베이징에서 열리는 GPU 기술 컨퍼런스 ‘GTC China 2016’ 현장에서 전해온 소식! 파스칼(Pascal) GPU 아키텍처 기반의 딥 러닝 플랫폼인 테슬라(Tesla) P4, P40 가속기와 함께 인공지능 추론 작업을 가속화하는 새로운 소프트웨어 텐서RT(TensorRT)와 딥스트림(DeepStream) SDK가 공개되었는데요, 지금부터 그 자세한 내용을 함께 알아볼까요?

인공지능 추론에 특화된 테슬라 P4, P40 GPU

테슬라 P4와 P40은 엔비디아의 최신 GPU 아키텍처인 파스칼을 기반으로 음성, 이미지 또는 텍스트를 인식하기 위해 훈련된 심층 신경망을 구동하는데요, 특히 8비트(INT8) 기반의 특수 추론 명령을 사용해 CPU 대비 45배(1), 지난 1년 내 출시된 GPU 솔루션 대비 4배(2) 더 빠른 속도로 추론 작업을 실행하는 등 인공지능 추론에 특화된 성능을 제공한답니다!

 사양 

 테슬라 P4 

 테슬라 P40

 단정밀도 FLOPS(부스트 클럭 적용 시)

 5.5

 12

 INT8

 TOPS 22

 47

 CUDA 코어

 2,560

  3,840

 GPU GDDR5 메모리

  8GB

 24GB

 메모리 대역폭

  192GB/s

 346GB/s

 전력 소모

 50 Watt (또는 그 이상)

 250 Watt

– 테슬라 P4, P40 세부사양 –

테슬라 P4는 작은 사이즈의 폼팩터와 50W(와트)의 저전력 디자인으로 최고 수준의 에너지 효율을 필요로 하는 데이터 센터에 적합합니다. CPU 기반의 추론 작업과 비교했을 때 40배(3) 더 뛰어난 수준의 에너지 효율을 제공한다고 볼 수 있죠. 가령 하나의 테슬라 P4은 영상 추론 작업에서 13대의 CPU 단일 서버를 대체(4)할 수 있기 때문에 서버 구입 및 전력 비용을 모두 포괄하는 총소유비용(TCO)에 있어 8배 이상의 절감 효과를 기대할 수 있답니다.

이처럼 테슬라 P4가 에너지 효율에 특화됐다면, 테슬라 P40은 달리 최고 수준의 딥 러닝 작업 처리 성능을 제공하는데 주력하는 제품입니다. 8개의 테슬라 P40 가속기를 탑재한 서버는 44 TOPS INT8(새로운 딥 러닝 추론 명령어)의 성능을 갖추게 되며, 140대 이상의 CPU 기반 서버를 대체(5) 가능하다. 서버당 가격을 5,000 달러(한화 약 550만 원)로 가정할 경우, 서버 구입에서만 650,000 달러(한화 약 7억 2천만 원) 이상의 비용 절감 효과를 볼 수 있는 것이죠.

그리고 가장 궁금해하실 출시 정보! 엔비디아 테슬라 P4와 P40은 각각 11월과 10월에, ODM, OEM 및 공식 파트너사의 공인된 서버에 탑재돼 출시될 예정입니다. ^^

추론 가속 소프트웨어, 텐서RT, 딥스트림 SDK

또한 테슬라 P4, P40과 연계하여 인공지능 추론을 가속화하는 혁신적인 소프트웨어인 텐서RT와 딥스트림 SDK도 함께 공개했는데요!

복잡한 딥 러닝 네트워크에 즉각적인 응답성을 제공하는 텐서RT는 생산 배치용 딥 러닝 모델에 최적화된 소프트웨어 라이브러리입니다. 32비트 또는 16비트를 기반으로 훈련된 신경망을 정밀 INT8 연산에 최적화하여 딥 러닝 애플리케이션의 처리량과 효율을 극대화했죠

딥스트림 SDK는 파스칼 기반 서버의 성능을 통해 사용자에게 93개의 HD 동영상 스트림을 동시에 실시간 디코딩 및 분석할 수 있는 환경을 제공합니다. 이는 동일한 조건에서 7개의 HD 동영상 스트림을 처리 가능한 듀얼 CPU 서버(6)와 비교했을 때 비약적으로 개선된 수준이죠.

딥스트림 SDK의 등장은 대량의 영상 콘텐츠를 분석하고 이해해야 하는 자율주행, 로봇, 광고 마케팅 등 다양한 분야에서 인공지능 기술이 효과적으로 활용되는데 기여할 것으로 기대를 모으고 있습니다. 또한 기업은 딥 러닝 기술을 동영상 애플리케이션에 통합 적용함으로써, 이전까지는 불가능했던 혁신적인 서비스를 제공할 수 있게 되었답니다!

엔비디아의 하드웨어/소프트웨어 기술력을 통해 갈수록 가속화되어 가는 인공지능 시스템. 과연 그 한계는 어디까지일지, 앞으로 들려오는 소식에도 계속해서 귀 기울여 주시길 부탁 드릴게요! ^^