최근 발표된 MLPerf 벤치마크 테스트에서 엔비디아의 텐서(Tensor) 코어 GPU가 6개 부문에 걸쳐 최고 성능을 기록했습니다!
MLPerf(머신 러닝 전문 벤치마크 테스트 기관)는 새로운 AI 벤치마크 스위트(Suite)로 엔비디아를 비롯해 구글, 인텔, 바이두 등 수 십여 개의 기술 선도업체들이 지원하며, 광범위한 딥 러닝 워크로드를 측정하는데요. MLPerf는 업계 최초의 포괄적인 AI 벤치마크 스위트를 목표로, 컴퓨터 비전, 언어 번역, 맞춤형 추천, 강화 학습 과제 등을 다룬답니다.
엔비디아는 제출한 6개의 MLPerf 벤치마크 결과에서 최고 성능을 달성했습니다. 여기에는 단일 노드의 16개의 GPU부터 80개 노드의 640개의 GPU에 이르는 다양한 워크로드와 인프라 규모가 포함됩니다.
엔비디아가 최고 성능을 기록한 6개 부문에는 이미지 분류, 객체 인스턴스 분류, 객체 탐지, 비 반복 번역, 반복 번역, 추천 시스템이 해당되는데요. 엔비디아는 강화 학습과 관련된 일곱 번째 부문의 결과는 제출하지 않았는데, 이는 GPU 가속을 최대한 활용하지 않았기 때문입니다. 특히, 엔비디아 기술이 두각을 나타낸 주요 벤치마크는 언어 번역으로, 단 6.2분 만에 트랜스포머(Transformer) 신경망을 훈련시켰습니다.
엔비디아 엔지니어들은 16개의 V100 텐서 코어 GPU를 장착한 업계에서 가장 강력한 AI 시스템인 엔비디아 DGX-2가 포함된 엔비디아 DGX 시스템으로 이 같은 성과를 달성했습니다. 엔비디아는 6개의 MLPerf 벤치마크를 기록한 유일한 업체로, 이번 결과를 통해 다양한 AI 워크로드를 위한 V100 텐서 코어 GPU의 활용성을 증명했답니다.
이안 벅(Ian Buck) 엔비디아 가속 컴퓨팅 담당 부사장겸 총괄은 “새로운 MLPerf 벤치마크를 통해 엔비디아 텐서 코어 GPU의 탁월한 성능과 활용성이 다시한번 입증됐다”며, “전세계 클라우드 서비스 제공업체와 컴퓨터 제조사들에게 합리적인 가격과 유용성을 제공하는 텐서 코어 GPU는 개발자들이 개발의 모든 단계에서 AI를 발전시키도록 돕고 있다”고 설명했습니다.
최첨단 AI 컴퓨팅에 요구되는 풀 스택 혁신
복잡하고 다양한 컴퓨팅 워크로드를 위한 성능에는 뛰어난 칩 이상의 것이 요구되는데요. 마찬가지로 가속 컴퓨팅은 단순한 가속기 이상의 것, 즉 풀 스택(full stack)을 필요로 한답니다. 엔비디아의 스택에는 엔비디아 텐서 코어, NV링크(NVLink), NV스위치(NVSwitch), DGX 시스템, 쿠다(CUDA), cnDNN, NCCL, 최적화된 딥 러닝 프레임워크 컨테이너와 엔비디아 소프트웨어 개발자 키트가 포함돼 있습니다.
엔비디아의 AI 플랫폼은 접근성이 높고 합리적인 가격으로 제공되는 것이 특징인데요. 텐서 코어 GPU는 주요 클라우드 서비스 제공업체와 컴퓨터 제조사, 그리고 모든 지역에서 이용 가능하며, 가장 강력한 데스크톱 GPU인 엔비디아 타이탄(TITAN) RTX가 장착된 데스크탑에서 동일하게 사용할 수 있답니다. 소프트웨어 가속 스택은 엔비디아 GPU 클라우드(NGC) 클라우드 레지스트리에서 상시 업데이트 됩니다.
모든 AI 개발자들도 사용 가능
엔비디아가 업계 최고의 MLPerf 벤치마크를 기록하는데 사용된 소프트웨어 혁신과 최적화는 엔비디아의 최신 NGC 딥 러닝 컨테이너에서 무료로 제공되며, NGC 컨테이너 레지스트리에서 다운로드 할 수 있습니다. 이 컨테이너에는 엔비디아가 최적화한 완벽한 소프트웨어 스택과 최고 수준의 AI 프레임워크가 포함돼 있습니다. 18.11 버전의 NGC 딥 러닝 컨테이너에는 엔비디아가 MLPerf 결과를 달성하는데 사용한 소프트웨어가 포함돼 있습니다.
개발자들은 이 소프트웨어를 개발의 모든 단계에 걸쳐 활용할 수 있는데요. 데이터 과학자들은 NGC 딥 러닝 컨테이너를 사용해 엔비디아 타이탄 RTX GPU로 최첨단 연구를 수행할 수 있습니다. 또한, 기업들은 이 컨테이너를 엔비디아 DGX 스테이션에서 실행할 수 있을 뿐 아니라, 알리바바 클라우드, 아마존웹서비스(AWS), 바이두 클라우드, 구글 클라우드 플랫폼, IBM 클라우드, 마이크로소프트 애저, 오라클 클라우드 인프라, 텐센트 클라우드 등에서 엔비디아 GPU 가속 인스턴스를 통해 클라우드 상의 데이터에 AI 적용을 가속화할 수 있답니다. 또한, 자체 AI 인프라를 구축하는 기업들은 아토스(Atos), 시스코(Cisco), 크레이(Cray), 델 EMC, HP, HPE, 인스퍼(Inspur), 레노버(Lenovo), 수곤(Sugon), 수퍼마이크로(Supermicro) 등에서 엔비디아 DGX 시스템과 NGC 지원 시스템을 통해 AI를 구현할 수 있습니다.
엔비디아가 벤치마크 테스트에서 최고 성능을 기록한 6개 부문에 대한 보다 자세한 사항은 엔비디아 개발자 뉴스 센터에서 확인할 수 있습니다.