엔비디아 T4 GPU, AWS AI 서비스 성능 높였다

아마존웹서비스(Amazon Web Services, AWS)의 아마존 EC2 G4 인스턴스가 엔비디아 T4 텐서 코어(Tensor Core) GPU를 통해 하이퍼스케일 인공지능(AI) 인퍼런스(inference), 클라우드 게이밍, 최신 RTX 그래픽을 가속화합니다. 엔비디아 T4 텐서 코어 GPU를 장착한 아마존 EC2 G4 인스턴스는 현재 북미, 유럽 및 아시아지역에서 이용 가능합니다.

광범위한 소프트웨어 스택을 지원하는 엔비디아 T4 GPU는 아마존 EC2 G4 인스턴스 사용자에 높은 성능, 효율성, 그리고 다양한 기능을 제공합니다.

해당 소프트웨어 플랫폼은 딥 러닝을 위한 엔비디아 cuDNN, 데이터 분석과 머신 러닝을 위한 엔비디아 래피즈(RAPIDS), 클라우드 워크스테이션 그래픽을 위한 엔비디아 쿼드로 가상 워크스테이션(Quadro Virtual Workstation), 클라우드 게이밍을 위한 엔비디아 지포스(GeForce)를 포함한 다양한 애플리케이션에 최적화돼 있습니다.

또한 소프트웨어 스택에는 다양한 API, 쿠다(CUDA), 그리고 텐서RT(TensorRT), NCCL, 옵틱스(OptiX), 비디오 코덱 SDK와 같은 도메인별로 특화된 쿠다-X 라이브러리가 포함됩니다. 사용자는 단일 인스턴스를 활용해 여러 유형의 워크로드를 원활하고 비용 효율적으로 가속화할 수 있죠.

AWS 컴퓨트 서비스 담당 부사장 매트 가먼(Matt Garman)은 “우리는 고객들이 컴퓨트 집약적인 애플리케이션의 이점을 누릴 수 있도록 하는데 집중하고 있습니다. AWS는 다양한 머신 러닝 사용 사례에 최적화된 아마존 EC2의 다양한 인스턴스 유형을 기반으로 머신 러닝 모델을 개발, 훈련, 구축할 수 있는 가장 포괄적인 포트폴리오를 제공합니다. T4 GPU로 구동되는 새로운 G4 인스턴스를 통해 모든 개발자들이 머신 러닝을 보다 합리적인 비용으로 활용할 수 있게 됐죠”라고 말했습니다.

더 많은 AI를 합리적으로 수행하다

엔비디아 T4는 2세대 텐서 코어 GPU로, 쿠다의 프로그래밍 성능을 유지하면서 AI 애플리케이션을 위한 최고의 성능을 지원하는 GPU로 재창조된 것입니다. INT8에서 최대 130 TOPS(초당 테라 연산)의 성능을 구현하는 엔비디아 T4는 이미지 분류, 객체 감지, 자연어 이해, 자동 음성 인식, 추천 시스템과 같은 AI 기반 애플리케이션의 끊임없는 혁신, 다양성과 복잡성을 가속화하는데 필요한 혼합 정밀 텐서 프로세싱 기능을 갖췄습니다.

AWS는 업계에서 가장 빠른 하이퍼스케일 클라우드 플랫폼 중 하나로, 훈련과 인퍼런스를 위해 즉시 사용가능한 엔비디아 NGC 컨테이너를 지원해 엔비디아 GPU를 프로비저닝 합니다. EC2 P3 인스턴스에는 엔비디아 V100 텐서 코어 GPU가 탑재돼 있어 고객들은 AMP(Automatic Mixed Precision) 기능을 사용해 며칠이 걸리던 머신 러닝 훈련 기간을 단 몇 시간으로 단축시킬 수 있습니다. 또한, EC2 G4를 통해 고객들은 AI 서비스를 대규모로 구축하면서 운영비용은 크게 절감할 수 있죠.

뿐만 아니라, 최근 발표된 VM웨어(Vmware)와의 파트너십을 통해, VM웨어 클라우드 온 AWS(VMware Cloud on AWS)의 사용자들은 엔비디아 T4 GPU와 최신 엔비디아 버추얼 컴퓨트 서버(NVIDIA Virtual Compute Server, v컴퓨트서버) 소프트웨어로 가속화될 아마존 EC2 베어 메탈(bare metal) 인스턴스로 구성된 확정성이 뛰어나며 안전한 클라우드 서비스를 이용할 수 있게 됩니다.

기업들은 이러한 엔터프라이즈급 하이브리드 클라우드 플랫폼을 사용해 애플리케이션의 현대화를 가속화할 수 있습니다. 또한, 데이터 센터에서 AWS 클라우드에 이르는 VM웨어 인프라 전반에서 구축, 마이그레이션,운영을 통합해 AI, 머신 러닝, 데이터 분석을 포함한 가장 컴퓨트 집약적인 워크로드를 지원할 수 있죠.

실시간 레이 트레이싱과 AI가 강화된 그래픽

디자이너와 아티스트들은 사실적인 실시간 렌더링,AI가 강화된 그래픽, 영상과 이미지 프로세싱을 통해 새로운 방식으로 콘텐츠를 제작할 수 있습니다.

엔비디아 T4는 클라우드에서 구동되는 최초의 엔비디아 RTX 레이 트레이싱 GPU입니다. T4 GPU는 탁월한 효율성으로 레이 트레이싱 작업을 수행하는 전용 컴퓨트 리소스인 RT 코어를 제공해 과거에는 많은 비용이 들었던 레이 트레이싱 작업비용을 줄여주죠.

엔비디아 쿼드로 vWS(Quadro Virtual Workstation, Quadro vWS) AMI(Amazon Machine Image)와 결합된 새로운 G4 인스턴스는 마이크로소프트(Microsoft) DXR, 엔비디아 옵틱스, 벌칸(Vulkan)을 포함한 최신 레이 트레이싱 API를 지원합니다. 미디어,엔터테인먼트, 아키텍처, 제조, 석유, 가스와 같은 산업 분야의 기술 및 크리에이티브 전문가는 AWS 클라우드에서 최신 그래픽 소프트웨어 애플리케이션을 실행할 수 있습니다.

AWS로 가상 워크스테이션을 구축하는 작업은 쉽고 빠르며 5분도 채 소요되지 않습니다. AWS 마켓플레이스(Marketplace)에서 윈도우 서버 2016과 윈도우 서버 2019에서 제공되는 엔비디아 쿼드로 vWS 머신 이미지와 G4 인스턴스를 선택할 수 있죠.

GPU 기반 클라우드 게이밍

T4를 구동하는 튜링 아키텍처는 엔비디아의 게이밍 기술을 AWS와 결합해줍니다. 이를 통해, 비디오 코텍 SDK로 프로그래밍할 수 있는 GPU의 하드웨어 인코더 엔진을 사용해 가장 까다로운 게임을 렌더링하고 스트리밍할 수 있습니다.

게임 퍼블리셔는 최신 엔비디아 기술을 기반으로 자체 클라우드 게이밍 인스턴스를 구축하고, 게이머들이 거의 모든 디바이스에서 PC 타이틀의 전체 카탈로그를 이용할 수 있게 합니다. 게이머는 하드웨어 업그레이드나 드라이버 혹은 게임 패치를 업데이트할 필요 없이 고해상도에서 빠르고 유연한 프레임 속도로 모든 최신 게임을 즐길 수 있습니다. 이 기능을 지원하는 엔비디아 드라이버는 AWS 마켓플레이스에서 이용 가능하며, 윈도우 서버 2016, 윈도우 서버 2019, 리눅스 OS에서 제공되는 AWS G4 인스턴스에서 실행됩니다.

AWS EC2 G4 인스턴스 알아보기

아마존 EC2 G4 인스턴스를 사용하는 초기 고객 중 하나인 클라리파이(Clarifai), 일렉트로닉 아츠(Electronic Arts), 검검(GumGum) 퍼웹(PurWeb)은 광범위한 컴퓨트 집약적인 워크로드를 대규모로 실행하기 위해 엔비디아 T4의 유연성과 성능을 활용하고 있습니다. 그 결과, 강력한 서비스를 제공하는 동시에, 고객들이 해당 서비스를 구축하고 배포하는 데 드는 비용을 감소시켜 주고 있습니다.

향후 몇 주 안에 G4 인스턴스는 아마존 EC2 혹은 아마존 세이지메이커(Amazon SageMaker) 인스턴스에 GPU 가속을 추가할 수 있는 아마존 엘라스틱 인퍼런스(Amazon Elastic Inference)를 지원할 예정입니다. 이에, 고객은 더욱 빠른 인퍼런스를 사용하면서 최대 75% 비용 절감 혜택을 누릴 수 있죠.

엔비디아 T4에 대한 더 자세한 내용은 AWS G4 인스턴스 페이지에서 확인하세요.