아마존웹서비스(Amazon Web Services, AWS)는 엔비디아 T4 텐서 코어 GPU(NVIDIA T4 Tensor Core GPUs)를 탑재한 새로운 아마존 Elastic Computing Cloud(EC2) G4 인스턴스를 곧 출시할 것이라고 발표했습니다.
새로운 G4 인스턴스는 AWS 고객에 다양한 AI 서비스를 비용 효율적으로 배포할 수 있는 만능 플랫폼을 제공합니다. 고객은 AWS 마켓플레이스를 통해 딥 러닝과 머신 러닝, 데이터 분석 가속화를 위한 엔비디아 쿠다-X AI 라이브러리와 엔비디아 GPU 가속 소프트웨어를 G4 인스턴스와 페어링 할 수 있습니다.
또한 T4는 Amazon Elastic Container Service for Kubernetes 에서 지원되기 때문에 고객들은 쿠버네티스를 사용해 EC2 G4 GPU 인스턴스에서 컨테이너화된 애플리케이션을 쉽게 배포하고 관리하며 확장할 수도 있답니다.
T4 GPU는 AI 추론에 상당히 효율적이라 머신 러닝 모델을 생산에 적용할 강력하면서도 비용 효율적인 클라우드 솔루션을 찾는 기업에게 딱 맞는 제품입니다.
새로운 EC2 G4 인스턴스는 크리에이터와 기술 전문가의 워크플로우를 가속화 하기 위해 차세대 컴퓨터 그래픽도 지원합니다. 엔비디아 튜링(Turing) 아키텍처는 실시간 레이 트레이싱과 AI, 시뮬레이션, 래스터화(rasterization)를 통합해 컴퓨터 그래픽을 근본적으로 변화시킵니다.
매트 가먼(Matt Garman) AWS 컴퓨트 서비스 부사장은 “엔비디아와 AWS는 고객이 클라우드에서 컴퓨팅 집약적인 AI 워크로드를 실행하고 새롭고 획기적인 AI 솔루션을 제작할 수 있도록 지원하기 위해 오랜 기간 협력해 왔습니다. 새로이 출시하는 T4 기반 G4 인스턴스로 고객이 머신 러닝 추론과 그래픽 집약적인 애플리케이션 가속화를 더욱 쉽고 비용 효율적인 방식으로 할 수 있는 길을 마련했습니다”라고 말했습니다.
T4는 엔비디아 GPU를 탑재한 다른 아마존 EC2 인스턴스에도 적용될 예정이며, 이를 통해 개발자와 데이터 사이언티스트가 다양한 소비자 요구사항을 지원할 수 있는 정교한 컴퓨팅 리소스를 제공하고자 합니다.
T4 프리뷰 등록은 여기에서 할 수 있습니다.