마이크로소프트의 클라우드 플랫폼 ‘애저(Azure)’에 엔비디아 GPU 클라우드(NVIDIA GPU Cloud, NGC)가 지원됨에 따라, 이제 수천 명의 개발자, 데이터 과학자, 연구원들이 인공지능(AI)과 고성능컴퓨팅(HPC) 프로젝트를 클라우드에서 손쉽게 시작할 수 있게 됐습니다.
애저에서 지원되는 NGC의 즉시 실행 가능한 컨테이너를 통해 개발자는 소프트웨어 통합 및 테스트의 복잡성을 제거하는 동시에, 필요에 따라 확장 가능한 온디맨드 GPU 컴퓨팅에 엑세스할 수 있습니다.
AI 및 HPC 프로젝트를 보다 빠르게 실행 가능
텐서플로우(TensorFlow), 마이크로소프트 코그니티브 툴킷(Microsoft Cognitive Toolkit), 파이토치(PyTorch), 엔비디아 텐서RT(NVIDIA TensorRT)와 같이 널리 사용되는 딥러닝 소프트웨어를 실행하기 위해 신뢰할 수 있는 소프트웨어 스택을 구축하고 테스트하는 것은 까다로울 뿐만 아니라 시간이 많이 걸리는 작업입니다. 또한, 운영체제(OS) 레벨과 드라이버, 라이브러리 및 런타임에 종속성을 가지며, 많은 패키지는 서로 다른 버전의 지원 구성요소를 권장합니다.
더불어, 프레임워크와 애플리케이션은 자주 업데이트되므로 새 버전이 출시될 때마다 이 작업을 반복해야 합니다. 이상적인 것은 새로운 버전을 테스트하여 이전 버전과 동일하거나 더 나은 성능을 제공하는지 확인하는 것인데요, 이러한 일련의 과정은 모두 프로젝트를 시작하기 전에 이루어져야 합니다.
HPC의 경우, 어떻게 시스템 클러스터에 최신 소프트웨어를 배포하는 지가 어려운 부분입니다. 정확한 종속성을 찾고 설치하고 테스트하는 것은 물론, 이 작업을 멀티테넌트(multi-tenant) 환경에서 여러 시스템에 걸쳐 수행해야 합니다.
NGC는 GPU 가속 소프트웨어로 사전 구성된 컨테이너를 제공함으로써 이러한 복잡성을 제거해줍니다. 엔비디아의 지속적인 연구개발(R&D) 투자로, 딥러닝 컨테이너는 컨테이너가 최신 GPU 기능을 활용하도록 지원합니다. 또한, 엔비디아는 가능한 최상의 성능을 보장하기 위해 매달 업데이트를 통해 딥러닝 컨테이너의 전체 소프트웨어 스택을 테스트하고 조정, 최적화합니다.
뿐만 아니라, 엔비디아는 커뮤니티 및 프레임워크 개발자들과 긴밀히 협력함으로써 오픈소스 프로젝트에 기여하고 있습니다. 엔비디아가 기여하는 오픈소스 프로젝트는 2017년에만 800건에 달했답니다. 이와 더불어, NGC에서 제공되는 다른 컨테이너 개발자와 협업해 애플리케이션을 최적화하고 성능과 호환성을 테스트하고 있습니다.
엔비디아 GPU를 통한 애저 인스턴트 실행
사용자들은 딥러닝 소프트웨어, HPC 애플리케이션, HPC 시각화 툴, 그리고 NGC 컨테이너 레지스트리의 다양한 파트너 애플리케이션를 위한 35개의 GPU 가속 컨테이너에 액세스하여, 엔비디아 GPU를 통해 다음과 같은 마이크로소프트 애저 인스턴트에서 실행할 수 있습니다.
- NCv3 (1, 2 혹은 4 NVIDIA Tesla V100 GPU)
- NCv2 (1, 2 혹은 4 NVIDIA Tesla P100 GPU)
- ND (1, 2 혹은 4 NVIDIA Tesla P40 GPU)
다른 종류나 다른 수량의 GPU를 가진 경우라도 동일한 NGC 컨테이너는 애저 인스턴스에서 작동됩니다.
애저에서 NGC 컨테이너를 사용하는 방법
먼저, 마이크로소프트 애저 마켓 플레이스에서 딥러닝과 HPC 용 엔비디아 GPU 클라우드 이미지(NGC 컨테이너를 실행하는데 필요한 모든 기능이 사전 구성된 애저 가상머신(VM) 이미지)를 클릭한 후, 애저에서 호환되는 엔비디아 GPU 인스턴스를 실행합니다. 그 다음 원하는 컨테이너를 NGC 레지스트리에서 실행중인 인스턴스로 가져오면 됩니다(이전에 무료 NGC 계정을 신청해야 하는 것 잊지 마세요). 자세한 내용은 ‘애저에서 NGC 컨테이너를 사용하는 방법’ 설명서에서 확인하실 수 있습니다.
이러한 NGC 컨테이너를 실행하기 위해 애저 마켓플레이스에서 엔비디아 이미지를 클릭하는 것 외에도, 애저 NCv2, NCv3, ND와 같은 VM상의 NGC에서 애저 배치 AI(Azure Batch AI)를 다운로드하여 실행할 수 있습니다. 간단한 깃허브(GitHub) 안내에 따라 NGC 컨테이너로 애저 배치 AI를 시작해보세요.
또한, 이와 관련된 웨비나가 10월 2일 오전 1시에 있을 예정입니다.