세계 유일의 페타스케일급 워크그룹 서버 NVIDIA DGX Station A100 공개

까다로운 머신러닝 및 데이터 사이언스 워크로드 가속화하는 NVIDIA DGX Station A100
by NVIDIA Korea

NVIDIA가 세계 유일의 페타스케일급 워크그룹 서버인 NVIDIA DGX Station A100을 발표했습니다. 혁신적인 2세대 인공지능(AI) 시스템인 NVIDIA DGX Station A100은 기업 사무실, 연구시설은 물론 재택근무를 하는 직원들의 까다로운 머신러닝(ML) 및 데이터 사이언스 워크로드를 가속화하도록 설계됐습니다.

1117 블로그 [이미지] 엔비디아 DGX 스테이션 A100
NVIDIA DGX Station A100
2.5 페타플롭스(PF)의 AI 성능을 제공하는 DGX Station A100은 NVIDIA NVLink로 상호 연결된 4개의 최신 NVIDIA A100 텐서 코어 GPU를 탑재한 유일한 워크그룹 서버로, 최대 320GB의 GPU 메모리를 제공하여 기업의 데이터 사이언스 및 AI 혁신을 지원합니다

또한 NVIDIA DGX Station A100은 NVIDIA 멀티 인스턴스 GPU(MIG) 기술을 지원하는 유일한 워크그룹 서버인데요. MIG 기술을 통해 단일 DGX Station A100에서 최대 28개의 개별 GPU 인스턴스를 제공하여 시스템 성능에 영향을 미치지 않고 병렬 작업을 수행하며, 여러 사용자를 지원합니다.

NVIDIA DGX 시스템 총괄 부사장 찰리 보일(Charlie Boyle)은 “DGX Station A100은 어디에나 연결할 수 있는 서버급 시스템으로, 데이터센터에서 AI 성능을 제공합니다. 데이터 사이언스 및 AI 연구진들은 NVIDIA DGX A100 시스템과 같은 소프트웨어 스택을 통해 개발부터 배포까지 이르는 광범위한 업무를 가속화할 수 있습니다”고 말했습니다.

NVIDIA DGX Station을 통한 AI 혁신

전세계 교육, 금융, 정부, 의료, 소매업 등 여러 산업에 걸친 주요 기업과 조직들이 AI 및 데이터 사이언스 혁신을 위해 NVIDIA DGX Station을 도입하고 있습니다.

  • BMW 그룹 프로덕션: NVIDIA DGX 스테이션을 활용해 기업 운영을 개선하는 AI 모델을 개발 및 배포함에 있어 관련 인사이트를 더욱 신속하게 확보하고 있습니다.
  • 독일 AI 연구센터(DFKI): NVIDIA DGX Station을 활용해 사회 및 산업 분야의 중요하고 다양한 과제를 해결하는 모델을 구축하고 있습니다. 여기에는 자연재해에 신속하게 대응하도록 하는 응급 서비스를 지원하는 컴퓨터 비전 시스템을 포함합니다.
  • 록히드마틴(Lockheed Martin): NVIDIA DGX Station을 통해 센서 데이터와 서비스 로그를 활용한 AI 모델을 개발했습니다. 이를 통해 생산 가동시간을 향상하고, 작업자의 안전을 높이며, 운영비를 절감하기 위한 유지보수 필요성을 예측하고 있습니다.
  • NTT도코모(NTT Docomo): 가입자 7천 9백만 명 이상의 일본 대표 이동통신사인 NTT도코모는 NVIDIA DGX Station을 활용해 이미지 인식 솔루션 등 혁신적인 AI 기반 서비스를 개발하고 있습니다.
  • 퍼시픽 노스웨스트 국립연구소(PNNL): NVIDIA DGX Station을 통해 국가안보를 지원하는 연방기금 연구를 실시하고 있습니다. PNNL은 에너지 회복탄력성 및 국가 보안 부문의 기술 혁신을 중점으로 과학적 발견, 에너지 회복탄력성, 화학, 지구 과학 및 데이터 애널리틱스를 담당하는 미국의 선도적인 HPC 센터입니다.

어느곳에서나 사용 가능한 AI 슈퍼컴퓨터

NVIDIA DGX Station A100은 데이터센터급 전력이나 쿨링을 요구하지 않고도 데이터센터 시스템과 동일한 수준의 원격 관리 기능을 지원하는 서버급 시스템입니다. 또 시스템 관리자는 원격 연결을 통해 데이터 사이언티스트와 연구자가 가정 및 연구실에서 작업할 때 모든 관리 작업을 쉽게 수행할 수 있도록 지원할 수 있습니다.

DGX Station A100에는 80GB 또는 40GB의 NVIDIA A100 Tensor Core GPU가 4개 탑재돼 있는데요. 데이터 사이언스 및 AI 연구팀의 워크로드와 예산에 맞춰 시스템을 선택할 수 있습니다.

DGX Station A100은 BERT Large inference와 같은 복잡한 대화형 AI 모델을 지원하기 위해 이전 세대 DGX Station 대비 4배 이상 빠른 속도를 제공합니다. 또, BERT Large AI 훈련에 있어 약 3배 향상된 성능을 지원합니다.

두 배로 높아진 GPU 메모리

향상된 데이터센터 워크로드를 지원하기 위해 DGX A100 시스템은 새로운 NVIDIA A100 80GB GPU를 탑재했습니다. 이를 통해 GPU 메모리 용량을 시스템당 두 배인 640GB으로 늘려 대규모의 데이터셋과 모델을 통해 정확성을 높일 수 있습니다.

새로운 NVIDIA DGX A100 640GB 시스템은 엔터프라이즈용 NVIDIA DGX SuperPOD 솔루션에도 통합될 수 있는데요. 턴키 방식의 AI 슈퍼컴퓨터는 20개의 DGX A100 시스템 유닛을 기반으로 제공돼 대규모 AI 모델을 구축하고 교육 및 배포할 수 있도록 합니다.

DGX A100 640GB가 탑재된 DGX SuperPOD 시스템은 영국의 헬스케어 연구 발전을 위한 ‘케임브리지-1(Cambridge-1)’ 슈퍼컴퓨터와 미 플로리다 주 전역에서 AI를 통한 다양한 발견을 지원하는 플로리다 주립대학교의 ‘하이퍼게이터(HiPerGator) AI’ 슈퍼컴퓨터에 최초로 도입됐습니다.

출시일

NVIDIA DGX Station A100과 NVIDIA DGX A100 640GB 시스템은 전세계 NVIDIA 파트너 네트워크 리셀러를 통해 2020년 4분기에 제공될 예정입니다. NVIDIA DGX A100 320GB 고객을 대상으로 업그레이드 옵션도 지원됩니다.

한편, NVIDIA는 17일 오전 8시(한국시간) 슈퍼컴퓨팅 연례 행사인 슈퍼컴퓨팅 2020(SC20)에서 특별연설을 통해 NVIDIA DGX Station을 자세히 소개할 예정입니다. 또한 12월 3일에는 DGX Station웨비나가 진행됩니다.