NVIDIA 기술에 Arm 기능이 확대되는 로드맵

NVIDIA는 AWS, Ampere Computing, MediaTek, Marvell의 Arm 기반 CPU를 사용해 플랫폼 속도를 높일 수 있는 새로운 프로세서와의 파트너십을 공개합니다
by NVIDIA Korea

Arm의 글로벌 생태계는 ‘GTC 2021’에서 NVIDIA의 새로운 기술이 공개되면서 한층 더 부각됐습니다.

NVIDIA는 Arm 기반 실리콘, 소프트웨어, 서비스 제공업체들과 협력을 논의하며, 클라이언트, 클라우드, HPC, 엣지 컴퓨팅 전반에 걸쳐 에너지 효율적이고 가속화된 플랫폼과 애플리케이션의 잠재력을 보여줬습니다.

또한 NVIDIA는 새로운 Arm 기반 CPU인 Grace를 비롯해 Arm IP를 기반으로 구축된 3개의 새로운 프로세서를 발표했습니다.

이와 별도로 새로운 BlueField-3 데이터 처리장치(DPU)는 더 많은 Arm 코어를 지원할 수 있어 데이터센터 네트워킹에서 더욱 강력한 신규 애플리케이션을 만들 수 있죠.

NVIDIA DRIVE Atlan은 Arm 지원 DPU를 장착한 최초의 자율주행차용 프로세서로, 고성능 네트워크의 잠재력을 보여줍니다.

비전 현실화

NVIDIA CEO 젠슨 황(Jensen Huang)은 GTC 2021 기조연설에서 AI, HPC, 데이터 과학, 그래픽 등에 대한 비전을 공유했는데요. 또한 2020년 9월 NVIDIA가 Arm 인수 계약의 일환으로 Arm 생태계를 확장하겠다는 약속을 재차 확인했습니다.

이러한 비전을 현실화하기 위해 NVIDIA는 NVIDIA GPU, DPU, 소프트웨어를 사용하는 4개의 주요 Arm 파트너의 CPU를 가속화해 Arm 개발자의 앱을 향상시키는 데 힘쓰고 있습니다.

AWS 그래비톤2 인스턴스를 향상시키는 GPU

클라우드 분야에서 NVIDIA는 클라우드 서비스 제공업체의 자체 Arm 기반 프로세서인 아마존웹서비스 그래비톤2((Amazon Web Services Graviton2)에 GPU 가속을 제공할 예정입니다. 이렇게 더 빨라진 그래비톤2 인스턴스는 풍부한 게임 스트리밍 경험을 제공하고 강력한 AI 추론 기능의 비용을 절감하게 됩니다.

예를 들어, 게임 개발자는 AWS 인스턴스를 통해 레이 트레이싱과 DLSS와 같은 NVIDIA RTX 그래픽 기술을 그래비톤2와 결합한 기타 서비스나 Android 게임에서 스트리밍할 수 있죠.

고성능 컴퓨팅 분야에서 새로운 NVIDIA Arm HPC 개발자 키트는 에너지 효율적인 고성능 플랫폼을 제공하는데요. 80개의 Arm 코어로 최대 3.3GHz까지 실행되는 CPU인 Ampere Computing의 Altra와 최신 NVIDIA GPU, DPU를 결합한 슈퍼컴퓨터에 제공됩니다.

이 개발자 키트는 AI와 HPC용 NVIDIA 컴파일러, 라이브러리, 도구 모음을 실행시켜 과학과 기술 컴퓨팅을 위한 Arm 기반 시스템을 가속화할 수 있죠. 미국의 오크리지 국립연구소(Oak Ridge)와 로스알라모스 국립연구소(Los Alamos National Labs), 한국과 대만의 국립연구소가 처음 사용할 예정입니다.

클라이언트, 에지 플랫폼 향상

PC 분야에서 NVIDIA는 세계 최대의 스마트폰 칩 공급업체인 미디어텍(MediaTek)과 협력해 NVIDIA RTX GPU와 Arm 기반 CPU로 구동되는 새로운 등급의 노트북을 개발하고 있는데요.

노트북은 Arm 코어와 NVIDIA 그래픽으로 Chromium, Linux, NVIDIA SDK를 지원하는 레퍼런스 플랫폼을 기반으로 합니다. 성능 저하가 없는 미디어 기능을 갖춰서 에너지 효율적인 이동용 장치가 될 것입니다.

또한 엣지 컴퓨팅 분야에서 NVIDIA는 OCTEON Arm 기반 프로세서를 NVIDIA의 GPU와 결합하기 위해 마벨 반도체(Marvell Semiconductor)와 협력하고 있습니다. 이러한 결합으로 네트워크 최적화와 보안을 위해 AI 워크로드 속도가 높아집니다.

Arm 제품군에 합류한 최고의 AI 시스템

내년에 강력한 AI 슈퍼컴퓨터 두 대가 출시될 예정입니다.

스위스 국립 슈퍼컴퓨팅센터(Swiss National Supercomputing Centre)는 20 엑사 플롭의 ​​AI 성능을 갖춘 시스템을 구축 중입니다. 미국 로스알라모스 국립연구소는 새로운 AI 슈퍼컴퓨터를 마련할 계획입니다.

이들 슈퍼컴퓨터 시스템 모두는 가장 복잡한 AI와 HPC 워크로드에서 오늘날 가장 빠른 서버보다 10배 빠른 성능을 제공하는 Arm 기반 프로세서인 NVIDIA CPU Grace로 구동됩니다.

선구적인 컴퓨터 과학자 그레이스 홉퍼(Grace Hopper)의 이름을 따서 지은 Grace는 데이터 기반 AI 시대에 필요한 기능을 갖추었는데요. 현재 서버 대역폭의 14배인 4세대 NVLink에 힘입어 NVIDIA GPU에 초당 900 GB로 실행하며 안정적인 연결상태를 제공하죠.

네트워킹을 위해 Arm 코어 늘리기

NVIDIA Mellanox 네트워킹으로 Arm에 대한 투자가 두 배 이상 늘고 있습니다. 지난 12일에 발표한 BlueField-3 DPU는 400 Gbps 링크와 BlueField-2의 Arm 컴퓨팅 성능보다 5배 빠른 성능을 제공합니다.

간단하게 계산해보아도 Arm 기능이 확대되는 이유를 알 수 있는데요. BlueField-3 DPU 1개는 86배 가속의 CPU 코어가 최대 300개 필요한 데이터센터 서비스를 제공합니다.

이러한 기술 발전으로 Arm 개발자는 빠르고 효율적이며 스마트한 데이터센터 네트워크를 구축할 수 있습니다.

현재 DPU는 통신, 스토리지, 보안, 시스템 관리 작업을 오프로드하는 것이 가능합니다. 이러한 기능 덕분에 NVIDIA가 발표한 클라우드 네이티브 슈퍼컴퓨터와 같은 완전히 새로운 등급의 시스템을 만들 수 있는 것이죠.

NVIDIA와 Arm의 결합

Arm 코어는 NVIDIA 로드맵을 한 단계 도약시킨 NVIDIA DRIVE Atlan로 구동되는 차세대 AI 자율주행 차량에서 선보일 예정입니다.

DRIVE Atlan은 초당 1,000조 이상의 작업을 수행할 수 있는 엄청난 성능을 발휘하게 될 겁니다. Atlan은 DRIVE 플랫폼과 DPU을 최초로 통합한 것으로 자율주행차량에 들어가는 데이터센터 네트워킹에 상당하는 기능을 지원하는 Arm 코어가 탑재됩니다.

Atlan DPU는 Arm 개발자가 보안, 스토리지, 네트워킹 등에서 혁신적인 애플리케이션을 만들 수 있는 플랫폼을 제공합니다.

최고의 기술은 이제부터

제품군과 파트너십의 확대는 Arm 생태계에 4가지 가속 제품군을 제공하겠다는 NVIDIA의 계획이 진척되고 있음을 보여줍니다.

  • NVIDIA AI – AI 교육 및 추론을 가속화하는 업계 표준
  • RAPIDS – GPU에서 데이터과학과 애널리틱스를 실행하기 위해 NVIDIA에서 유지 관리하는 오픈소스 소프트웨어 라이브러리 제품군
  • NVIDIA HPC SDK – 고성능 컴퓨팅을 위한 컴파일러, 라이브러리, 소프트웨어 도구
  • NVIDIA RTX – 레이 트레이싱과 AI 기능을 제공하는 그래픽 드라이버

이제부터가 시작입니다. NVIDIA는 Arm과의 기술 결합으로 더욱 향상된 제품을 선보일 것입니다.