NVIDIA Quantum-2 공개로 슈퍼컴퓨팅 성능이 달라졌다!

by NVIDIA Korea

NVIDIA는 차세대 InfiniBand 네트워킹 플랫폼인 NVIDIA Quantum-2를 공개했습니다. Quantum-2는 클라우드 컴퓨팅 제공업체와 슈퍼컴퓨팅 센터에 필요한 최고의 성능, 광범위한 접근성, 강력한 보안을 제공합니다.

이는 현재까지 구축된 가장 진보된 엔드-투-엔드 네트워킹 플랫폼입니다. 또한 NVIDIA Quantum-2 스위치, ConnectX-7 네트워크 어댑터, BlueField-3 데이터 처리 장치(DPU)와 새로운 아키텍처를 지원하는 모든 소프트웨어로 구성된 400Gbps InfiniBand 네트워킹 플랫폼입니다.

NVIDIA Quantum-2는 슈퍼컴퓨팅 센터가 조직 외부의 수많은 사용자에게 더 많이 개방되는 추세에 맞춰 공개됐습니다. 동시에 전세계 클라우드 서비스 제공업체들은 수백만 명의 고객에게 더 많은 슈퍼컴퓨팅 서비스 제공을 시작하고 있습니다.

NVIDIA Quantum-2은 이러한 환경에서 실행되는 까다로운 워크로드를 위한 주요 기능을 제공하는데요. 클라우드 네이티브 기술을 통해 초당 400기가비트의 처리량과 고급 멀티-테넌시로 고성능을 제공하여 많은 사용자를 수용합니다.

NVIDIA 네트워킹 담당 수석 부사장 길라드 샤이너(Gilad Shainer)은 “오늘날 슈퍼컴퓨팅 센터와 퍼블릭 클라우드에 대한 요구사항을 수렴하고 있습니다. 차세대 HPC, AI와 데이터 애널리틱스에 대해 가능한 최고의 성능을 제공하는 동시에 워크로드를 안전하게 격리하고, 다양한 사용자 트래픽 요구에 대응해야 합니다. NVIDIA Quantum-2 InfiniBand를 통해 이러한 과제를 해결할 수 있습니다”라고 말했습니다.

NVIDIA Quantum-2 성능과 클라우드 네이티브 기능

NVIDIA Quantum-2 InfiniBand는 400Gbps으로, 네트워크 속도를 두 배로 높이고 네트워크 포트 수를 세 배로 늘렸습니다. 이는 성능을 3배로 높였고, 데이터센터 패브릭 스위치의 필요성을 6배 절감하는 동시에, 데이터센터 전력 소비량과 공간을 7%씩 절감하죠.

NVIDIA Quantum-2의 멀티 테넌트 성능 격리는 한 테넌트의 활동이 다른 테넌트를 방해하지 않도록 하는데요. 이를 위해 사용자 또는 워크로드 수요 급증여부와 관계없이 안정적인 처리량을 보장하는 클라우드 네이티브 기능이 있는 고급 원격측정 기반 혼잡제어 시스템을 활용합니다.

NVIDIA Quantum-2 SHARPv3 인-네트워크 컴퓨팅 기술은 이전 세대에 비해 AI 애플리케이션에 32배 더 빠른 가속 엔진을 제공합니다. 또한, NVIDIA UFM Cyber-AI 플랫폼을 통해 예측 관리를 포함한 데이터센터용 고급 InfiniBand 패브릭 관리가 가능합니다.

NVIDIA Quantum-2에 통합된 나노초 정밀 타이밍 시스템은 데이터베이스 처리와 같은 분산 애플리케이션을 동기화해 대기, 유휴시간 오버헤드를 줄일 수 있습니다. 이 기능을 통해 데이터센터는 통신 네트워크의 일부가 되고, 소프트웨어 정의 5G 무선 서비스를 호스팅할 수 있습니다.

Quantum-2 InfiniBand 스위치

Quantum-2 플랫폼의 중심에는 새로운 Quantum-2 InfiniBand 스위치가 있습니다. 7나노미터 실리콘에 570억 개의 트랜지스터가 있는 해당 제품은 540억 개의 트랜지스터가 있는 NVIDIA A100 GPU보다 약간 더 크죠.

이는 400Gbps에서 64개 포트 또는 200Gbps에서 128개 포트를 제공하며, 400Gbps에서 최대 2,048 포트 또는 200Gbps에서 4,096포트까지 다양한 스위치 시스템으로 제공됩니다. 이전 세대인 Quantum-1에 비해 5배 이상 향상된 스위칭 능력을 제공합니다.

결합된 네트워킹 속도, 스위칭 기능과 확장성은 차세대 거대한 HPC 시스템을 구축하는 데 이상적인데요.

NVIDIA Quantum-2 스위치는 현재 아토스(Atos), 데이터다이렉트 네트워크(DDN), 델 테크놀로지스(Dell Technologies), 엑셀레로(Excelero), 기가바이트(GIGABYTE), HPE, IBM, 인스퍼(Inspur), 레노버(Lenovo), NEC, 펭귄 컴퓨팅(Penguin Computing), QCT, 슈퍼마이크로(Supermicro), VAST 데이터(VAST Data) 및 웨카IO(WekaIO)를 비롯한 전세계 다양한 주요 인프라 및 시스템 공급업체에서 사용할 수 있다.

Quantum-2 CoonectX-7과 BlueField-3

NVIDIA Quantum-2 플랫폼은 NVIIDA ConnectX-7 NIC와 NVIDIA BlueField-3 DPU InfiniBand를 네트워킹 엔드 포인트 옵션으로 제공합니다.

ConnectX-7은 7나노미터 디자인에 80억 개의 트랜지스터가 있고, 현재까지 세계 최고의 HPC 네트워크 칩인 NVIDIA ConnectX-6 대비 데이터 전송률을 두 배로 높였습니다. 또한 RDMA, GPU다이렉트 스토리지, GPU다이렉트 RDMA와 인-네트워킹 컴퓨팅의 속도를 두 배로 높였죠. ConnectX-7의 샘플은 내년 1월에 제공됩니다.

BlueField-3 InfiniBand는 7나노미터 설계에 220억 개의 트랜지스터가 있으며, 16개의 64비트 Arm CPU를 제공하여 데이터센터 인프라 스택을 오프로드하고 격리합니다. BlueField-3의 샘플은 내년 5월에 제공됩니다.