NVIDIA는 8월 22일부터 24일까지 사흘 간 열리는 세계 최고 반도체 관련 연례 학술행사 ‘핫 칩스(Hot Chips) 33’에서 NVIDIA BlueField DPU를 통한 네트워크 가속화 지원 사례를 소개합니다. BlueField DPU는 작년 출시돼 세계 최초로 데이터 처리 장치 분야를 개척하고 있는데요. 전 세계 주요 클라우드 서비스, 슈퍼컴퓨터, OEM, 소프트웨어 파트너 업체에서 채택되고 있습니다.
이스라엘에 본사를 둔 BlueField 설계팀의 수석 아키텍트인 이단 버스타인(Idan Burstein)은 이번 핫 칩스 연설에서 NVIDIA BlueField DPU의 아키텍처를 심도 있게 설명합니다. 더불어, 일련의 하드웨어 가속기, 범용 Arm 코어이자 네트워킹, 보안 및 스토리지 관련 가속화 작업을 통해 최신 데이터센터를 가속하는 새로운 실리콘 엔진을 공개합니다.
가속화 작업은 네트워크 트래픽의 플로우를 보호하고 원활하게 하면서 데이터센터의 하드웨어를 가상화 하는 작업을 포함하는데요. 이는 데이터센터 운영에 필수인 수많은 작업을 하드웨어상에서 가속화하는 다음의 세부 작업으로 구성됩니다.
- 보안을 위한 IPsec, TLS, AES-GCM, RegEx, 공용 키 가속화
- 스토리지를 위한 NVMe-of, RAID, GPU 다이렉트 스토리지
- 네트워킹을 위한 RDMA, RoCE, SR-IOV, VXLAN, Virt IO와 GPU 다이렉트 RDMA
- 비디오 스트리밍과 시간 민감형(time-sensitive) 커뮤니케이션을 위한 오프로드
무어의 법칙보다 빠르게 증가하는 가속화 작업의 워크로드는 이미 서버 CPU 주기의 약 3분의 1을 소비하고 있습니다. DPU는 이러한 작업을 보다 효율적으로 실행하기 위해 특수 제작된 하드웨어를 지원하며, 데이터센터 애플리케이션에 더 많은 CPU 코어를 사용하도록 합니다.
DPU는 베어메탈 성능의 저하 없이 가상화와 향상된 보안을 제공합니다. 또한 클라우드 컴퓨팅과 미디어 스트리밍부터 스토리지, 엣지 프로세싱, 고성능 컴퓨팅에 이르기까지 폭넓은 용도로 사용할 수 있습니다.
NVIDIA CEO 젠슨 황(Jensen Huang)은 DPU가 “향후 컴퓨팅의 세 주축 중 하나입니다”라며, “CPU는 범용 컴퓨팅을 위한 것이고 GPU는 가속 컴퓨팅을 위한 것이며, DPU는 데이터센터를 중심으로 데이터를 처리하기 위한 것입니다”라고 설명했습니다.
완벽한 플러그 앤 플레이 스택
사용자들이 복잡한 기술 사항을 세부적으로 익히지 않아도 되는 점은 BlueField DPU의 장점입니다. 사용자들은 기존 소프트웨어를 고급 소프트웨어 인터페이스에 연결하여 DPU의 성능을 활용할 수 있습니다.
이러한 API는 DPU의 소프트웨어 스택인 NVIDIA DOCA를 통해 번들로 제공됩니다. 이는 드라이버, 라이브러리, 도구, 설명서, 예제 애플리케이션과 데이터센터 전체에 걸친 수천 개의 DPU에 서비스를 프로비저닝, 배포, 조정하기 위한 런타임 환경을 포함하죠.
NVIDIA는 이미 업계 선두 기업을 비롯해 전 세계 수백 개의 기관으로부터 NVIDIA DOCA에 대한 얼리 액세스 요청을 받았습니다.
데이터센터와 클라우드에 강력한 성능 제공
핫 칩스에서 공개되는 NVIDIA BlueField DPU 아키텍처는 상위 500개의 슈퍼컴퓨터와 주요 클라우드에 적용되고 있으며, 차세대 방화벽에 통합되고 있습니다. 해당 아키텍처는 다양한 파트너 업체의 소프트웨어에 기반한 일부 업계 선도 OEM의 시스템에서 제공될 예정입니다.
현재 전 세계 유수의 클라우드 서비스 공급자는 보다 안전한 컴퓨팅 인스턴스를 제공하기 위해 BlueField DPU를 도입했거나 도입을 준비 중입니다.
강화된 슈퍼컴퓨터 및 방화벽 기능
케임브리지 대학(University of Cambridge)은 지난 6월 BlueField DPU의 효율성을 활용해 영국에서 가장 빠른 교육 시스템이자 세계에서 가장 에너지 효율적인 시스템인 그린500(Green500) 리스트 3위에 등재된 슈퍼컴퓨터를 선보였는데요. 이는 세계 최초의 클라우드 네이티브(Cloud-native) 슈퍼컴퓨터로, 연구자들이 성능의 저하 없이 안전하고 개인화된 환경에서 가상 데이터를 공유하도록 합니다.
현재 모든 데이터센터는 팔로알토 네트윅스(Palo Alto Networks)의 VM 시리즈 차세대 방화벽을 통해 DPU의 보안 기능에 액세스할 수 있습니다. BlueField-2는 VM시리즈 차세대 방화벽을 가속하여 이전에는 추적할 수 없었거나 비실용적인 네트워크 플로우를 검사할 수 있도록 합니다.
지난 5월 개최된 컴퓨텍스(COMPUTEX) 2021에서 발표된 바와 같이, BlueField DPU는 에이수스(ASUS), 아토스(Atos), 델 테크놀로지스(Dell Technologies), 후지츠(Fujitsu), 기가바이트(GIGABYTE), H3C, 인스퍼(Inspur), 콴타(Quanta)/QCT, 슈퍼마이크로(Supermicro) 등 다양한 업체의 시스템을 통해 제공될 예정입니다. 또한 소프트웨어 업체에서도 NVIDIA BlueField DPU를 지원할 예정입니다.
- VM웨어(VMware)는 몬트레이 프로젝트(Project Monterey)를 통해 자사의 빠른 속도, 탄력성, 보안 기술을 이용하는 30만 곳 이상의 기관에 BlueField DPU를 지원합니다.
- 레드햇(Red Hat)은 포춘(Fortune) 선정 500대 기업의 약 95%가 사용하는 레드햇 엔터프라이즈 리눅스(Enterprise Linux)와 레드햇 오픈시프트(OpenShift)를 위한 개발자 툴을 통해 BlueField DPU를 지원합니다.
- 캐노니컬(Canonical)은 공공 클라우드 부문에서 가장 선호되는 운영체제(OS)인 우분투 리눅스(Ubuntu Linux)를 통해 BlueField DPU를 지원합니다.
- 체크포인트 소프트웨어 테크놀로지스(Check Point Software Technologies)는 10만 곳 이상의 기관에서 사이버 공격을 방지하기 위해 사용하는 제품을 통해 BlueField DPU를 지원합니다.
이 밖에도 클라우드플레어(Cloudflare), DDN, 엑셀레로(Excelero), F5, 포티넷(Fortinet), 가디코어(Guardicore), 주니퍼 네트웍스(Juniper Networks), 넷앱(NetApp), 베스트 데이터(Vast Data), 웨카IO(WekaIO) 등의 파트너 업체에서 BlueField DPU를 지원합니다.
BlueField DPU 지원으로 수많은 업체들은 폭넓은 기회를 창출하게 됩니다. NVIDIA CFO 콜레트 크레스(Collette Kress)는 지난 5월 어닝콜(earning call)을 통해 모든 서버가 DPU를 채택할 것이라고 예상했는데요. “앞으로 세계 곳곳의 네트워크 칩은 스마트 네트워크 칩인 DPU로 바뀔 것입니다. DPU란 하나의 칩으로 구축된 데이터센터를 의미합니다”라고 설명했습니다.
DPU를 활용하는 네트워크의 확장
시장조사업체 델오로(Dell’Oro)에 따르면 스마트 네트워킹 포트 출하량은 2020년 약 440만 개에서 2025년 약 740만 개로 두 배 가까이 증가할 것으로 전망하고 있습니다. NVIDIA는 이와 같은 시장의 성장에 대비해 지난 GTC에서 차기 두 세대의 DPU에 대한 기술 로드맵을 발표했죠.
내년에 샘플링을 시작하는 BlueField-3는 네트워크를 최대 400Gb/s로 구동하며, 300 x86 코어의 성능을 더욱 끌어올립니다. BlueField-4는 NVIDIA AI 컴퓨팅 기술을 추가해 한 단계 더 향상된 성능을 제공합니다.
관련 시장의 가파른 성장과 더불어 이번 핫 칩스 연설에서 알 수 있듯이, NVIDIA는 기존의 AI 분야를 넘어 가속 네트워크 분야의 기술 개발에 박차를 가하고 있음을 강조합니다.