‘NVIDIA Grace CPU’ 에너지 효율적인 컴퓨팅의 새로운 시대를 열다

NVIDIA Grace CPU 슈퍼칩이 동일한 전력 엔벨롭(power envelope) 내 주요 CPU 애플리케이션 전반에서 x86 프로세서 대비 2배의 성능 향상을 제공한다는 워크로드 테스트 결과가 나왔습니다.

Grace CPU 슈퍼칩을 사용하면 데이터센터는 2배 더 많은 피크 트래픽(peak traffic)을 처리하고, 전력 요금을 최대 절반까지 줄일 수 있습니다. 네트워크 엣지의 제한된 공간에 더 많은 성능을 제공할 수 있으며, 옵션들을 조합해 사용하는 것도 가능합니다.

이는 완전히 새로운 기회를 제시하는 것으로, 에너지 효율적인 컴퓨팅의 새 시대가 열렸다는 것을 의미합니다.

데이터센터의 최우선 과제, 에너지 효율성

에너지 효율의 시대에서 데이터센터 관리업체에는 다음과 같은 옵션들이 필요합니다.

무어의 법칙은 사실상 끝났다고 할 수 있습니다. 동일한 전력과 동일한 공간에 이 이상으로 많은 트랜지스터를 넣는 것은 이제 물리적으로 불가능하죠.

따라서 새로운 x86 CPU의 성능 향상은 일반적으로 이전 세대 대비 30% 미만으로 한정됩니다. 이는 점점 더 많은 데이터센터가 전력 제한을 받는 이유이기도 합니다.

지구 온난화의 위협이 가중되면서, 데이터센터는 전력을 확장할 수 있는 여유가 없음에도 여전히 증가하는 컴퓨팅 수요에 계속 대응해야 합니다.

전력은 동일하게, 성능은 높게

맥킨지 연구(McKinsey study)에 따르면, 컴퓨팅 수요는 미국에서 매년 10%씩 늘어나고 있고, 2022년부터 2030년 사이 8년 안에 두 배로 증가할 것입니다.

이에 대해 맥킨지 연구는 “데이터센터를 지속 가능하게 만들어야 한다는 압박이 높으며, 일부 규제당국과 정부는 새로 구축된 데이터센터에 지속 가능성 표준을 부과하고 있다”고 기술합니다.

맥킨지가 인용한 설문조사에 따르면, 무어의 법칙이 끝남에 따라 데이터센터의 컴퓨팅 효율성 향상이 정체됐다고 보는데요(아래 차트 참조).

오늘날의 환경에서 NVIDIA Grace가 제공하는 2배의 성능 향상은 여러 세대를 뛰어넘는 놀라운 도약과도 같으며, 데이터센터 관리업체들의 요구를 충족합니다.

240개 이상의 데이터센터를 관리하는 글로벌 서비스 제공업체인 에퀴닉스(Equinix)의 잭 스미스(Zac Smith) 엣지 인프라 총괄은 에너지 효율적인 컴퓨팅에 대한 기사에서 요구사항을 명확히 설명했습니다.

그는 “탄소 배출량 대비 성능을 높여야 합니다. 이러한 여정에서 10,000여개의 고객사가 에퀴닉스에 의존하고 있습니다. 고객들은 AI 등의 사용으로 더 많은 데이터와 인텔리전스를 요구하며, 이를 지속 가능한 방식으로 얻기를 바랍니다”고 말했죠.

세 가지 CPU 혁신

Grace CPU의 효율적인 성능 뒤에는 세 가지 혁신이 있습니다.

먼저, 처리량의 표준 척도인 패브릭 바이섹션 대역폭에서 초당 3.2테라바이트를 자랑하는 단일 다이(die)에서 72개의 암 네오버스(Arm Neoverse) V2 코어를 연결하기 위해 초고속 패브릭을 연결합니다. 그런 다음 슈퍼칩 패키지에 두 다이를 NVIDIA의 NVLink-C2C 인터커넥트와 연결하여 900GB/s의 대역폭을 제공합니다.

마지막으로, Grace는 서버급 LPDDR5X 메모리를 사용하는 최초의 데이터센터 CPU입니다. Grace CPU는 같은 비용으로 최대 50% 더 많은 메모리 대역폭을 제공하지만 사용 전력은 일반적인 서버 메모리 사용 전력의 8분의 1에 불과합니다. 또한 콤팩트한 크기로 일반적인 카드 기반 메모리 설계 밀도의 2배를 지원합니다.

현재의 x86 CPU에 비해, NVIDIA Grace는 더 단순한 설계로 더 많은 대역폭과 보다 적은 전력 사용량을 제공합니다.

첫 번째 테스트 결과

NVIDIA 엔지니어는 현재 Grace에서 실제 데이터센터 워크로드를 실행하고 있습니다.

동일한 전력 공간을 사용하는 데이터센터의 주요 x86 CPU와 비교할 때, Grace는 다음과 같은 결과를 제공했습니다.

마이크로서비스의 경우 2.3배 더 빠른 속도
메모리 집약적 데이터 프로세싱에서 2배 더 빠른 속도
많은 기술 컴퓨팅 앱에서 사용되는 전산유체역학(CFD)에서 1.9배 더 빠른 속도

데이터센터는 일반적으로 아래 차트에 요약된 이점들을 얻기 위해 두 개 이상의 CPU 세대를 기다려야 하는데요.

순이익(연한 녹색)은 서버 세대 간 발전(진한 녹색)과 Grace의 에너지 효율성 덕분에 가능해진 동일한 x86 전력 엔벨롭(중간 막대)에 맞는 추가 Grace 서버입니다.

현재 구동 중인 CPU에서 이러한 결과를 얻기 이전에도 사용자는 Grace의 혁신에 반응했습니다.

지난 5월, 로스 앨러모스 국립 연구소(Los Alamos National Laboratory)는 재료과학, 재생에너지 등 분야의 연구를 발전시킬 10 엑사플롭 AI 슈퍼컴퓨터인 베나도(Venado)에 Grace를 사용할 것이라고 발표했습니다. 한편 유럽과 아시아의 데이터센터들은 워크로드에 대한 Grace의 평가를 진행 중입니다.

NVIDIA Grace는 올해 하반기 생산을 위해 샘플링 중입니다. 에이수스(ASUS), 아토스(Atos), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(HPE), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron), ZT 시스템즈(ZT Systems) 등이 Grace를 사용하는 서버를 구축하고 있습니다.