데이터센터를 위한 CPU ‘그레이스’ 베일을 벗다

대규모 AI 및 고성능컴퓨팅(HPC) 워크로드를 위한 최초의 NVIDIA CPU가 공개됐습니다. ‘Grace(그레이스)’로 명명된 이 새로운 Arm 기반 CPU는 오늘날 가장 빠른 서버보다 10배 뛰어난 성능을 제공합니다.

1만년 이상의 엔지니어링의 산물인 NVIDIA Grace는 자연어 처리, 추천 시스템, AI 슈퍼컴퓨팅과 같이 방대한 데이터세트를 분석을 위한 초고속 컴퓨팅 성능과 대용량 메모리 요구사항을 모두 충족하도록 설계됐습니다. 에너지 효율적인 Arm CPU 코어와 혁신적인 저전력 메모리 서브시스템의 결합으로 뛰어난 효율성과 높은 성능을 제공하는데요.

젠슨 황(Jensen Huang) NVIDIA 창립자 겸 CEO는 “최첨단 AI와 데이터 사이언스는 오늘날 컴퓨팅 아키텍처의 한계를 뛰어넘는 데이터를 처리하고 있습니다. NVIDIA는 Arm IP를 기반으로 대규모 AI와 HPC를 위한 CPU인 Grace를 설계했습니다. GPU와 DPU가 결합된 CPU Grace를 통해 NVIDIA는 컴퓨팅을 위한 세 번째 기반기술을 구축하고, AI의 진보를 위해 데이터센터를 재설계할 수 있는 능력을 갖추게 됐습니다. NVIDIA는 이제 세 종류의 칩을 가진 기업입니다”라고 설명했죠.

CPU Grace는 파라미터가 1조 개가 넘는 차세대 NLP 모델 훈련과 같은 워크로드에 특화된 프로세서입니다. Grace 기반 시스템은 NVIDIA GPU와 긴밀하게 결합되었을 때 x86 CPU에서 실행되는 최첨단 엔비디아 DGX 기반 시스템보다 10배 더 빠른 성능을 제공합니다.

컴퓨터 프로그래밍 선구자 그레이스 하퍼(Grace Hopper)의 이름을 딴 CPU Grace는 컴퓨팅의 틈새시장에서 서비스를 제공할 예정입니다.

스위스 국립 슈퍼컴퓨팅센터(CSCS)와 미 에너지부 산하 로스앨러모스 국립연구소(Los Alamos National Laboratory)는 국가의 과학 연구 이니셔티브를 지원하기 위해 CPU Grace 기반의 슈퍼컴퓨터를 구축한다는 계획을 최초로 발표했습니다.

오늘날 가장 큰 AI 모델은 수십억 개의 파라미터를 포함하며 매 2개월 반마다 두 배씩 증가하고 있습니다. 이러한 모델의 훈련 과정에서 시스템 병목 현상을 제거하기 위해 GPU와 긴밀하게 결합할 수 있는 새로운 CPU가 필요한데요.

NVIDIA는 Arm의 데이터센터 아키텍처의 놀라운 유연성을 활용해 CPU Grace를 구축했습니다. NVIDIA는 새로운 서버급 CPU를 선보임으로써, 세계에서 가장 시급한 문제를 해결하는 데 필요한 혁신을 달성하고 AI와 HPC 커뮤니티의 기술 다양성 목표를 앞당기고 있습니다.

사이먼 시거스(Simon Segars) Arm CEO는 “세계에서 가장 많은 라이선스를 취득한 프로세서 아키텍처인 Arm은 매일 놀랍고 새로운 방식으로 혁신을 주도하고 있습니다. NVIDIA Grace 출시는 Arm의 라이선스 모델이 어떻게 중요한 발명을 가능케 하는지, 즉 전 세계 AI 연구자와 과학자들의 놀라운 업적을 계속 뒷받침하고 있다는 것을 여실히 보여주는 예입니다”라고 말했습니다.

NVIDIA Grace를 최초로 채택한 기관

CSCS와 로스앨러모스 국립연구소는 HPE가 구축하게 될 NVIDIA Grace 기반 슈퍼컴퓨터를 2023년 공식 운영할 예정입니다.

CSCS 디렉터 토마스 슐테스(Thomas Schulthess)는 ” NVIDIA Grace CPU는 가장 어려운 계산과학 문제를 해결하는데 AI 기술과 슈퍼컴퓨팅을 융합할 수 있게 해줍니다. 스위스와 전 세계 사용자들이 복잡한 과학 데이터세트를 처리하고 분석하는 데 새로운 NVIDIA CPU를 사용할 수 있게 되어 기쁩니다”라고 말했습니다.

톰 메이슨(Thom Mason) 로스앨러모스 국립연구소 디렉터는 “메모리 대역폭과 용량의 혁신적인 균형으로, 이 차세대 시스템은 우리 기관의 컴퓨팅 전략을 좌우할 것입니다. NVIDIA Grace CPU 덕분에 이전보다 더 큰 데이터세트를 사용해 고성능 3D 시뮬레이션과 분석을 진행하고 첨단 과학 연구를 수행할 수 있게 됐습니다”라고 말했습니다.

획기적인 성능 향상

NVIDIA Grace에 도입된 4세대 NVLink 인터커넥트 기술은 NVIDIA GPU간에 기록적인 초당 900GB 연결을 제공해 주요 서버 대비 30배 더 높은 총 대역폭을 지원하는데요.

NVIDIA Grace는 DDR4 메모리 대비 2배 큰 대역폭과 10배 더 나은 에너지 효율성을 제공하는 LPDDR5x 메모리 서브시스템을 활용할 예정입니다. 새로운 아키텍처는 단일 메모리 주소 공간으로 통일된 캐시 일관성을 제공하며, 시스템과 HBM GPU 메모리를 결합해 간단한 프로그래밍 기능을 지원합니다.

또한 NVIDIA Grace는 과학자와 연구자들의 발명을 가속화할 수 있도록 NVIDIA HPC 소프트웨어 개발 키트(SDK)와 2,000개 이상의 GPU 애플리케이션을 가속화하는 쿠다 및 쿠다-X 라이브러리 제품군의 지원을 받습니다.

4월 12일부터 16일까지 온라인으로 진행되는 GTC 21에 무료로 등록하고 NVIDIA Grace에 대해 자세히 알아보세요! 지금 GTC21에 등록하세요!