AI 인프라 및 고성능 컴퓨팅용으로 설계된 NVIDIA 최초의 Arm 네오버스(Neoverse) 기반 전용 데이터센터 CPU가 공개됐습니다. 이 CPU는 고성능과 오늘날 주요 서버 칩 대비 2배에 이르는 메모리 대역폭과 에너지 효율을 제공합니다.
NVIDIA Grace CPU 슈퍼칩은 NVLink®-C2C를 통해 일관성 있게 연결된 두 개의 CPU 칩으로 구성되어 있습니다. NVLink®-C2C는 새로운 고속, 저지연, 칩 투 칩 인터커넥트입니다.
Grace CPU 슈퍼칩은 지난해 발표된 NVIDIA 최초의 CPU-GPU 통합 모듈인 Grace Hopper Superchip을 보완합니다. Grace Hopper 슈퍼칩은 NVIDIA Hopper 아키텍처 기반의 GPU와 함께 대규모 HPC 및 AI 애플리케이션을 지원하도록 설계됐는데요. 두 슈퍼칩은 NVLink와 동일한 기본 CPU 설계와 NVLink-C2C 인터커넥트를 공유합니다.
NVIDIA 설립자 겸 CEO인 젠슨 황(Jensen Huang)은 “새로운 유형의 데이터센터가 등장했습니다. 이는 바로 대량의 데이터를 처리, 가공해 인텔리전스를 제공하는 AI 공장입니다. Grace CPU 슈퍼칩은 최고의 성능, 메모리 대역폭, NVIDIA 소프트웨어 플랫폼을 하나의 칩으로 제공하여 세계 AI 인프라의 CPU로서 빛날 것”이라고 말했습니다.
NVIDIA의 CPU 플랫폼 발표
최고의 성능을 제공하기 위해 Grace CPU 슈퍼칩은 144 Arm 코어를 단일 소켓에 탑재하여, SPECrate®2017_int_bas 벤치마크에서 업계 최고의 예상 성능인 740을 제공합니다.(1) 이는 현재 DGX A100에 탑재된 듀얼 CPU에 비해 1.5배 이상 높은 수치로, NVIDIA의 연구소에서 같은 등급의 컴파일러를 탑재한 것으로 추정됩니다.(2)
또한 Grace CPU 슈퍼칩은 속도와 소비 전력의 최적의 균형을 위해 LPDDR5x 메모리로 구성된 혁신적인 메모리 서브시스템을 통해 업계 최고의 에너지 효율과 메모리 대역폭을 제공합니다. LPDDR5x 메모리 서브시스템은 기존 DDR5 설계의 2배의 대역폭을 초당 1테라바이트로 제공하며, 메모리를 포함한 전체 CPU의 소비전력은 500와트에 불과합니다.
Grace CPU 슈퍼칩은 최신 데이터센터 아키텍처인 Arm®v9를 기반으로 합니다. Grace CPU 슈퍼칩은 최고 수준의 싱글 스레드 코어 성능과 Arm의 새로운 세대의 벡터 확장을 지원하는 기능을 결합하여 많은 애플리케이션에 즉각적인 이점을 제공하죠.
Grace CPU 슈퍼칩은 NVIDIA RTX, NVIDIA HPC, NVIDIA AI 및 Omniverse를 포함한 NVIDIA의 모든 컴퓨팅 소프트웨어 스택을 실행합니다. Grace CPU 슈퍼칩과 NVIDIA ConnectX-7 NIC는 독립 CPU 전용 시스템 또는 1개, 2개, 4개 또는 8개의 호퍼 기반의 GPU를 탑재한 GPU 엑셀러레이티드 서버로 구성할 수 있는 융통성을 갖추고 있는데요. 고객은 단일 소프트웨어 스택을 유지하면서 특정 워크로드에 대한 성능을 최적화할 수 있습니다.
AI, HPC, 클라우드 및 하이퍼스케일 애플리케이션 전용 설계
Grace CPU 슈퍼칩은 최고의 퍼포먼스, 메모리 대역폭, 에너지 효율 및 구성성을 갖춘 가장 까다로운 HPC, AI, 데이터 분석, 과학 컴퓨팅 및 하이퍼스케일 컴퓨팅 애플리케이션에서 탁월한 성능을 발휘합니다.
Grace CPU 슈퍼칩은 144개의 코어와 1TB/s의 메모리 대역폭을 갖추고 있어 CPU 기반의 고성능 컴퓨팅 애플리케이션에서 전례 없는 성능을 발휘합니다. HPC 어플리케이션은 처리 부하가 높기 때문에 높은 성능의 코어, 최고의 메모리 대역폭과 코어당 적절한 메모리 용량이 요구됩니다.
NVIDIA는 Grace CPU 슈퍼칩을 위해 주요 HPC, 슈퍼컴퓨팅, 하이퍼스케일 및 클라우드 고객과 협력하고 있습니다. Grace CPU 슈퍼칩과 Grace Hopper 슈퍼칩 모두 2023년 상반기에 출시될 예정입니다.
Grace CPU 슈퍼칩에 대한 자세한 내용은 GTC에 무료 등록 후 NVIDIA CEO 젠슨 황(Jensen Huang)의 GTC 2022 키노트와 다양한 세션에서 확인할 수 있습니다.
(1) www.spec.org
(2) Pre-silicon Grace projection compared against SPEC CPU® 2017 compiled on GCC 10 with “-march=native -O3 -ffast-math -funroll-loops -flto” and run on production AMD EPYC™ 7742 systems, yielding a final estimated SpecRate2017_int_base score of 460 for a dual-socket design.”