AI 에이전트를 위한 NVIDIA Vera CPU 공개

글로벌 기술 선도 기업들이 AI 에이전트를 위해 설계된 최초의 CPU인 NVIDIA Vera 도입을 계획하고 있습니다.

NVIDIA Vera는 현재 본격 양산 단계에 진입한 차세대 프로세서입니다. x86 CPU 대비 작업 완료 속도를 1.8배 향상시켜 에이전틱 AI, 강화학습, 데이터 처리 등 다양한 산업 분야의 워크로드를 지원해 데이터센터의 토큰 수익을 증대합니다.

현재까지 약 250만 대가 출하된 NVIDIA Grace^TM CPU의 성공을 기반으로 Vera는 CPU 성능과 에너지 효율성을 새로운 차원으로 끌어올립니다. 에이전트가 단순한 질문 답변을 넘어 행동하고, 코드를 실행하며, 도구를 사용하고, 결과를 평가하는 등 최신 데이터센터의 가장 까다로운 AI 워크로드 환경에서 말이죠.

다양한 금융 업계 선도기업, 글로벌 AI 연구소, 하이퍼스케일러가 Vera CPU 도입을 검토하고 있으며, 여기에는 뉴욕증권거래소(NYSE), 앤트로픽(Anthropic), 오픈AI(OpenAI), 스페이스XAI(SpaceXAI), 바이트댄스(ByteDance), 코어위브(CoreWeave), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI) 등이 포함됩니다.

NVIDIA 젠슨 황 CEO는 “AI 에이전트가 컴퓨팅 자원의 최대 수요자가 될 것입니다. Vera는 이러한 미래를 위해 설계된 최초의 CPU로, 탁월한 성능, 효율성과 프로그래밍 유연성을 바탕으로 하이퍼스케일 환경에서 에이전틱 AI를 구동하도록 설계됐습니다”라고 말했습니다.

뉴욕증권거래소 그룹 사장인 Lynn Martin은 “뉴욕증권거래소는 독보적인 인프라의 기반이 되는 시스템의 지연 시간, 처리량, 신뢰성을 최적화하는 데 집중하고 있습니다. 뉴욕증권거래소는 하루에 1조 1천억 건 이상의 메시지를 처리하죠. 레드판다(Redpanda), HPE와 협력해 NVIDIA Vera CPU를 활용함으로써, 용량을 확장하는 동시에 지연 시간을 최적화하고, 고성능의 유연한 AI 기반 시장 인프라를 구축할 것”이라고 밝혔습니다.

클로드(Claude)를 개발한 AI 혁신 기업 앤트로픽은 CPU 집중형 에이전틱 워크로드를 확장하기 위해 Vera 도입을 검토 중입니다.

앤트로픽 컴퓨팅 부문 책임자인 James Bradbury는 “컴퓨팅 성능의 확장은 모델 성장에 있어 중요한 촉진제입니다. 에이전틱 워크로드를 해결하는 과정에서 Vera가 생태계의 유망한 구성 요소로 부상하는 것을 지켜보게 돼 매우 기쁩니다”라고 말했습니다.

NVIDIA Vera를 기반으로 한 OCI 슈퍼클러스터(Supercluster)는 하이퍼스케일 AI 슈퍼컴퓨팅의 새로운 시대를 열고 있습니다.

OCI 수석 부사장인 Mahesh Thiagarajan은 “OCI는 훈련, 추론, 에이전틱 AI에 대한 급증하는 수요를 충족하기 위해 AI 인프라를 빠르게 확장하고 있습니다. NVIDIA Vera CPU를 도입함으로써 OCI는 차세대 AI 환경 전반에서 높은 처리량의 추론과 데이터 처리 워크로드를 지원할 것”이라고 설명했습니다.

포로닉스(Phoronix)의 오픈소스 벤치마크 결과에 따르면, NVIDIA Vera는 코드 컴파일, 파이썬(Python), 자바(Java), 데이터베이스 처리를 포함한 에이전틱 워크로드 전반에서 가장 빠른 종합 성능을 보였습니다. 이러한 워크로드는 에이전트 도구 사용과 샌드박스 실행 등 최신 AI 인프라의 핵심 단계에 속하는데요. 빠른 CPU 성능은 더욱 높은 에이전트 처리량과 상호작용을 제공합니다.

에이전트 시대를 위한 맞춤형 CPU

AI 팩토리의 경제성은 코어(core) 중심에서 토큰(token)당 비용 중심으로 전환되고 있습니다. 따라서 에이전트 작업, 데이터 처리, 오케스트레이션을 더 빠르고 효율적으로 수행할 수 있는 CPU가 필요하죠.

Vera는 NVIDIA의 맞춤형 CPU 코어인 Olympus를 기반으로 설계돼, 파이썬 런타임, 샌드박스 코드 실행, 오케스트레이션 로직, 분석 파이프라인 등의 전환을 뒷받침하는 CPU 작업을 지원합니다.

Vera는 더 많은 명령어를 처리하고, 애플리케이션 동작을 예측하며, 수많은 동시 실행 환경, 쿼리, 데이터 처리 작업 간에 데이터를 이동하도록 설계됐습니다. Vera는 88개의 올림푸스 코어, 공간적 멀티스레딩(Spatial Multithreading) 기술, 최대 1.2TB/s 대역폭의 LPDDR5X 메모리 서브시스템을 탑재했죠. 이를 통해 에이전트는 CPU 병목 현상이 발생하는 단계에서 지연 시간을 줄일 수 있으며, AI 팩토리는 가속기를 지속적으로 가동할 수 있습니다.

Vera CPU는 독립형 CPU 인프라부터 긴밀하게 결합된 가속 시스템까지 AI 팩토리 전반에 도입할 수 있습니다. 또한 AI 팩토리가 더 높은 엔드투엔드 처리량과 더 빠른 솔루션을 제공하도록 지원하고, 훈련, 추론, 에이전트 실행 전반에 걸쳐 응답성과 효율성을 향상시키죠.

Vera는 2세대 NVIDIA NVLink^TM-C2C 인터커넥트 기술을 통해 NVIDIA Vera Rubin 플랫폼의 호스트 CPU 역할을 수행합니다. 이 기술은 CPU와 GPU 간 최대 1.8TB/s의 코히어런트 대역폭을 제공하죠. 또한 랙 규모로 NVIDIA 컨피덴셜 컴퓨팅(Confidential Computing)을 확장해 에이전틱 워크로드를 보호합니다.

NVIDIA Vera BlueField-4 STX 프로세서는 Vera를 고성능 네트워킹, 스토리지 가속화, 온칩 보안 기능과 통합해 설계 단계부터 보안을 고려한 AI 네이티브 데이터 플랫폼을 구축합니다.

광범위한 생태계 지원

Vera CPU는 대규모 에이전틱 AI와 강화학습 환경을 위한 고밀도 수냉식 랙과 엔터프라이즈, 클라우드, 데이터 처리, AI 팩토리 구축을 위한 유연한 2소켓 공랭식 시스템으로 제공됩니다.

Vera CPU 기반 시스템을 제공하는 주요 인프라 공급업체는 에이브레스(Aivres), 애즈락 랙(ASRock Rack), 에이수스(ASUS), 컴팔(Compal), 델(Dell), 폭스콘(Foxconn), 기가바이트(GIGABYTE), HPE, 하이브 솔루션스(Hyve Solutions), 인벤텍(Inventec), 레노버(Lenovo), 미텍 컴퓨팅(MiTAC Computing), MSI, 페가트론(Pegatron), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology, QCT), 슈퍼마이크로(Supermicro), 위스트론(Wistron), 위윈(Wiwynn) 등이 있습니다. 주요 OEM 업체인 델, HPE, 레노버, 슈퍼마이크로는 x86을 넘어서는 최초의 표준 CPU인 Vera를 독립형 CPU 서버 구성으로 제공할 예정입니다.

Vera CPU 도입 예정인 주요 클라우드 서비스 제공업체로는 아카마이(Akamai), 바이트댄스, 클라우드플레어(Cloudflare), 코어위브, 크루소(Crusoe), 람다, 네비우스, 엔스케일, OCI, 레드판다, 스타버스트(Starburst), 투게더 AI(Together AI), 벌처(Vultr) 등이 있습니다.

출시 정보

Vera 시스템은 올해 가을부터 시스템 제조사와 클라우드 파트너사를 통해 공급될 예정입니다.

NVIDIA GTC Taipei에서 젠슨 황 CEO의 키노트를 시청하고 자세한 내용을 확인해 보세요.