NVIDIA와 Meta, AI 인프라 구축 위해 나서다

NVIDIA CPU, 네트워킹, 그리고 수백만 대의 Blackwell과 Rubin GPU 기반 대규모 인프라로 메타(Meta)의 AI 로드맵이 지원됩니다.
by NVIDIA Korea

메타(Meta)와 온프레미스와 클라우드를 아우르는 차세대 AI 인프라 구축을 위한 장기 전략적 파트너십을 체결했습니다.

메타는 장기적인 AI 인프라 로드맵 지원을 위해 훈련과 추론에 최적화된 하이퍼스케일 데이터센터를 구축할 예정입니다. 이번 파트너십을 통해 NVIDIA CPU와 수백만 대의 NVIDIA Blackwell, Rubin GPU가 메타의 페이스북 오픈 스위칭 시스템(Facebook Open Switching System) 플랫폼에 대규모로 배포됩니다. NVIDIA Specturm-X™ 이더넷 스위치 역시 함께 통합될 예정인데요.

NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “메타처럼 대규모로 AI를 배포하는 기업은 없습니다. 메타는 최첨단 연구를 산업 규모의 인프라와 통합해 수십억 명의 사용자를 위한 세계 최대 수준의 개인화와 추천 시스템을 제공하고 있죠. 저희는 CPU, GPU, 네트워킹, 소프트웨어 전반에 걸친 긴밀한 공동 설계를 통해 메타 연구진과 엔지니어들이 차세대 AI 혁신을 위한 기반을 구축할 수 있도록 NVIDIA 풀스택 플랫폼을 제공하고 있습니다”고 말했습니다.

메타 창립자 겸 CEO 마크 저커버그(Mark Zuckerberg)는 “NVIDIA와의 협력을 확대해 Vera Rubin 플랫폼을 활용한 최첨단 클러스터를 구축했습니다. 이렇게 전 세계 모든 사람에게 개인 맞춤형 슈퍼 인텔리전스를 제공하게 돼 매우 기쁩니다”고 말했습니다.

NVIDIA CPU 배포 확대로 향상된 성능

NVIDIA와 메타는 데이터센터 프로덕션 애플리케이션에 Arm 기반 NVIDIA Grace™ CPU를 배포하기 위해 지속적으로 협력하고 있습니다. 이는 메타의 장기적인 인프라 전략의 일환으로, 데이터센터 전반에서 전력 대비 성능을 크게 개선하고 있죠.

이번 협력은 NVIDIA Grace 단독 아키텍처의 첫 대규모 배포 사례로, CPU 생태계 라이브러리에 대한 공동 설계와 소프트웨어 최적화 투자를 통해 세대별 전력 대비 성능을 지속적으로 향상시키고 있습니다.

또한 NVIDIA Vera CPU 배포를 위해 협력하고 있으며, 2027년 대규모 배포 가능성을 검토하고 있는데요. 이를 통해 메타의 에너지 효율적인 AI 컴퓨팅 역량을 한층 확장하고, 광범위한 Arm 기반 소프트웨어 생태계 발전을 가속화할 계획입니다.

통합 아키텍처로 메타 AI 인프라 지원

메타는 업계 선도적인 NVIDIA GB300 기반 시스템을 도입하고, 온프레미스 데이터센터와 NVIDIA Cloud Partner(NCP) 배포 환경을 아우르는 통합 아키텍처를 구축할 예정입니다. 이를 통해 운영을 간소화하는 동시에 성능과 확장성을 극대화할 수 있죠.

또한 메타는 인프라 전반에 NVIDIA Spectrum-X 이더넷 네트워킹 플랫폼을 도입해, AI 규모에 최적화된 네트워킹을 제공하고 있습니다. 이를 통해 예측 가능한 저지연 성능을 보장하고, 활용도를 극대화하며, 운영과 전력 효율성을 향상시킬 예정입니다.

왓츠앱을 위한 컨피덴셜 컴퓨팅

메타는 NVIDIA 컨피덴셜 컴퓨팅을 왓츠앱(WhatsApp)의 프라이빗 프로세싱(private processing)에 도입했습니다. 이를 통해 사용자 데이터의 기밀성과 무결성을 보장하는 동시에, 메시징 플랫폼 전반에 AI 기반 기능을 구현할 수 있죠.

이들은 왓츠앱을 넘어 메타 포트폴리오 전반에 NVIDIA 컨피덴셜 컴퓨팅 역량을 확장하기 위해 협력하며, 대규모 프라이버시 강화를 위한 AI를 지원하고 있습니다.

메타 차세대 AI 모델 공동 설계

NVIDIA와 메타의 엔지니어링 팀은 메타의 핵심 워크로드 전반에 걸쳐 최첨단 AI 모델을 최적화하고 가속화하기 위한 심층 공동 설계를 진행하고 있습니다. 이러한 협력은 NVIDIA의 풀스택 플랫폼과 메타의 대규모 프로덕션 워크로드를 결합해, 전 세계 수십억 명이 사용하는 새로운 AI 기능의 성능과 효율성을 향상시키는 것을 목표로 합니다.