구글 클라우드(Google Cloud)와 파트너십을 확대합니다. 이 파트너십으로 고객을 위한 새로운 AI 인프라와 소프트웨어를 출시할 예정입니다. 소프트웨어는 생성형 AI를 위한 대규모 모델을 구축하고 배포해 데이터 사이언스 워크로드를 가속화합니다.
구글 클라우드 넥스트(Google Cloud Next)에서 엔비디아(NVIDIA) 창립자 겸 CEO인 젠슨 황(Jensen Huang)과 구글 클라우드 CEO인 토마스 쿠리안(Thomas Kurian)의 노변 대담이 이뤄졌습니다. 이번 대담에서는 파트너십을 통해 세계 대규모 AI 고객들에게 엔드투엔드 머신 러닝 서비스를 제공하는 방법과 엔비디아 기술을 기반으로 구축된 구글 클라우드 제품으로 AI 슈퍼컴퓨터를 쉽게 실행할 수 있는 방법에 대해 논의했습니다.
새로운 하드웨어와 소프트웨어 통합은 지난 2년간 구글 딥마인드(DeepMind)와 구글 리서치 팀에서 사용한 것과 동일한 엔비디아 기술을 활용합니다.
젠슨 황은 “우리는 가속 컴퓨팅과 생성형 AI가 결합해 놀라운 속도로 혁신을 가속화하는 전환점에 서 있습니다. 구글 클라우드와의 파트너십 확대로 개발자는 에너지 효율을 높이고 비용을 절감하는 인프라, 소프트웨어와 서비스를 통해 작업을 가속화할 수 있습니다”고 말했습니다.
토마스 쿠리안은 “구글 클라우드는 고객을 위한 혁신을 촉진하고 가속화하기 위해 AI 분야에서 오랜 기간 기술을 혁신해 왔습니다. 구글의 많은 제품이 엔비디아 GPU를 기반으로 구축하고 제공되고 있으며, 많은 고객들이 생성형 AI를 발전시키기 위한 LLM의 효율적인 개발을 위해 엔비디아 가속 컴퓨팅을 찾고 있다”고 언급했습니다.
AI와 데이터 사이언스 개발 속도를 높이기 위한 엔비디아 통합
방대한 대규모 언어 모델(LLM)을 구축하기 위한 구글의 프레임워크인 PaxML은 이제 엔비디아 가속 컴퓨팅에 최적화됐습니다.
기존 PaxML은 여러 구글 TPU 가속기 조각에 걸쳐 구축됐습니다. 하지만 이제 개발자는 PaxML을 통해 엔비디아® H100와 A100 텐서 코어 GPU로 완벽하게 구성 가능한 고급 실험과 확장을 수행할 수 있습니다. GPU에 최적화된 PaxML 컨테이너는 엔비디아 NGC™ 소프트웨어 카탈로그에서 즉시 사용할 수 있습니다. 또한 PaxML은 OpenXLA 컴파일러를 통해 GPU에 최적화된 JAX에서 실행됩니다.
구글 딥마인드와 다른 구글 리서치 연구원들은 탐색적 연구를 위해 엔비디아 GPU와 함께 PaxML을 사용한 최초의 기업 중 하나입니다.
PaxML에 최적화된 엔비디아 컨테이너는 엔비디아 NGC 컨테이너 레지스트리(container registry)에서 즉시 사용할 수 있습니다. 이 컨테이너는 차세대 AI 기반 애플리케이션을 구축하는 전 세계 연구자, 스타트업, 기업을 대상으로 합니다.
아울러 양사는 구글의 데이터프록(Dataproc) 서비스를 통해 구글의 서버리스 스파크(Spark)와 엔비디아 GPU를 통합한다고 발표했습니다. 이를 통해 데이터 사이언티스트는 아파치 스파크(Apache Spark) 워크로드를 가속화해 AI 개발을 위한 데이터를 준비할 수 있습니다.
한편, 이번 새로운 통합은 엔비디아와 구글 파트너십 역사 중 가장 최근 발표입니다. 올해 이뤄진 하드웨어와 소프트웨어 발표는 다음과 같습니다:
- 구글 클라우드, 엔비디아 H100 기반 A3 가상 머신 — 구글 클라우드는 엔비디아 H100 GPU로 구성된 전용 구글 클라우드 A3 가상 머신(VM)을 발표했습니다. 이를 통해 다양한 워크로드에서 엔비디아의 AI 플랫폼에 더 쉽게 액세스할 수 있습니다. A3 VM은 이전 세대에 비해 3배 빠른 훈련과 대폭 향상된 네트워킹 대역폭을 제공합니다. 이는 다음 달에 공식 출시될 예정입니다.
- 구글 클라우드 버텍스(Vertex) AI 플랫폼을 지원하는 엔비디아 H100 GPU — 향후 몇 주 내 버텍스AI에서 H100 GPU를 사용할 수 있을 것으로 예상됩니다. 이를 통해 고객은 셍성형 AI LLM을 빠르게 개발할 수 있습니다.
- 구글 클라우드, 엔비디아 DGX™ GH200에 액세스 권한 획득 — 구글 클라우드는 세계 최초로 엔비디아 DGX GH200 AI 슈퍼컴퓨터를 통해 생성형 AI 워크로드에 대한 성능을 탐색할 수 있는 기업이 될 예정입니다. 엔비디아 DGX GH200은 엔비디아 그레이스 호퍼(Grace Hopper)™ 슈퍼칩을 기반으로 합니다.
- 구글 클라우드에 출시되는 엔비디아 DGX 클라우드 — 고객은 웹 브라우저에서 직접 엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅과 소프트웨어를 사용할 수 있습니다. 이로써 고객에게 고급 훈련 워크로드를 위한 속도와 확장성을 제공합니다.
- 구글 클라우드 마켓플레이스(Marketplace)의 엔비디아 AI 엔터프라이즈 — 사용자는 엔비디아 AI 엔터프라이즈(Enterprise)에 액세스할 수 있습니다. 엔비디아 AI 엔터프라이즈는 엔터프라이즈용 애플리케이션 개발과 배포를 간소화하는 안전한 클라우드 네이티브 소프트웨어 플랫폼입니다. 엔터프라이즈용 애플리케이션에는 생성형 AI, 음성 AI, 컴퓨터 비전 등이 포함됩니다.
구글 클라우드, 엔비디아 L4 GPU 최초 제공 — 올해 초, 구글 클라우드는 G2 VM을 출시하면서 엔비디아 L4 텐서 코어(Tensor Core) GPU를 제공하는 최초의 클라우드 제공업체가 됐습니다. 고객은 AI 비디오 워크로드를 위해 CPU에서 L4 GPU로 전환해 최대 120배 더 높은 성능과 99% 더 나은 효율성을 실현할 수 있습니다. L4 GPU는 이미지와 텍스트 생성, VDI, AI 가속 오디오와 비디오 트랜스코딩에 다양하게 사용됩니다.