새로 출시된 NVIDIA L4 GPU와 구글 클라우드(Google Cloud)의 버텍스(Vertex) AI를 통합합니다. 이는 구글 클라우드가 빠르게 확장되고 있는 생성형 AI 애플리케이션 구축 작업을 더욱 가속화하기 위해서입니다.
프라이빗 프리뷰에서 G2 가상 머신을 제공한다고 발표한 구글 클라우드는 NVIDIA L4 Tensor Core GPU를 제공하는 최초의 클라우드 서비스 제공업체(CSP)가 됐는데요. 대규모 생성형 AI 모델의 구축, 조정, 배포를 지원하는 버텍스 AI에서 최적화된 지원과 함께 L4 GPU를 제공할 예정입니다.
개발자는 새로운 애플리케이션을 신속하고 비용 효율적으로 실행하는 데 도움이 되는 최첨단 기술에 액세스할 수 있습니다. NVIDIA L4 GPU는 모든 워크로드를 위한 범용 GPU로, L4 GPU의 향상된 AI 비디오 기능은 CPU 대비 120배 높은 AI 기반 비디오 성능과 99% 개선된 에너지 효율성을 제공합니다.
NVIDIA의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “생성형 AI에 대한 관심이 급증하면서 많은 기업들이 비즈니스 모델 지원을 위해 클라우드 기반 컴퓨팅으로의 전환을 고려하고 있습니다. NVIDIA는 구글 클라우드와의 협력을 통해, 기업들이 필요한 기능을 쉽게 사용할 수 있게 지원하여 멋진 툴과 애플리케이션 개발이 가속화되도록 돕습니다”고 말했죠.
구글 클라우드의 시스템 및 서비스 인프라 부문 부사장 아민 바닷(Amin Vahdat)은 “생성형 AI는 컴퓨팅의 속도, 확장성, 안정성을 요구하는 새로운 시대를 열었습니다. 이 모든 요소는 구글 클라우드에서 제공받을 수 있습니다. 고객들이 생성형 AI의 가능성을 탐색하기 시작함에 따라, 워크로드에 최적화된 구글 컴퓨트 엔진(Google Compute Engine) 포트폴리오의 일부로 최신 NVIDIA L4 GPU 혁신을 제공하게 된 것을 자랑스럽게 생각합니다”라고 말했습니다.
새로운 생성형 AI 애플리케이션 개발 지원
구글 클라우드는 생성형 AI 애플리케이션을 제공하는 다양한 기업을 위한 인프라를 제공합니다. 대부분의 생성형 AI는 전문가들이 업무를 더 빠르고 효율적으로 수행할 수 있도록 설계됐죠. 애플리케이션의 성공적인 실행에 있어 신속한 추론이 핵심적인 역할을 합니다.
또한 생성형 AI는 사람들을 연결하고 즐거운 시간을 보낼 수 있도록 도와주는 수많은 새로운 앱의 탄생을 촉진하고 있습니다. AI 기반 텍스트 투 디지털아트(text to digital art) 변환 앱인 드림(Dream)을 제공하는 웜보(WOMBO)는 구글 클라우드에서 NVIDIA L4 추론 플랫폼에 대한 얼리 액세스를 이용하고 있습니다.
웜보 CEO 벤-시온 벤킨(Ben-Zion Benkhin)은 “웜보는 최신 AI 기술을 통해 사용자가 프롬프트로 몰입형 디지털 아트워크를 만들 수 있게 하므로, 누구나 아이디어만 있다면 어떤 스타일로든 고품질의 사실적인 아트를 만들 수 있습니다. NVIDIA L4 추론 플랫폼을 기반으로 특별한 작품을 만들고 공유하려는 사용자에게 더 탁월하고 효율적인 이미지 생성 경험을 제공할 수 있을 것”이라고 말했습니다.
디스크립트(Descript)는 크리에이터가 불필요한 단어를 제거하고 자막을 추가하며 몇 번의 클릭만으로 소셜 미디어 클립을 만들 수 있는 AI 기반 편집 기능을 제공합니다. 또한 디스크립트의 생성형 AI 음성 복제 기능을 사용하면 타이핑만으로 오디오 실수를 수정하고 전체 보이스오버 트랙을 만들 수도 있죠.
디스크립트의 CEO 앤드류 메이슨(Andrew Mason)은 “디스크립트는 NVIDIA TensorRT를 통해 모델을 최적화하고 AI 추론을 가속화합니다. 사용자는 비디오 배경을 바꾸고 음질을 향상하여 스튜디오 없이도 스튜디오 품질의 콘텐츠를 제작할 수 있습니다”라고 말했습니다.
출시 정보
NVIDIA L4 GPU는 구글 클라우드에서 비공개 프리뷰로 제공됩니다. 여기에서 액세스를 신청할 수 있습니다.
젠슨 황이 소개하는 생성형 AI용 NVIDIA 추론 플랫폼과 구글 클라우드의 통합에 대한 내용이 담긴 GTC 키노트를 여기에서 시청하세요.