엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

엔비디아 OVX, 훈련과 추론, 그래픽 집약적 워크로드 가속화 위해 새로운 GPU 지원
by NVIDIA Korea
엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

엔비디아® L40S GPU를 탑재한 엔비디아 OVX™ 서버가 공개되었습니다! 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse)™ 플랫폼을 통해 AI 훈련과 추론, 3D 디자인과 시각화, 비디오 처리, 산업 디지털화 등 가장 컴퓨팅 집약적이고 복잡한 애플리케이션을 가속화하도록 설계된 강력하고 범용적인 데이터센터 프로세서입니다.

엔비디아 L40S GPU는 텍스트, 이미지, 동영상 생성, 챗봇, 게임 개발, 제품 디자인, 의료 등 산업 전반의 워크플로우와 서비스를 혁신하는 생성형 AI를 위한 가속화된 컴퓨팅 워크로드를 지원합니다.

엔비디아의 프로페셔널 비주얼라이제이션(professional visualization) 부문 부사장인 밥 피트(Bob Pette)는 “생성형 AI가 모든 산업을 혁신함에 따라 기업들은 데이터센터에 대규모 컴퓨팅 리소스를 점점 더 많이 찾고 있습니다. 엔비디아 L40S GPU가 탑재된 OVX 시스템은 AI, 그래픽과 영상 처리 워크로드를 가속화하고 계속해서 더 복잡하고 다양해지는 애플리케이션의 까다로운 성능 니즈를 충족합니다.”라고 이번 새로운 GPU에 대한 소감을 밝혔습니다.

AI, 그래픽을 위한 강력한 성능

엔비디아 OVX 시스템은 서버당 최대 8개의 엔비디아 L40S GPU를 지원하며, 각각 48GB의 메모리가 장착되어 있습니다. L40S는 엔비디아 에이다 러브레이스(Ada Lovelace) GPU 아키텍처를 기반으로 하는데요, 여기에는 4세대 텐서 코어(Tensor Cores)와 FP8 트랜스포머 엔진(Transformer Engine)이 포함돼 있어 1.45페타플롭스 이상의 텐서 처리 성능을 제공합니다. 수십억 개의 매개변수와 텍스트, 영상과 같은 여러 데이터 양식이 포함된 복잡한 AI 워크로드의 경우, L40S는 엔비디아 A100 텐서 코어 GPU에 비해 최대 1.2배의 생성 AI 추론 성능과 최대 1.7배의 훈련 성능을 제공합니다.

엔비디아 L40S GPU에는 212테라플롭의 레이 트레이싱 성능을 제공하는 142개의 3세대 RT 코어가 포함돼 있습니다. 실시간 렌더링, 제품 디자인, 3D 콘텐츠 제작과 같은 고충실도 전문 시각화 워크플로우를 지원하기 위함인데요, 이를 통해 크리에이티브 전문가들은 몰입감 넘치는 시각적 경험과 사실적인 콘텐츠를 제작할 수 있습니다.

더불어 엔지니어링, 과학 시뮬레이션과 같이 계산이 까다로운 워크플로우를 위해 엔비디아 L40S에는 18,176개의 쿠다(CUDA)® 코어가 포함되었습니다. 이는 복잡한 계산과 데이터 집약적인 분석을 가속화할 수 있도록 엔비디아 A100 GPU보다 약 5배 높은 단정밀도 부동소수점(FP32) 성능을 제공한답니다.

조기 채택 사례들

대규모 GPU 가속 워크로드에 특화된 코어위브(CoreWeave)는 L40S 인스턴스를 제공한 최초의 클라우드 서비스 제공업체 중 하나입니다.

코어위브 최고기술책임자(CTO)인 브라이언 벤투로(Brian Venturo)는 “생성형 AI가 폭발적으로 증가함에 따라 업계 전반의 고객들은 인터랙티브 영상부터 AI 설계와 자동화에 이르기까지 모든 워크로드의 복잡성에 맞는 강력한 컴퓨팅 제품과 규모를 찾고 있습니다. 엔비디아 L40S GPU는 저희의 광범위한 엔비디아 솔루션 포트폴리오를 더욱 확장할 것입니다. 코어위브는 차세대 생성형 AI 애플리케이션을 지원하는 빠르고 효율적이며 비용 효율적인 가속 컴퓨팅을 위해 새로운 리소스를 제공하는 최초의 전문 클라우드 제공업체가 될 것입니다”이라고 포부를 밝혔습니다.

AI를 강화하는 소프트웨어

L40S GPU를 사용하는 기업은 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어의 주요 업데이트 이점을 누릴 수 있습다. 이 소프트웨어는 시뮬레이션을 위한 엔비디아 모듈러스(Modulus), 데이터 사이언스를 위한 엔비디아 래피즈(RAPIDS)™, 프로덕션 AI를 위한 엔비디아 트리톤 추론 서버(Triton™ Inference Server) 등 100개 이상의 프레임워크, 사전 훈련된 모델, 툴킷, 소프트웨어에 대한 프로덕션 지원과 보안을 제공합니다.

옴니버스 확장

더불어 옴니버스 플랫폼의 주요 업데이트들이 함께 발표되었는데요, 여기에는 개발자가 생성형 AI의 강력한 성능으로 오픈USD 파이프라인과 산업 디지털화 애플리케이션을 가속화하고 발전시킬 수 있는 기능과 플랫폼 개선 사항이 포함됩니다. 옴니버스 클라우드를 구동하는 차세대 엔비디아 OVX 시스템에는 L40S GPU가 탑재돼 생성형 AI 파이프라인과 옴니버스 워크로드를 강화하는 데 필요한 AI와 그래픽 성능을 제공할 예정입니다.

가용성

엔비디아 L40S는 올 가을부터 출시될 예정인데요, 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), HPE, 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro)로 등 글로벌 시스템 제조업체들이 엔비디아 L40S GPU가 포함된 OVX 시스템을 제공할 예정입니다. 이러한 서버는 전 세계 전문가들이 AI를 발전시키고 지능형 챗봇, 검색, 요약 도구와 같은 생성형 AI 애플리케이션을 산업 전반의 사용자에게 제공할 수 있도록 지원할 예정입니다.