엔비디아, 엔터프라이즈용 생성형 AI 가속화 지원 서버 솔루션 출시

‘엔비디아 AI 레디 서버’로 기업 맞춤형 생성형 AI 구축 지원
by NVIDIA Korea
엔비디아, 엔터프라이즈용 생성형 AI 가속화 지원 서버 솔루션 출시

세계 주요 시스템 제조업체들이 별도로 발표된 VM웨어 프라이빗 AI 파운데이션(VMware Private AI Foundation)을 지원하는 엔비디아 AI 레디 서버(NVIDIA AI-ready)를 제공할 예정입니다! 이 서버는 기업이 독자적인 비즈니스 데이터를 사용해 생성형 AI 애플리케이션을 맞춤화하고 배포할 수 있도록 지원하는데요,

엔비디아 AI 레디 서버에는 엔비디아® L40S GPU, 엔비디아 블루필드-3 (BlueField®-3) DPU, 엔비디아 AI 엔터프라이즈 소프트웨어가 탑재됩니다. 이를 통해 기업들은 생성형 AI 기반 모델을 미세 조정하고 지능형 챗봇, 검색, 요약 도구 등과 같은 생성형 AI 애플리케이션을 구현할 수 있습니다.

엔비디아 L40S 기반 서버는 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo) 등 선도적인 글로벌 시스템 제조업체를 통해 연말 출시를 앞두고 있습니다. 해당 서버는 엔터프라이즈용 생성형 AI 가속화에 활용될 예정입니다.

엔비디아 젠슨 황 CEO는 “새로운 컴퓨팅 시대가 시작되었습니다. 모든 산업 분야의 기업들이 생성형 AI를 도입하기 위해 경쟁하고 있습니다. 엔비디아는 세계 최고의 소프트웨어와 시스템 파트너 생태계를 통해 전 세계 기업들에게 생성형 AI를 제공하고 있습니다”라고 새로운 플랫폼에 대한 기대감을 밝혔습니다.

엔비디아 AI 레디 서버는 엔비디아와 함께 VM웨어 프라이빗 AI 파운데이션을 구축하려는 기업들에게 이상적인 플랫폼입니다.

VM웨어의 CEO인 라구 라구람(Raghu Raghuram)은 “생성형 AI는 디지털 전환을 가속화하고 있으며, 기업은 비즈니스를 발전시킬 수 있는 애플리케이션을 보다 안전하게 구축하기 위해 완전히 통합된 솔루션이 필요합니다. VM웨어, 엔비디아 그리고 서버 제조업체 파트너의 전문성을 결합해 기업은 데이터 프라이버시, 보안, 제어 등을 유지하면서 AI를 개발하고 배포할 수 있습니다.”라고 이번 협업에 대한 소감을 밝혔습니다.

 

기업 내 생성형 AI 혁신 지원

엔비디아 AI 레디 서버는 생성형 AI를 도입하려는 여러 업계에 풀 스택 가속 인프라와 소프트웨어를 제공하도록 설계되었는데요, 여기에는 신약 개발, 유통 제품 설명, 지능형 가상 어시스턴트, 제조 시뮬레이션 등 광범위한 애플리케이션이 해당됩니다.

이 서버에는 엔비디아 AI 플랫폼 운영 체제인 엔비디아 AI 엔터프라이즈가 탑재됩니다. 이 소프트웨어는 LLM을 위한 엔비디아 네모(NeMo), 시뮬레이션을 위한 엔비디아 모듈러스(Modulus), 데이터 사이언스를 위한 엔비디아 래피즈(RAPIDS), 프로덕션 AI를 위한 엔비디아 트리톤 추론 서버(Triton Inference Server)  등 100개 이상의 프레임워크, 사전 훈련된 모델, 툴킷, 소프트웨어에 대한 프로덕션 지원과 보안을 제공합니다.

L40S GPU는 수십억 개의 매개변수가 있는 복잡한 AI 워크로드를 처리하도록 설계되었으며, 4세대 텐서 코어와 FP8 트랜스포머 엔진이 포함됩니다. 이를 통해 1.45페타플롭스 이상의 텐서 처리 성능과 엔비디아 A100 텐서 코어 GPU에 비해 최대 1.7배의 훈련 성능을 제공합니다.

지능형 챗봇, 어시스턴트, 검색, 요약 등과 같은 생성형 AI 애플리케이션의 경우, 엔비디아 L40S는 엔비디아 A100 GPU에 비해 최대 1.2배 더 뛰어난 생성형 AI 추론 성능을 제공합니다.

또한 엔비디아 블루필드 DPU를 통합하면 가상화, 네트워킹, 스토리지, 보안과 기타 클라우드 기반 AI 서비스의 엄청난 컴퓨팅 부하를 가속화, 오프로드 또는 격리해 속도를 더욱 높일 수 있죠.

엔비디아 커넥트X-7 스마트NIC(ConnectX®-7 SmartNIC)는 고급 하드웨어 오프로드와 초저지연을 제공해 데이터 집약적인 생성형 AI 워크로드를 위한 동급 최고 수준의 확장성을 제공합니다.

 

기업의 생성형 AI 도입을 가속화하는 광범위한 생태계

델 파워엣지(PowerEdge) R760xa, 엔비디아와 함께하는 VM웨어 프라이빗 AI 파운데이션을 위한 HPE 프로라이언트(ProLiant) Gen11, 레노버 씽크시스템(ThinkSystem) SR675 V3를 비롯한 세계 주요 컴퓨터 제조업체들이 엔비디아 AI 서버를 구축하고 있습니다.

델 테크놀로지스의 CEO인 마이클 델(Michael Dell)은 “생성형 AI는 혁신을 위한 촉매제로서, 세계에서 가장 시급한 과제를 해결하는 데 도움이 됩니다. 엔비디아 AI 레디 서버가 탑재된 Dell 생성형 AI 솔루션은 전례 없는 수준의 생산성을 높이고 산업 운영 방식을 혁신함으로써 인류의 발전을 앞당기는 데 중요한 역할을 할 것입니다.

HPE의 CEO인 안토니오 네리(Antonio Neri)는 “생성형 AI는 챗봇과 디지털 비서를 지원하는 것부터 새로운 솔루션의 설계와 개발을 지원하는 것까지 기업의 생산성을 새로운 차원으로 끌어올릴 것입니다. 엔비디아와 긴밀히 협력해 다양한 엔터프라이즈 튜닝과 추론 워크로드 솔루션에 GPU와 소프트웨어를 탑재함으로써 생성형 AI의 배포를 가속화할 수 있게 되어 기쁘게 생각하고 있습니다”라고 밝혔습니다.

또한 레노버 CEO인 양 위안칭(Yang Yuanqing)은 “기업들은 지능형 혁신을 위해 생성형 AI를 도입하기를 열망하고 있습니다. 레노버는 엔비디아, VMware와의 협력을 통해 생성형 AI 분야의 리더십을 더욱 확장하고 고객의 AI 여정을 지원하는 데 있어 독보적인 입지를 공고히 하고 있습니다”고 말했습니다.

 

가용성

L40S GPU와 블루필드 DPU가 탑재된 엔비디아 AI 레디 서버는 연말 출시 예정이며, 향후 몇 달 내 클라우드 서비스 제공업체를 통해 인스턴스를 이용할 수 있다.