지난 3월 엔비디아 GTC 키노트에서 공개된 DGX 클라우드는 AI 슈퍼컴퓨팅 서비스입니다. 엔비디아 DGX 클라우드는 대부분의 기업을 AI 기업으로 전환할 수 있는 툴을 제공하며, 이를 통해 기업은 생성형 AI와 기타 혁신적인 애플리케이션의 사용을 위해 고급 모델을 훈련할 때 필요한 인프라와 소프트웨어에 즉시 액세스할 수 있습니다.
무어 인사이트 & 스트래티지 (Moor Insight & Strategy)의 수석 애널리스티인 팻 무어헤드(Pat Moorhead)는 “생성형 AI는 모든 산업 분야의 선도 기업들에게 신속한 AI 도입을 비즈니스 필수 요소로 만들었으며, 이로 인해 많은 기업이 더욱 가속화된 컴퓨팅 인프라를 찾고 있습니다”고 말했습니다.
글로벌 경영 컨설팅 업체인 맥킨지(McKinsey)는 생성형 AI가 전 세계 산업 전반에 걸친 독점적인 비즈니스 지식을 차세대 AI 애플리케이션으로 전환해 매년 4조 달러 이상의 경제 가치를 창출할 수 있습니다고 전망했습니다.
생성형 AI로 비즈니스 혁신을 주도하는 업계 선구자
생성형 AI는 대부분의 산업에서 활용 가능하며, 초기 선구자들은 이미 시장 전반에 걸쳐 혁신적인 변화를 주도하고 있습니다.
헬스케어 기업은 DGX 클라우드를 사용해 단백질 모델을 생성합니다. 이로써 자연어 처리를 통한 신약 개발과 임상 보고 속도를 높입니다.
금융 서비스 제공업체는 트렌드 예측, 포트폴리오 최적화, 추천 시스템 구축, AI챗봇 개발 등에 DGX 클라우드를 활용합니다.
또한 보험사는 DGX 클라우드로 보험금 청구 처리를 자동화하는 모델을 구축하고 있으며, 소프트웨어 회사는 AI 기반 기능과 애플리케이션을 개발하는 데 DGX 클라우드를 사용하고 있습니다.
이외 다른 기업들도 DGX 클라우드를 통해 AI 팩토리와 주요 자산의 디지털 트윈을 구축하고 있습니다.
즉시 사용 가능한 전용 AI 슈퍼컴퓨팅
DGX 클라우드 인스턴스(instances)는 기업이 월 단위로 임대하는 전용 인프라를 제공합니다. 이를 통해 고객은 수요가 많은 가속 컴퓨팅 리소스를 기다릴 필요 없이 대규모 멀티노드(multi-node) 훈련 워크로드를 빠르고 쉽게 개발할 수 있습니다.
무어헤드는 “엔비디아 DGX 클라우드 출시로 즉각적으로 액세스 가능한 새로운 AI 슈퍼컴퓨팅 리소스 풀을 제공됐다”고 전했습니다.
이러한 AI 슈퍼컴퓨팅에 대한 간단한 접근 방식은 온프레미스(on-premises) 인프라의 획득, 배포, 관리의 복잡성을 제거합니다. DGX 클라우드는 엔비디아 DGX AI 슈퍼컴퓨팅과 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어가 결합된 형태로, 기업들이 어디서나 웹 브라우저를 사용해 자체 AI 슈퍼컴퓨터에 액세스할 수 있도록 지원합니다.
브라우저 기반 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어
DGX 클라우드의 각 인스턴스는 노드당 640GB의 GPU 메모리를 위한 8개의 엔비디아 80GB 텐서 코어(Tensor Core) GPU를 갖추고 있습니다. 고성능, 저지연 패브릭은 상호 연결된 시스템 클러스터에서 워크로드를 확장할 수 있도록 보장해 여러 인스턴스가 하나의 대규모 GPU처럼 작동할 수 있습니다. 여기에 고성능 스토리지가 DGX 클라우드에 통합돼 완전한 솔루션을 제공합니다.
엔비디아 베이스 커맨드 플랫폼(Base Command Platform) 소프트웨어를 사용해 기업들은 DGX 클라우드 훈련 워크로드를 관리하고 모니터링합니다. 이 플랫폼은 DGX 클라우드와 온프레미스 엔비디아 DGX 슈퍼컴퓨터 전반에서 원활한 사용자 경험을 제공하므로 기업은 필요할 때 리소스를 결합할 수 있습니다.
또한 DGX 클라우드에는 엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아 AI 엔터프라이즈가 포함된다. 엔비디아 AI 엔터프라이즈는 데이터 사이언스 파이프라인을 가속화하고 프로덕션 AI의 개발과 배포를 간소화하기 위해 100개 이상의 엔드투엔드 AI 프레임워크와 사전 학습된 모델을 제공합니다.
여기에서 엔비디아 DGX 클라우드에 대한 자세한 내용을 확인할 수 있습니다.