엔비디아 DGX 기반 플랫폼, 데이터 모델의 플레이 그라운드가 되다!

NVIDIA DGX 기반 서비스형 플랫폼이 데이터 사이언스와 애플리케이션 개발 그리고 IT 운영까지 잇는 가교를 제공합니다
by NVIDIA Korea

인공지능(AI) 사업을 추진하는 수많은 기업들이 데이터에서 통찰력을 도출해 애플리케이션을 만들기까지 데이터 사이언스에 대한 전문지식을 활용하는 것만으로는 부족하다는 사실을 실감하고 있습니다.

NVIDIA는 기업 내 AI 모델을 더 많이 생산할 수 있도록 지원하기 위해 디지털 리얼티(Digital Realty)社와 코어 사이언티픽(Core Scientific) 社와 협력하고 있습니다.

증가하는 모델 부채(Model Debt) 문제

기업들은 종종 몇 주 만에 가치 있는 AI 모델을 개발하더라도 몇달 동안 시제품으로만 남겨져 그 가치가 떨어지는 걸 경험하게 되는데요. 그 이유는 무엇일까요?

첫번째 이유는 비즈니스 문제를 해결하기 위해 설계된 AI 모델이 기존 소프트웨어처럼 구축되거나 배포된 것이 아니라는 데 있습니다. 그래서 배포되지 않은 모델에 투입된 투자와 리소스 영역에서 모델 부채(model debt)가 증가합니다.

모델 개발은 데이터 준비, 모델 프로토타이핑, 훈련과 추론을 위한 파이프라인 등의 복잡한 과정을 거칩니다. 소프트웨어 엔지니어링이나 플랫폼 확장성에 대한 설계보다도 아니라 알고리즘을 우선으로 고려해 데이터 사이언스 ‘기술자’가 모델을 개발하게 되는겁니다.

데이터 사이언티스트가 만드는 건 AI 모델이자 웹 서비스를 통합한 것이라고 볼 수 있는데요.

AI 모델을 평가한다는 건 단순히 합격이냐 불합격이냐를 판단하는 차원과는 다릅니다. 모델 정확도는 떨어질 수도 있고 소프트웨어보다 뒤쳐지는 속도가 훨씬 빨라서, 데이터 사이언티스트는 모델 정확도를 지속적으로 모니터링하고 재훈련해야 하죠.

MLOps과 PlatformDigital로 AI 개발 산업화

수많은 기업들이 MLOps(머신러닝 모델 개발과 시스템 운영을 통합하는 것)라고도 불리는 접근법과 엔터프라이즈급 플랫폼을 통해 AI 개발 파이프라인을 상업화하기 위해 고민해 왔는데요. 기업들이 더 많은 AI 모델을 생산할 수 있도록 NVIDIA가 Digital Realty 와 Core Scientific 회사와 협력합니다.

NVIDIA DGX A100 기반으로 Digital Realty의  PlatformDigital 에서 MLOps용 Core Scientific Plexus 소프트웨어를 실행하면 개발단계에서 배포단계까지의 AI 생명주기를 향상시킬 수 있습니다. 고도화된 프로세스를 통해 AI 모델 개발과 배포를 가속화하고 표준 엔터프라이즈 IT 운영에 통합할 수 있습니다.

PlatformDigital 플랫폼은 데이터 사이언스와 MLOps를 효율적이고 관리가능한 프로세스로 통합해 많은 AI 모델이 단지 시제품에 머물지 않고 생산단계로 넘어가도록 돕습니다.

NVIDIA DGX A100에서 실행되는 PlatformDigital은 AI 개발에 최적화된 인프라를 제공합니다. 데이터 분석, 훈련, 추론 등 모든 작업에 적합한 리소스를 제공해주죠. 또한 이터레이션 주기도 단축시키기 때문에 실험 결과를 오래 기다릴 필요가 없습니다.

Plexus AI 워크플로우 관리도구를 활용해 기업은 사용자, 데이터세트, 모델 버전, 실험을 관리할 수 있어서, AI 모델을 테스트 단계에서 생산단계로 신속하게 진행시킬 수 있습니다.

PlatformDigital는 데이터 사이언티스트와 DevOps 간의 작업자 변경을 간소화해주는 동시에 관리용이성과 책임성도 확보해주죠. 또한 모델의 드리프트(drift)를 평가하는 생명주기를 생성해 모델을 새로운 데이터로 지속적으로 재훈련시켜줍니다.

DGX POD기반 AI 서비스형 플랫폼(PaaS)

PlatformDigital은 NVIDIA DGX POD로 구성된 DGX A100인프라와 MLOps 소프트웨어가 결합된 관리형 서비스 오퍼링 중 하나입니다.

DGX-Ready 소프트웨어 프로그램에서 지원하는 PlatformDigital 오퍼링은 데이터 사이언스팀과 기업 IT를 연결하는 AI 서비스형 플랫폼(PaaS)을 제공합니다. 새로운 오퍼링을 사용해 기업은 DGX 시스템에서 성능, 사용 용이성, 생산성을 그 어느때보다도 쉽게 경험할 수 있으며, 현재 비용 효과적이고 확장가능한 모델로 이용 가능합니다.

PlatformDigital로 AI 가속화하는 방법은 Digital Realty 홈페이지에서 자세하게 확인하실 수 있습니다.