하이브리드 클라우드 환경에서 AI를 활용하는 방법

NVIDIA DGX 시스템 기반의 Google Cloud를 사용하는 기업은 급증하는 수요에 유연하게 대응할 수 있습니다
by NVIDIA Korea

클라우드로 갈까 아니면 온프레미스에 남을까? AI 인프라를 구축할 때 많은 기업이 묻는 질문입니다.

클라우드는 개발자가 최소한의 비용으로 신속하게 프로젝트를 시작할 수 있도록 지원합니다. 처음 시작하는 프로젝트와 상시적인 수요에 대처하는데 매우 좋죠.

그러나 비즈니스가 AI 모델을 반복하고 더 방대한 데이터 세트를 처리할수록 더 많은 컴퓨팅 사이클이 요구됩니다. 데이터를 처리하는 비용은 더 늘어나고, 대규모 데이터셋에 컴퓨팅 리소스를 할당하는 것에 많은 시간이 소요됩니다.

이는 AI 개발에 대한 추진력 하락으로 이어지는데요. 이 때 기업은 온프레미스 인프라에 대한 운영 비용의 한계를 깨닫게 됩니다. 이러한 비용의 문제는 클라우드 사용량으로 보완해 해결할 수 있는데요. 이를 통해 데이터셋을 클라우드에서 생성하고 클라우드에서 저장해 해당 데이터가 필요로 하는 컴퓨팅 리소스를 유연하게 할당할 수 있게 됩니다.

온프레미스와 클라우드 환경 전반에서 기업은 방대한 데이터를 구동하고 컴퓨팅 리소스를 유연하게 조정함으로써 운영 비용에 큰 영향을 미치는 데이터 처리 비용을 최소화할 수 있습니다.

하이브리드 클라우드의 이점을 최대로 활용하기

하이브리드 클라우드 환경을 도입한 기업은 아마 익숙한 궤적을 따라갈 겁니다.

예를 들어 이미지 인식 애플리케이션을 개발하는 한 고객은 클라우드 환경의 신속하고 빠르게 개발을 시작할 수 있었는데요.

이전에는 수백만 개의 이미지로 이루어진 데이터베이스가 증가함에 따라 비용이 증가하고 처리 속도가 느려져 데이터 사이언티스트가 모델을 그때마다 수정했었습니다. 이러한 비용의 변곡점에서 이 기업은 워크로드를 온프레미스 NVIDIA DGX 시스템으로 마이그레이션 했습니다. 이를 통해 신속하게 AI 훈련을 진행할 수 있었고, 이것은 클라우드로 가는 여정을 쉽게 열어주었습니다.

“온프레미스를 기반으로 하세요. 그리고 갑작스러운 비용 증가에는 클라우드로 피신하세요”라는 말은 이러한 상황을 정확히 포착합니다. 온프레미스 DGX 인프라는 안정적인 기반을 지원해 AI 워크로드를 지원하고, 추가 용량이 필요할 때마다 클라우드로 확장할 수 있는 기능을 제공합니다

이러한 하이브리드 클라우드 접근 방식은 개발자가 지속적으로 컴퓨팅 리소스를 사용할 수 있도록 지원하는 동시에 데이터 학습에 대한 기업의 비용을 최소화할 수 있습니다.

1201 블로그 2 중간

NVIDIA DGX와 구글 클라우드가 지원하는 강력한 AI 인프라

NVIDIA DGX와 구글 클라우드의 베어메탈 기반의 안토스(Antos)는 AI를 위한 AI 하이브리드 클라우드 환경을 제공합니다.

NVIDIA는 기업의 하이브리드 클라우드 인프라 도입을 가속화할 수 있도록 구글 클라우드에서 NVIDIA DGX A100 시스템을 지원합니다.

쿠버네티스를 사용해 클라우드 GPU 컴퓨팅 인스턴스와 온프레미스 DGX 인프라를 구축하는 고객의 경우 구글 클라우드의 안토스를 통해 IT 환경 전반에 걸쳐 일관된 개발 및 운영 환경을 구성해 오버헤드를 줄이고 개발자의 생산성을 향상시킬 수 있습니다.

또한 구글 클라우드에서 NVIDIA DGX 시스템을 온프레미스 인프라에 쉽게 추가하여 AI 워크로드를 처리하고 하이퍼바이저가 없이도 익숙한 방식으로 관리할 수 있습니다.

이외에 베어메탈 기반의 구글 클라우드 안토스는 가상 머신 없이도 IT 환경 전반에서 애플리케이션을 배포하고 관리하도록 지원해 효율적인 운영 환경을 제공합니다. GPU에 최적화된 하드웨어 환경 전반에서 애플리케이션 컨테이너를 관리할 수 있으며 애플리케이션 직접 액세스가 가능합니다.

구글 클라우드의 파트너 엔지니어링 담당자인 라이언 베룹호틀라(Rayn Veerubhotla)는 “베어메탈 기반 안토스는 고객이 애플리케이션과 워크로드를 실행하고 구동하는 방법에 유연성을 제공합니다”라고 말했습니다. NVIDIA의 지원으로 고객은 하이브리드 환경 전반에서 머신러닝 워크로드의 성능을 높이고 NVIDIA GPU Device Plugin을 통해 하드웨어를 원활하게 구동할 수 있습니다”라고 말했습니다.

또한 기업의 IT 팀은 NVIDIA NGC 컨테이너, 헬름(Helm) 차트 및 AI 모델에 액세스할 수 있습니다.

지금 온프레미스 DGX 인프라의 안전한 성능과 함께 구글 클라우드가 제공하는 유연하고 탄력적으로 리소스 활용 이점을 확인하세요.

구글 클라우드의 안토스에 대해 자세히 알아보기

NVIDIA DGX A100에 대해 자세히 알아보기