클라우드 환경 전반에서 AI 혁신을 가속화하는 엔비디아와 오라클의 협력

AI가 시장을 놀랍도록 혁신적으로 바꿔놓고 있습니다. 곧 모든 기업이 AI를 전격 도입하고 날로 복잡해지는 머신 러닝 모델을 구동할 속도와 규모를 필요로 하게 될 텐데요.

전세계 기업을 위한 혁신에 속도를 내고 있는 오라클이 NVIDIA Tensor Core GPU를 적용한 베어메탈 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI) 인스턴스의 상용화(GA)를 발표했습니다.

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 새로운 인스턴스에 대한 오라클 라이브 행사에서 “오라클은 기업들이 데이터를 저장하는 곳입니다. 우리는 이 데이터를 아무런 마찰 없이 오라클 클라우드 인프라스트럭처로 가져와 실행할 수 있게 될 겁니다. 이 데이터들을 분석하고 머신 러닝에 사용될 데이터 프레임을 만들어 예측모델을 생성하는 방법을 학습시키는 것이죠. 이 예측 모델들은 기업이 더 빠르게 움직이고 더 스마트하게 판단하게 할 것”이라고 말했습니다.

젠슨 황 엔비디아 CEO와 클레이 마고요크 오라클 클라우드 인프라스트럭처 부사장이 엔터프라이즈의 AI 활용에 대해 오라클 라이브에서 이야기합니다.

오라클 데이터베이스에는 광범위한 산업에 걸친 수십만 기업들의 데이터가 저장되어 있습니다. 원시데이터(raw data)를 오라클 클라우드 인프라스트럭처에서 A100 인스턴스로 분석하면 새로운 사업 기회를 발견하고 고객 정서를 파악하며 제품을 구상할 수 있습니다.

새롭게 출시된 오라클 클라우드 인프라스트럭처 베어메탈 BM.GPU4.8 인스턴스는 40GB의 NVIDIA A100 GPU 8개를 제공하는데요, GPU 간 직접 통신을 가능하게 해주는 초고속 NVLink가 이들을 연결하고 있죠. 세계에서 가장 강력한 GPU인 A100을 적용한 오라클 클라우드 인프라스트럭처 인스턴스는 학습, 추론, 데이터 사이언스 전반에서 다양한 AI 워크로드를 실행하는 고객에게 최대 6배 향상된 성능을 지원합니다. 가장 까다로운 애플리케이션의 구동 시에는 NVIDIA Mellanox 네트워킹으로 스케일업을 진행해 단일 인스턴스에서 500개가 넘는 A100 GPU를 제공할 수 있습니다.

오라클 기업들의 AI와 HPC를 가속화하는 엔비디아

가속 컴퓨팅의 시작은 강력한 프로세서지만 소프트웨어, 라이브러리, 알고리즘 모두가 AI 생태계의 필수 요소입니다. 컴퓨터 그래픽, 유체역학 등의 시뮬레이션, 유전체 프로세싱, 딥 러닝, 데이터 애널리틱스를 비롯한 모든 분야에는 고유의 도메인별로 특화된 소프트웨어 스택이 필요하죠. 오라클은 NVIDIA NGC hub를 통해 엔비디아의 광범위한 도메인 특화 소프트웨어를 제공하고 있는데요, 여기에는 개별 클라우드와 GPU에 최적화된 컨테이너, 모델, 산업별 소프트웨어 개발자 키트가 포함됩니다.

클레이 마고요크(Clay Magouyrk) 오라클 클라우드 인프라스트럭처 부사장은 “머신 러닝에서 하드웨어만 중요한 게 아닙니다. 적절한 툴을 신속히 골라내 속도를 높이고 적합한 소프트웨어에 재빨리 액세스하는 능력 모두가 중요합니다. 오라클 인스턴스에는 모든 것이 사전 조정되어 있어 누구든 GPU를 시간당으로 대여하고 오라클 클라우드에서의 머신 러닝을 신속하게 시작할 수 있습니다”라고 설명합니다.

오라클은 또한 오라클 클라우드 인프라스트럭처 데이터 사이언스 플랫폼에도 A100을 추가하고 오라클 클라우드 마켓플레이스를 통해 NVIDIA Deep Neural Network 라이브러리를 제공합니다. 이를 활용해 데이터 사이언티스트들은 머신 러닝과 딥 러닝 프레임워크, 주피터(Jupyter) 노트북, 파이썬(Python) 등의 통합 개발 환경을 단 몇 분만에 구동할 수 있게 됩니다.

세계적인 AI 성능에 온디맨드 액세스 지원

새로운 오라클 인스턴스를 이용하면 클라우드 환경에서 세계 최고로 강력한 컴퓨팅에 액세스할 수 있습니다. A100은 3세대 텐서 코어가 지원하는 TF32 운영과 희소성(sparsity) 기술로 전 세대 대비 AI 최고 성능을 20배까지 향상시켰습니다. 세계 최대의 7나노 미터 프로세서를 갖춘 A100은 놀랍도록 유연하고 비용 대비 효율도 뛰어나죠.

A100과 Mellanox RDMA가 컨버지드 이더넷(Converged Ethernet) 네트워킹에서 보여주는 유연한 성능 덕분에 오라클 클라우드 인프라스트럭처의 인스턴스는 중요한 신약개발 연구, 대화형AI를 통한 고객서비스 개선, 제품의 보다 안전한 모델링과 구축에 이상적인 도구로 평가받습니다.

모든 워크로드와 기업을 위한 AI 가속화

NVIDIA Inception과 오라클 포 스타트업(Oracle for Startups) 액셀러레이터 프로그램을 통해 A100의 강력한 성능을 활용할 수 있습니다. 이 프로그램들은 또한 NVIDIA A100과 V100 GPU 인스턴스용 오라클 클라우드 크레딧, 특별가 혜택, 인적 네트워크와 전문성, 마케팅 기회 등을 제공합니다.

오라클이 곧 선보일 예정인 가상 머신 인스턴스는 머신 당 A100 GPU를 1개에서 2개, 또는 4개까지 지원합니다. 또한 최대 512개의 A100 GPU로 구성될 이종혼합형(heterogeneous) 클러스터 네트워크는 인텔 CPU와 혼합된 배어메탈 A100 GPU 인스턴스를 제공할 계획입니다. 오라클의 새로운 A100 인스턴스로 워크로드를 가속화하세요.

오라클 클라우드 인프라스트럭처에서 AI를 가속화하는 방법은 10월 5일에서 9일까지 개최된 GTC의 오라클 세션에서 자세히 확인할 수 있습니다.