IBM 클라우드에서 만나는 새로운 엔비디아 GPU로 빠르고 효율적인 작업환경을 경험해보세요!

by NVIDIA Korea
출처: IBM, 코니 저우(Connie Zhou)

 

매일, 전 세계의 데이터 과학자들은 인공지능(AI)과 고성능컴퓨팅(HPC)를 이용해 복잡한 문제를 해결하고 데이터에서 새로운 비즈니스 가치를 창출하고 있습니다.

보다 나은 고객 서비스를 위한 챗봇 트레이닝이나, 신규 유전의 매장량 시뮬레이션 제작, 혹은 자율주행차량의 도로 규칙 학습들은 모두 데이터 집약적인 작업부하인데요. 이러한 데이터 집약형 작업부하는 빠르고 안전하며 비용효과적인 클라우드 인프라를 필요로 합니다.

IBM에서는 기업이 보유한 데이터에서 중요한 인사이트를 확보하고 해당 데이터를 통해 새로운 가치를 창출할 수 있도록, 클라우드와 기술사항 모두에서 새로운 AI 역량을 구현하는데 중점을 두고 있습니다. 특히 IBM은 엔비디아의 최신 GPU 기술인 엔비디아 테슬라 V100(NVIDIA Tesla V100)을 클라우드에 도입하기 위해 긴밀한 협력을 진행해왔는데요. 업계에서 가장 먼저 IBM 클라우드 베어메탈 서버(IBM Cloud bare metal servers) 및 버추얼 서버(virtual servers)를 통해 P100, K80 및 M60 등 다양한 GPU를 종합적으로 제공하고 있습니다. 또한 온프레미스(on-premise) 작업부하의 처리를 위해선 업계 유일의 CPU-to-GPU 엔비디아 NVLink 커넥션을 IBM의 최신 POWER9 서버를 통해 제공하고 있습니다.

이러한 서비스 역량을 토대로, IBM은 클라우드에서 업무 수행에 필수적인 AI, 딥 러닝 및 HPC 작업부하를 지원하기 위해 엔비디아 테슬라 V100 GPU를 도입하기로 했습니다.

1월 31일부터, IBM Cloud 베어메탈 서버마다 엔비디아의 최첨단   초고속   최신 GPU 아키텍처인 엔비디아 테슬라 V100 PCIe GPU 액셀러레이터를 최대 2개까지 장착할 수 있습니다. IBM의 고속 네트워크 연결 및 베어메탈 서버가 테슬라 V100 GPU와 결합해서 엔터프라이즈 고객이 필요로 하는 성능과 속도를 제공하게 됩니다. 다시 말해, 이전에는 몇 주에 걸쳐 컴퓨팅 리소스를 투입해야 했던 AI모델을, 단 몇 시간 만에 트레이닝할 수 있게 되는 것이지요.

성능과 빠른 공급은 AI 및 HPC 작업부하에서 매우 중요한 요소입니다. 엔비디아 테슬라 P100 GPU에 대한 IBM 베어메탈 서버 지원을 토대로, IBM은 IBM Cloud 버추얼 서버에서도 P100 GPU를 사용할 수 있도록 할 예정인데요. 이를 통해 AI 및 딥 러닝 작업부하를 위한 파워와 고성능에, IBM의 버추얼 서버의 확장성과 유연성까지 활용할 수 있습니다. 테슬라 P100 GPU 액셀러레이터를 통해, 이전 세대 대비 딥 러닝 역량은 최대 65% 끌어올릴 수 있으며 성능도 50배 가량 향상시킬 수 있습니다.

 

AI 및 HPC 작업부하에서는 성능과 처리 능력도 중요하지만 데이터보호 및 복원 능력 역시 반드시 고려해야 하는 요소입니다. 이러한 필수적인 작업부하를 지원하기 위해, IBM에서 제공하는 블록 및 파일 스토리지는 고객의 컴퓨팅 수명주기를 초과하는 복원성, 지속성 및 보안을 제공합니다.

새로운 IBM Cloud 서비스에서는 현존하는 최강의 GPU 기술을 거의 즉각적으로 이용할 수 있는데요. 기업 및 데이터 과학자는 물론, 미국항공우주국 프론티어 개발 연구실(NASA Frontier Development Lab) 및 SpectralMD 등 다양한 기관의 연구자들이 딥 러닝 모델을 트레이닝하고 혁신적인 클라우드 네이티브형 애플리케이션을 제작하여 복잡한 문제를 해결할 수 있습니다.

예를 들면, 지난 여름 미국항공우주국 프론티어 개발 연구실에서는 연구자 및 데이터 과학자들로 구성된 연구진이 IBM 클라우드에서 머신 러닝 기법을 이용해 레이더 데이터를 바탕으로 소행성의 새로운 3D 모델링 처리 과정을 개발했습니다. 매주 평균 35개의 소행성과 지구 근처의 물체들이 발견되면서, 지금까지 전문가들이 할 수 있는 것보다 더 많은 데이터가 확보되었는데요. 이는 기존의 3D 모델링 과정으로는 수 개월이 소요되는 일이었지요. 연구진은 IBM 클라우드 및 IBM 클라우드 오브젝트 스토리지(IBM Cloud Object Storage)의 엔비디아 P100 GPU를 이용해 종전의 처리 과정보다 평균 5-6배 빠른 속도로 소행성의 형태 이미지를 생성할 수 있었습니다.

임상연구용 의료장비 전문기업인 SpectralMD는 딥뷰(DeepView™) Wound Imaging System을 개발했는데요. 이는 만성적인 상처 및 화상을 입은 환자의 치료 개선을 목표로 딥 러닝 기법과 의료영상 기술을 하나로 결합한 시스템입니다. SpectralMD는 IBM 클라우드의 엔비디아 테슬라 P100 GPU를 이용해 대규모 의료영상 데이터 세트를 바탕으로 딥 러닝 모델을 트레이닝 및 테스트해서 임상의들이 최적의 상처 치료 방법을 결정할 수 있도록 지원하고 있습니다.

엔비디아의 이안 벅(Ian Buck) 가속 컴퓨팅 담당 부사장 겸 제너럴 매니저는 “신약 개발의 가속화, 자연스러운 대화가 가능한 가상 개인 비서의 개발 등 다양한 분야에서 데이터 과학자들은 클라우드 상의 엔비디아 GPU 컴퓨팅 플랫폼을 이용해 과거 난제로 간주되던 복잡한 문제들을 해결하고 있습니다. 엔비디아의 볼타(Volta) 기술을 기반으로 한 새로운 IBM 클라우드 서비스는 HPC 및 딥 러닝에서 필요로 하는 놀라운 처리 속도를 제공할 뿐만 아니라 필요에 따라 규모를 확장 또는 축소할 수 있는 기능을 제공합니다”라고 IBM Cloud와 엔비디아 GPU와의 만남에 대한 소감을 밝혔습니다.

IBM Cloud에서 만나는 엔비디아 GPU로 여러분의 다양한 개발이 이루어질 수 있기를 응원하고 기대합니다!

 

*본 포스팅의 영어 원문은 IBM 블로그에서 확인하실 수 있습니다