인공지능(AI) 딥 러닝, 머신 러닝, 고성능 컴퓨팅(HPC)을 위한 업계 최고 수준의 가속 서버 플랫폼인 엔비디아 HGX-2의 도입이 확대되고 있습니다.
단일 노드에서 2 페타플롭(Petaflop)의 컴퓨팅 성능을 제공하는 엔비디아 HGX-2는 CPU 전용 서버 대비 AI 머신 러닝 워크로드를 550배, AI 딥 러닝 워크로드를 300배, 그리고 HPC 워크로드를 160배 빨리 실행할 수 있습니다.
세계 선도적인 기업들이 엔비디아 HGX-2의 획기적인 성능을 활용하고 있는 가운데, GTC(GPU Technology Conference) 차이나에서 새롭게 발표된 주요 기업은 다음과 같습니다.
- 바이두(Baidu)와 텐센트(Tencent)는 조직 내부는 물론 클라우드 고객을 위한 광범위한 AI 서비스에 HGX-2를 사용하고 있습니다.
- 인스퍼(Inspur)는 중국 최초로 HGX-2 서버를 구축했습니다. 인스퍼의 AI 슈퍼 서버 AGX-5는 AI, 딥 러닝과 HPC의 성능 확장 문제를 해결하도록 설계됐습니다.
- 화웨이(Huawei), 레노버(Lenovo), 수곤(Sugon)은 엔비디아 HGX-2 클라우드 서버 플랫폼의 파트너가 됐다고 발표했습니다.
엔비디아 HGX-2은 폭스콘(Foxconn), 인벤텍(Inventec), QCT, 콴타(Quanta), 슈퍼마이크로(Supermicro), 위스턴(Wiston)과 위윈(Wiwynnn)을 비롯한 선도적인 글로벌 서버 제조업체로부터 지원, 제공되고 있습니다. 또한, 지난달 오라클(Oracle)은 베어메탈과 가상머신(VM) 인스턴스에서 엔비디아 HGX-2 플랫폼을 오라클 클라우드 인프라에 도입해 고객이 통합 HPC와 AI 컴퓨팅 아키텍처에 액세스 할 수 있도록 할 계획이라고 발표한 바 있습니다.
이안 벅(Ian Buck) 엔비디아 엑셀레이티드 컴퓨팅 담당 부사장 겸 총괄은 “업계 선도적인 기술 기업들은 역사상 가장 강력한 클라우드 노드인 HGX-2를 빠르게 채택해 활용하고 있다. HGX-2의 탁월한 컴퓨팅 성능과 유연한 설계를 통해 전 세계 기업들은 방대한 컴퓨팅 문제는 물론, 가장 시급한 몇몇 도전과제를 해결할 수 있는 새로운 제품과 서비스를 개발할 수 있다”고 설명했습니다.
엔비디아 HGX-2 클라우드 서버 플랫폼은 다중 정밀 컴퓨팅 기능을 갖추고 있어 미래의 컴퓨팅을 지원할 수 있는 고유한 유연성을 제공합니다. HPC에서 요구되는 고정밀 계산을 위해 FP64과 FP32를 사용할 수 있는 동시에, AI 학습과 추론을 위해서는 보다 빠른 반정밀도 연산(FP16)과 INT8을 사용할 수 있습니다.
엔비디아 HGX-2는 유례없는 컴퓨팅 성능을 제공합니다. 엔비디아 NV스위치(NVSwitch) 연결 패브릭을 통해 16개의 엔비디아 테슬라(Tesla) V100 텐서(Tensor) 코어 GPU를 연결해 2 페타플롭의 AI 성능을 제공하는 단일의 거대한 GPU로 작동합니다. 또한, 0.5TB의 메모리와 16TB/s의 전체 메모리 대역폭을 제공합니다.