엔비디아 H100 텐서 코어 GPU 기반 새로운 마이크로소프트 애저 가상 머신 시리즈 출시

마이크로소프트 애저(Microsoft Azure) 사용자는 이제 최신 엔비디아 가속 컴퓨팅 기술을 사용하여 생성형 AI 애플리케이션을 훈련하고 배포할 수 있게 되었습니다.

마이크로소프트 애저 ND H100 v5 VM은 엔비디아 H100 텐서(Tensor) 코어 GPU와 엔비디아 퀀텀-2 인피니밴드(NVIDIA Quantum-2 InfiniBand) 네트워킹을 사용하여 브라우저에서 클릭 한 번으로 생성형 AI, 고성능 컴퓨팅(HPC), 그리고 기타 애플리케이션들을 확장할 수 있습니다.

현재 미국 전역의 고객들이 사용할 수 있는 이 새로운 인스턴스는 개발자와 연구자들이 새로운 소비자 및 비즈니스 활용 사례를 만들기 위해 대규모 언어 모델(LLM)과 가속 컴퓨팅을 사용하고 있는 가운데 출시되었는데요,

엔비디아 H100 GPU는 4세대 텐서 코어, LLM 가속화를 위한 새로운 트랜스포머 엔진, 초당 900GB의 속도로 GPU가 서로 통신할 수 있는 최신 NV링크 기술 등 아키텍처 혁신을 통해 슈퍼 컴퓨팅급 성능을 클라우드에서 제공한답니다.

3,200Gbps의 노드 간 대역폭을 제공하는 엔비디아 퀀텀-2 CX7 인피니밴드(NVIDIA Quantum-2 CX7 InfiniBand)가 포함되어 있어 전 세계 최고 성능의 슈퍼컴퓨터 성능에 걸맞게 대규모로 GPU 전반에 걸쳐 원활한 성능을 보장합니다.

v5 VM으로의 확장

ND H100 v5 VM은 점점 더 복잡해지는 LLM 및 컴퓨터 비전 모델을 위한 훈련과 추론 실행에 있어서 이상적입니다. 이러한 뉴럴 네트워크는 질문 답변, 코드 생성, 오디오, 비디오 및 이미지 생성, 음성 인식 등 가장 까다롭고 컴퓨팅 집약적인 생성형 AI 애플리케이션을 구동하게 됩니다.

ND H100 v5 VM은 추론을 위한 BLOOM 175B 모델과 같은 LLM에서 이전 세대 인스턴스 대비 최대 2배의 속도 향상을 달성하여 AI 애플리케이션을 더욱 최적화할 수 있는 잠재력을 입증했습니다.

엔비디아와 애저

마이크로소프트 애저의 엔비디아 H100 텐서 코어 GPU는 기업이 AI 훈련과 추론 워크로드를 강화할 수 있는 성능, 다용도성 및 확장성을 제공합니다. 이 조합은 애저에서 MLOps를 위한 머신 러닝과 통합된 엔비디아 AI 엔터프라이즈 소프트웨어 제품군을 통해 프로덕션 AI의 개발 및 배포를 간소화하고, 업계 표준의 MLPerf 벤치마크에서 놀라운 기록을 세운 AI 성능을제공한답니다.

또한, 엔비디아와 마이크로소프트는 엔비디아 옴니버스(NVIDIA Omniverse) 플랫폼을 애저에 연결함으로써 수억 명의 마이크로소프트 엔터프라이즈 사용자에게 강력한 산업 디지털화 및 AI 슈퍼컴퓨팅 리소스에 대한 액세스를 제공하고 있습니다.

엔비디아 H100 GPU로 구동되는 새로운 애저 v5 인스턴스에 대해 자세히 알고 싶다면 여기에서 확인하세요.